논문 리뷰 13

[논문 리뷰] Joint 3D Face Reconstruction and Dense Alignment with Position Map Regression Network

논문 링크 / 공식 코드 2018년 ECCV 2018에서 발표된 논문입니다. 3년전에 발표된 논문이지만 여전히 여러 데이터셋에서 아래와 같은 좋은 성능을 보여주고 있습니다. 논문의 핵심 내용에 대해서 간략히 리뷰해보도록 하겠습니다. 논문의 핵심 컨트리뷰션은 다음과 같습니다. end-to-end 방법으로 두 가지 문제인 face alignment와 3D face reconstruction을 함께 해결합니다. 직접적인 3D facial structure 예측을 위해 UV position map이라는 새로운 표현을 만들었습니다. 모델 훈련시 position map의 각 point에 다른 weight를 부여하는 weight mask를 사용하여 모델의 성능을 향상시켰습니다. 최종적으로 100FPS의 속도로 2D ..

논문 리뷰 2021.06.17

[논문 리뷰] MnasNet: Platform-Aware Neural Architecture Search for Mobile

오늘 리뷰할 논문은 "MnasNet: Platform-Aware Neural Architecture Search for Mobile"로 구글 브레인에서 CVPR 2019에서 발표한 논문입니다. 이전에 포스팅한 EfficientNet V2에서 NAS를 활용해서 초기 모델을 얻었다고 하는데 그때 MnasNet을 사용했다고 해서 한번 짚고 넘어가고자 이렇게 포스팅을 남깁니다. (구글에서 공개한 official한 코드도 있기 때문에 추후에 직접 사용해보며 코드 리뷰 또한 해볼 예정입니다.) 아래 전체적인 오버뷰를 보면 알 수 있듯이 최적의 모델을 찾기 위해 모델의 accuracy뿐만 아니라 모바일 기기에서 직접 계산되는 latency까지 함께 고려하는 것을 확인 할 수 있습니다. 즉, 모델은 accuracy와 ..

논문 리뷰 2021.05.19

[논문 리뷰] EfficientNetV2: Smaller Models and Faster Training

약 2년 전 공개했었던 EfficientNet은 다른 모델들에 비해 빠른 학습 속도와 좋은 성능으로 Image classification 분야에서 활발하게 활용되었습니다. 그리고 최근 구글에서 기존의 EfficientNet과 비교해서 학습 속도와 정확도를 더욱 개선한 EfficientNet V2를 발표했습니다. 기존의 모델에 비해서 빠른 학습 속도를 보여준다고 하는데 해당 논문의 핵심 부분만 간략하게 정리해보도록 하겠습니다. EfficientNet ? 네트워크의 파라미터 수를 감소시키면 모델이 작아지고 그에 따라서 메모리에 쉽게 올릴 수 있는 등 다양한 이점이 있습니다. 하지만 파라미터 수를 감소시키면 모델의 성능 또한 감소한다는 문제점이 발생합니다. 그렇기 때문에 성능 감소 없이 파라미터 수를 최소화하..

논문 리뷰 2021.05.16 (1)

[논문 리뷰] Large Pose 3D Face Reconstruction from a Single Image via Direct Volumetric CNN Regression

논문 링크 2017년에 ICCV에서 발표된 논문입니다. 현재 Paper with code의 3D Face Reconstruction 부문에서 Github 스타 수가 가장 높으며 3D Face Reconstruction (Florence dataset) 벤치마크에서 3등에 위치하고 있습니다. 작성된지 4년이나 지났지만 3D Face Reconstruction에 대한 많은 인사이트를 얻을 수 있을거 같아 자세히 읽고 핵심 내용에 대해서 정리해보도록 하겠습니다. [1] Introduction 해당 논문은 이전의 컴퓨터 비전에서 3D Face Reconstruction을 수행할 때 고려해야 했던 얼굴 포즈, 표정, 조명 등의 다양한 문제들을 간단한 CNN 모델을 학습시킴으로써 해결하는데 초점을 맞춘 것 같습니다..

논문 리뷰 2021.05.01

[논문 리뷰] How far are we from solving the 2D & 3D Face Alignment problem?

paper / code Face Alignment란, 이미지상의 사람의 얼굴에서 특징(feature)을 추출하는 기술을 뜻 합니다. 수 많은 사진들을 대상으로 그림 1과 같이 정확한 얼굴의 정면 데이터를 얻기 위해서는 크게 다음 3가지 단계가 필요합니다. 1. 이미지에서 얼굴 영역을 찾는 Face Detection (얼굴 검출) 2. 찾은 얼굴에서 눈, 코, 입 등의 특징을 찾는 Face Alignment (얼굴 정렬) 3. 특징점을 이용해 얼굴 영역을 동일한 형태와 크기로 변경하는 Normalization (정규화) 소개 본 논문은 위 단계 중 2단계인 Face Alignment에 대한 논문입니다. 저자는 deep learning을 활용한 2D face alignment 모델을 제안하고 성능을 평가하여..

논문 리뷰 2021.03.30

[논문 리뷰] EfficientNet: Rethinking Model Scaling For Convolutional Neural Networks

이번 포스팅에서는 2019년에 발표되어 현재까지 Image Classification Task에 최고의 성능을 보여주고 있는 EfficientNet이라는 모델 구조에 대해서 간략하게 리뷰하겠습니다. AlexNet의 등장 이후 Image Classification 분야에서 모델의 성능을 향상시키기 위해 CNN 모델 구조들의 몸집(?)을 키우는 방향의 시도가 지속적으로 이루어져 왔습니다. 이러한 시도들에 의해 꾸준히 모델 성능이 성장하였고, 특히 ResNet은 100개가 넘는 깊이의 구조를 사용함으로써 기존 CNN의 성능을 비약적으로 향상시키는 대표적인 모델로 알려졌습니다. 여기서 우리는 두 가지를 고민 해볼 수 있습니다. 첫째, 과연 모델의 몸집을 키우는 방식으로 CNN의 성능을 얼마나 향상시킬 수 있는가..

논문 리뷰 2021.01.04

[논문 리뷰] Adversarial Examples Are Not Bugs, They Are Features

paper - Adversarial Examples Are Not Bugs, They Are Features 2019년도 NIPS에서 발표된 논문으로 Adversarial Examples이 만들어지는 현상의 이유에 대해서 새로운 관점으로 해석한 논문입니다. AI 보안 이슈에서 아주 중요한 분야이기 때문에 모든 AI 연구자들에게 도움이 되는 논문이라고 생각합니다. Adversarial Example이란, 아래 보이는 왼쪽의 돼지 이미지에 아주 작은 노이즈를 더하여 오른쪽의 돼지 이미지를 만드는 것을 의미합니다. 사람의 눈으로 볼 때는 아무런 변화가 없지만, 분류 모델의 입장에서 두 이미지는 "pig"와 "airliner"로 완전히 다른 이미지로 인식됩니다. 따라서 이러한 문제는 앞서 말했듯이 AI 보안에서..

논문 리뷰 2020.05.31

[논문 리뷰] Feature Denoising for Improving Adversarial Robustness

Paper - Feature Denoising for Improving Adversarial Robustness Facebook AI Research에서 작성한 2019년도 논문입니다. 논문에서는 Adversarial Robustness를 높이는 방법으로 Feature Denoising 기법 적용을 제안하고 여러가지 실험 결과를 공유합니다. 보통 Adversarial Example 이미지는 Pixel 레벨에서 볼 때 사람의 눈으로 구분이 거의 불가능한 수준입니다. 따라서 Pixel을 이용해서는 판단이 안되는데 그렇다면 과연 Feature 레벨에서는 어떤 다른점이 있을까?라는 생각으로 Adversarial Example의 Feature map을 확인했더니 아래 그림과 같이 차이점이 눈에 뛰게 드러나는 것을..

논문 리뷰 2020.03.27

[Paper] MobileNetV2: Inverted Residuals and Linear Bottlenecks

Paper Link : https://arxiv.org/abs/1801.04381 MobileNetV2: Inverted Residuals and Linear Bottlenecks In this paper we describe a new mobile architecture, MobileNetV2, that improves the state of the art performance of mobile models on multiple tasks and benchmarks as well as across a spectrum of different model sizes. We also describe efficient ways of app arxiv.org 구글에서 발표한 모바일 디바이스에 특화된 네트워크인 M..

논문 리뷰 2019.08.08 (1)

[Paper] Improving Robustness Without Sacrificing Accuracy with Patch Gaussian Augmentation

Contributions of this paper Characterize a trade-off between robustness and accuracy among two standard data augmentations: Cutout and Gaussian Devise a simple data augmentation method (Patch Gaussian) that enables interpolation between the two augmentations above Find that Patch Gaussian allows us to overcome the observed trade-off, and achieves a new state of the art in the Common Corruptions ..

논문 리뷰 2019.08.06 (1)