Introduction

Face Recognition Task는 face image 를 입력으로 받아서 어떤 사람에 해당하는 이미지인지 구분하는 것이다. output 으로는 classification label이나 embedding vector를 내놓는다. (사람의 수가 매우 많거나, wild set 에 적용할 때는 classification label은 사용하지 않는 경우가 많다.) embedding vector 간의 cosine / L1 / L2 distance를 이용해서 face image간의 유사도를 구할 수 있고, 이 값을 기준으로 같은 사람이다 아니다를 구분할 수 있다. FaceNet, VGG-Face, ArcFace 등과 같은 우수한 성능을 보이는 모델들이 나왔다.

다만, 실제로 Face Recognition 을 적용할 때 핸드폰으로 사람 얼굴을 촬영하는 경우가 매우 많고, 이 경우 카메라 또는 사람의 움직임으로 인해 모델의 입력으로 들어가는 frame에 motion blur 가 있는 경우가 많다. 이 경우, face recognition model가 오작동하게 되는 원인이 될 수 있다.

따라서 이번 프로젝트에서는, face recognition model 이전 단계로써, blur 가 심한 image를 걸러내는 모델을 개발하고자 한다. 컴퓨터 비전에선 kernel을 이용해서 사용하는 blur 측정 방식이 주로 쓰이긴 하나, face recognition에 특화되어 face image에 대해 우수한 성능을 보이도록 하기 위함이다.

현재까지 이 주제로 연구된 바가 없으며, 따라서 다른 분야들의 연구들을 종합해서 새로운 해결책, 또는 모델을 만들고자 한다. 팀 편성 이후 현재 3주차까지는 관련 키워드들을 포함하고 있는 논문들을 찾아보며, 오픈소스를 테스트하거나, 여러 가설들을 세운 후에 검증하는 과정에 있다.


Project Plan

8주 정도로 계획하였음

1-2주 : 관련 논문 리서치

3-4주 : 리서치한 내용 바탕으로 baseline 실험

5-6주 : baseline 실험 결과 분석 및 추가 실험, 논문 리서치 꾸준히

7-8주 : 실험 마무리


Data