[단상] From Local Feature to Deep Feature

혹자에게는 논문 제목으로 보이는 제목이
필자에게는 연구 인생을 담은 글 귀에 해당된다.

RCVSS2016에서 필자가 만든 슬라이드 제목이었고, 그 뒤로 사람들 사이에서 회자되었다.

ETRI 위탁 연구 제안서를 마무리해서일까! 오늘따라 무척 머리 속에 멤도는 저 글 귀를 통해 필자 연구 인생 대 방출(?)을 해보도록 하겠다.

필자가 지역 불변 특징량(Local Invariant Feature)이란 것을 처음 들어 본 시기는 2006년 여름.. 필자가 속해 있었던 KIST 인지로봇 연구단 내 비전팀은 CMU대학과 공동연구를 통해 SIFT에 버금가는 기술을 만들겠다는 커다란 포부를 가지고 있었다. 그렇다. 15년전만 해도 대한민국은 컴퓨터비전분야 후진국이었고, 한국은 그렇게 기술 선진국의 도움을 받으며 성장하고 있었다. (기회가 되면 2000년대 초반 한국의 비전기술력과 지금의 기술력을 정량적으로 평가해 보겠다.)

2010년 박사학위를 본격적으로 시작하면서 필자에게 떨어진 정부R&D과제는 한국형SIFT 를 만들어 로열티 이슈로 힘들어하는 중소기업들의 어려움을 해결해주자라는 대형 과제였다. (당대 최고의 기술 SIFT는 높은 로열티를 내고 사용해야만 했다. 이 모든게 David Lowe 교수님 때문이었군..) 지금 돌이켜 생각해보면 해당과제는 대학원생에게 참 좋은 과제였다. 과제의 목표는 좋은 지역불변특징량 만들어 1) 논문 내고 2) 코드 정리 잘해서 기업에 넘겨주면 되는 과제 였기 때문이다. 그!러!나! 문제는 SIFT 한번 코딩해 본적 없는 박사1년차(필자)와 박사3년차 학생 두명이서 해당 과제를 위해 어느 누구의 도움도 없이 온맘/온몸 다해 피투성이가 되어가며 과제를 막고 있었다는 것이다. (과제를 막다 == 수단과 방법을 가리지 않고 결과물을 도출하여 평가결과가 실패로 기록되지 않도록 하는 것)

항상 결과가 좋을 수는 없다지만, 그렇게 3할 타자의 꿈은 목말라 갔다.

끝날 것 같지 않던 과제의 끝(2013년 9월 30일)은 찾아왔고, 필자를 포함 함께한 박선배는 하얗게 불태운 기억만 남아있다. 참 많은 도전을 했었다. ECCV2012, CVPR2012, CVPR2013, ECCV2014… 하지만 아쉽게도 우리의 결과는 컴퓨터비전 Top-tier 학술대회에 제출되지 못했다. (참고로 2010년 초반은 한국에서 CVPR 페이퍼가 매년 5개 내외로 Accepted 되던 시절이다. 그리고 그 중 다수가 해외 인턴십을 통해 제출된 것들이 다수였다.) 해당 연구 결과는 ACCV2014 에 제출하는 것으로 마무리 되었지만 정말 최선을 다했고 여한은 없다.

딥러닝 낀세대.. 들어나 봤쑤?

자.. 해당 과제가 성공적으로 끝날 수 없었던 이유는 무엇일까? 필자의 역량부족이 가장 큰 문제인건 분명했다. 그러나 참 아이러니하게도 해당 토픽의 인기가 독자(리뷰어를 포함한 연구자들)들에게 없었던 것은 필자의 잘못만은 아니었다. 그렇다!😂 여러분 모두가 알고 있는 바로 그 딥러닝기술이 문제였다. 2012년부터 지구를 뜨겁게 달구기 시작한 인공신경망기술.. 이미지넷 대회에서 인간의 인식 능력보다 머신의 인식 능력이 뛰어남을 증명한 바로 그 대회! 대다수 연구자들의 관심과 시선이 점점 딥러닝으로 옮겨가면서 평소에도 참 마이너했던 지역불변특징량연구 주제는 더더욱 설 곳을 잃어가고 있었다. 필자 박사과정을 올인한 연구가… 역사 속으로 사라질 위기에 놓였으며, 필자의 박사학위와 장미빛 미래를 책임져야할 연구 결과는… 어느사이 잿빛으로 변해 있었다.

그!렇!다! 박사 학위 시작은 지역불변특징량과 함께 했으나, 학위가 끝나갈 무렵 딥러닝이라는 호환마마가 나타나 졸업하지 못하는 안타까운 비운의 세대를 우리는 “낀세대”라고 불렀다. 뭐 어찌하오리까… 😭 (초탈) 그렇게 필자는 딥러닝과 손잡고 또 한번의 박사학위를 시작했다.

영상 추출 과제… 다시 한번 필자 곁으로….

머신을 위한 비디오 코덱 (Video Codec for Machine)

이번 ETRI에서 발주한 “머신을 위한 비디오 코덱”의 머신비전 임무별 영상 추출 모델 설계 과제는 우연이라고 하기엔 참으로 묘하면서도, 어찌보면 필자 곁으로 올 수 밖에 없는 과제임이 분명하다. (즉, 대한민국 내에서 주인을 제대로 찾아 온 것은 맞다.)
과제명의 연구 목표는 거창하지만, 결국 한줄 요약하면 다음과 같다.

“딥러닝 피쳐기반 영상 정합용 기술자를 만들어 표준화 하자.

우리팀은 표준화를 담당하지 않는다.

Local Feature 연구 10년차여서 일까! 이번 에트리 과제는 감회가 남다르다. 아무튼, 제안서는 제출되었고, 큰 이변이 없는 한 4월 16일부터 세종RCV 연구실은 7.5개월 동안 해당 과제를 수행하게 된다. (참, 해당과제는 총 6년짜리 정부R&D과제라고 한다.) 필자 자신에게 하고 싶은 말이다. 건투를 빈다. ✌️

Author: 최 유경

Computer Vision, Machine Learning

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 항목은 *(으)로 표시합니다