안녕하세요. 백지오입니다.
이번 주 X-REVIEW는 코엑스에서 진행된 KCCV 2023 학회 참관기를 남겨보도록 하겠습니다.
저는 이전부터 이러한 학회에 참석하는 것을 좋아해서, 개인적으로 pycon이나 GTC Korea와 같은 다양한 학회에 참석했었는데요. 솔직히 말하자면 이러한 학회에 가서 내용이 이해가 되어서 간 것은 아니고, 단순히 학회를 통해 기술의 트랜드를 느끼고, 학회장의 학술적인 분위기를 즐기고, 성장을 위한 자극을 얻는 기회 삼겠다는 명목 하에 재미로 많이 참석했던 것 같습니다.
한편, 이번 KCCV 2023은 코로나로 인해 아주 오랜만에 방문하는 오프라인 학회이기도 하고, 제가 지난 7개월 간 나름 각잡고 컴퓨터 비전을 공부한 후에 방문하는 학회라 기대와 각오가 남달랐는데요. 확실히 아는만큼 보인다고, 제가 방문한 학회 중 가장 많은 배움과 자극을 얻어올 수 있었던 좋은 기회가 되었던 것 같습니다.
KCCV에서 흥미롭게 본 논문들은 제 블로그에 간단히 정리해두어서, 차후 X-REVIEW나 개인적인 시간에 틈틈이 읽어볼 계획인데요. 관심이 있으신 분들은 블로그를 참고해주시면 감사하겠습니다. 이번 글에서는 KCCV 2023에서 느낀 학부 연구생 관점의 감상이나 배운 점에 대하여 집중해 다뤄보고자 합니다.
Oral Session
KCCV는 유명 국제 학술 대회에 논문을 제출한 팀들의 발표로 구성되어 있는데요. 그중에도 논문의 저자이신 교수님들이 직접 PPT를 통해 발표를 해주시는 oral 세션과 논문 저자들이 포스터를 옆에 두고 질의응답을 진행하시는 포스터 세션이 있었습니다.
Oral Session들을 들으며 전체적으로 느낀 감상은 당연하다면 당연하지만 교수님들의 발표가 너무나 깔끔하다는 것이었습니다. 아시다시피 컴퓨터 비전 분야가 넓다 보니 제가 잘 모르거나 관심이 없는 분야의 발표가 많기 마련인데, 그럼에도 불구하고 논문이 다루는 문제와 문제 정의 과정이 물 흐르듯 자연스럽게 흘러가, 적어도 논문이 다루는 문제와 큰 컨셉은 대체로 어렵지 않게 이해할 수 있었습니다.
최근 논문을 읽으며 논문의 방법론 만큼이나 논문이 제기하는 문제와 그 해결 방법에 대한 설득력이 중요하다고 느끼는데, 논문에서는 이를 매끄러운 글과 실험이라는 증거로 달성한다면, 발표는 발표자의 능력과 깔끔한 발표 자료로 달성한다는 것을 새삼 느낄 수 있었습니다.
저도 최근 발표 자료를 만들고 발표를 준비하는 task를 수행하기도 했고 부끄럽지만 제 강점 중 하나가 발표라 생각하였는데, 역시 세상은 넓고 고수는 많고 나는 고수가 (아직) 아님을 다시 느끼는 시간이었습니다. 😂
Doctoral Colloquium
이 세션은 이제 막 박사 학위를 받으셨거나, 곧 받으실 예정인 fresh doctor 분들이 본인의 연구 분야를 소개하는 발표를 진행하는 세션입니다. 선배 분들은 어떤 과정을 거쳐 박사까지 연구를 진행하였는지 궁굼하기도 하고, Video 관련 논문에서 자주 등장하시는 연세대 이필현 박사님이 발표를 진행하셔서 기대하였는데 역시 좋은 세션이었습니다.
각자 연구 분야가 다른 박사님들이 석사 시절부터 연구를 어떤 방향으로 발전시켜나갔는지, 박사 과정의 끝에서 어떤 연구를 수행하였는지 소개를 들으며, 제 학위 과정은 어떻게 될지, 어떻게 되면 좋을지 상상해 볼 수 있었던 것 같습니다.
계획대로만 흘러가지는 않는 것이 인생이겠지만, 그럼에도 해내야겠다는 동기 부여가 많이 되는 세션이었던 것 같습니다.
Poster Session
대학교 1학년 때, 서울대에서 진행하는 행사에 갔다가 복도에서 우연히 서울대 AI 연구진의 포스터 발표를 보게 된 적이 있었습니다. 애초에 포스터 발표라는 포맷 자체를 처음 봐서 멀뚱멀뚱 보고 있으니 연구원 분이 오셔서 가볍게 설명을 해주셨는데, 전혀 이해가 안 되어서 그저 웃었던 기억이 납니다. 그때 연구원 분이 열심히 공부하면 언젠가 이해가 될 거라 하셨는데, 이제 포스터가 이해가 좀 되어서 감회가 새로웠습니다.
포스터 발표는 동시에 20여 편이 진행될 수 있는 만큼 정말 다양한 분야의 논문이 소개되었는데요. 저는 먼저 관심있는 분야의 포스터를 미리 찾아 한 바퀴 돌아본 후, 남는 시간에 다른 포스터들도 방문하는 방식으로 관람(?) 했습니다.
새로운 논문들을 짧은 시간에 여럿 접할 수 있었을 뿐 아니라, 이해가 잘 안되거나 궁굼한 점을 바로바로 저자님에게 한국어로 질문할 수 있다는 것이 정말 좋은 기회였습니다. 제가 질문을 하기도 하였지만, 옆에서 같이 포스터를 보시던 다른 분들의 질의응답도 지켜보며 새로운 시각을 가질 수도 있었고, 돌아보니 정말 좋은 기회였던 것 같습니다.
다만 약간 아쉬운 점은, 포스터에서 발표될 논문 몇 편을 아예 미리 읽어갔으면 좋았겠다는 생각이 들어 다음에도 기회가 있다면 그리 해볼 계획입니다.
Invited Talk
초청 연사는 컴퓨터 비전 분야의 유명 연구자 분들을 모셔 진행되었는데요. 저에게는 2일차에 발표하신 CLIP 논문의 2저자, 김종욱 박사님의 강연이 깊게 와닿았습니다. 김종욱 박사님은 학생 시절 crepe(인용 297회), OpenAI에서 CLIP, Whisper 같은 굵직한 모델들의 개발에 참여하신 화려한 커리어를 가지신 분인데요. 도대체 이런 분들은 어떻게 매번 감탄이 나오도록 새롭고 신기한 모델을 만들어내는가 궁굼했는데, 이에 대한 해답을 아주 살짝이나마 엿볼 수 있었습니다.
김종욱 박사님 연사의 제목은 Beyond the standard benchmarks 였는데요. 발표의 내용을 요약하자면, benchmark dataset의 성능을 올리는 것 보다도, 여기서 알 수 없는 일반화된 상황에서의 robustness를 끊임없이 고려하라는 내용이었습니다. 어찌보면 좀 당연한 이야기고, 이상론적인 이야기라고도 할 수 있겠습니다만, 그렇게 치부하기에는 저 스스로 robustness를 1 이라도 고려하고 있었는가 의문이 들었습니다.
현실적으로 달성해야 할 연구 목표가 있고, 제가 항상 general하게 잘 동작하는 모델만 만들 수 있는 거장도 아니지만, 그럼에도 거장처럼 생각하려고 노력해야겠다는 소소한 다짐을 하게 되었습니다.
Industry Session
학회마다 꼭 있는 업계 세션은 정말 재밌거나, 정말 재미없거나인 것 같습니다. 이번 KCCV에서도 재밌는 발표가 몇 개 있었는데, 그 중에도 Lunit의 발표가 상당히 인상깊었습니다. Lunit은 컴퓨터 비전 기술을 통해 암 진단을 자동화, 정밀화하는 스타트업으로 AI 기반 스타트업 중 상당히 오래, 잘 되고 있어 인지도가 높은 기업인데요. 발표 전반에서 회사의 mission인 “기술을 통한 암 생존률 증가에 기여”를 강조하며 회사의 연구 개발 실적과 사례를 소개하였습니다.
분명히 회사 홍보인데도 발표자 분의 연구에 대한 확고한 열정과 mission에 대한 확신이 느껴져, 정말 멋진 회사구나 싶었습니다. 저도 먼 미래에 창업을 하게 된다면, 저런 회사를 만들고 싶다는 생각이 들더라구요.
정리하며
KCCV 2023을 통해 제가 얻은 것들을 정리하자면 크게 3가지로 나눌 수 있을 것 같습니다.
- 제 연구 분야의 최신 논문들에 대한 정보 획득
- Computer Vision 전체적인 연구 동향 포착
- 선배 연구자들의 발표를 보며 동기 부여
먼저, 저희 팀에서 진행 중인 Video 관련 연구들과 제가 접목하고자 하는 Multi-modal 연구들의 최신 논문들을 가까이서 접하고, 한국어로 설명까지 들을 수 있어 좋은 정보를 얻을 수 있었습니다. 앞으로 이 논문들에서 시작하여 multi-modal 연구를 빠르게 follow up 해볼 계획입니다. 두 번째로 Computer Vision 분야의 전체적인 연구 동향을 포착할 수 있었는데요. 이건 사실 제 개인적인 감상이라 정확하지는 않지만… 이번 KCCV에서 보기에 채용 부스나 기업 세션에서는 NeRF와 같은 3D 기술, 항상 인기 있었던 Detection이나 Segmentation과 같은 기술들을 많이 접할 수 있었던 것 같습니다. 한편 최신 연구들에서는 CLIP을 위시한 multi-modal 방법이 상당히 많이 보였고, Generation 연구도 활발하게 진행되고 있었습니다. 또한, Unsupervised Learning, Contrastive Learning 키워드 역시 많았던 것 같네요. 마지막으로, 앞에서 여러 번 강조했지만 역시 너무 즐겁고 동기 부여되는 학회였던 것 같습니다. 연구실에서 공부하다 보면 사실 다른 논문 저자들은 일종의 경쟁자나 인터넷 친구(?)와 같이 느껴지고 약간 공허하다는 생각이 들 때가 있었는데, Computer Vision을 연구하는 사람들, 선배들을 많이 만나고 오니 상당히 즐겁고 의미 있는 시간이었던 것 같습니다.
마지막으로 좋은 기회를 제공해주신 Sejong RCV LAB과 최유경 교수님께 감사드리며 리뷰 마치겠습니다.
감사합니다.