안녕하세요 세종대학교 RCV 연구실의 박사과정 황유진입니다.
감사하게도 2024 6월 17일 – 6월 24일 동안 CVPR 2024에 참석하게 되어, 참관기를 남깁니다.
부족하지만 본 글이 다른 학생분에게도 도움이 되기를 바랍니다.
#1: 꾸준하게 관심도가 성장하고 있는 학회 현황
이미 모두가 아는 사실이지만 Reviewers 수를 공유하는 빽뺵한 장표(b)가 다시 공표하듯이 CVPR에 대한 관심도가 매우 매우 높아지고 있다. 제출된 논문의 수도 2023년의 9,155편 대비 11,532편으로 26% 증가했다. 제출된 논문 수는 크게 증가한 반면, 게재된 논문 수는 2023년 2,359편(게재 비율 25.8%) → 2024년 2,719 (게재 비율 23.6%)로 게재 비율을 유지했다. 작년 대비 자세한 게재 논문의 수치 정보는 프로그램 가이드의 Message from the General and Program Chairs(3페이지)에서 확인할 수 있다.
#2: 트랜드 변화는 2023년도 기조를 다수 유지
사실 학회의 트렌드에 대해 집중하지 않았었던 것 같다. 관심 있는 분야의 키워드로 accept list에서 검색해서 찾아보기만 했는데, 학회에서는 매년 제출된 논문의 주요 토픽을 공개했던 것 같다. 우선 영상 생성/합성 연구가 학회에 제출된 논문의 다수를 이룬다는 것이 눈에 띈다. 2020년과 대비해 텍스트 모달리티에 대한 통합(ex.CILP)이 꽤 크게 작용했다고 생각한다. 또한 3D 분야가 2020년 대비 많이 성숙한 것 같다. 실제로 3D 연구가 포스터장에서도 많이 눈에 띄었는데, 수치로도 확인할 수 있었다. Multi-modal learning 연구의 관심도는 꾸준하게 성장 중인 듯 하다. 또한 학회장의 분위기를 통해 느끼기로 앞으로 성장세는 더욱 뚜렷해질 것으로 예측된다.
#3: 의료분야에 비전기술 활용을 기대
대가들의 통찰력을 이해하기에는 어려웠으나, 개인적으로 느낀점을 정리하면 다음과 같다. 컴퓨터 비전 분야는 LLM이 연 포문을 통해 사회적으로 기여하는 연구를 할 차례 혹은, 할 수 있는 순서임을 기대하고 있다. 그리고 그 사회적 기여를 내보일 수 있는 분야 중 대표적 상징이 의료분야였던 것 같다. 물론 내가 관심을 두지 않았던 이유일 수 있겠으나, 이번 CVPR에서는 헬스케어라는 단어가 패널토크 뿐 만 아니라 포스터 장과 워크숍에서도 꽤 보인 것 같았다. (물론 이미지의 패널 토크는 의료 분야 뿐 만 아니라 다양한 AI의 영향 범위를 다루었다. 방적/방직 기술이 미래: 저렴한 옷감 제공/위험성:실업률 증가를 고려해야 하듯 AI 기술이 미래:헬스케어/교육/활용방안 위험성:디지털자료의 신뢰성 다양한 사회 구조/인원에게 기술의 진입/영향력 정도를 고려해야 하며, 논의되고 있음을 알 수 있었다) 이러한 흐름에 따라 딥러닝 기술의 제어가능성/안정성/설명가능성 등은 LLM의 등장 여부와 관계없이 꾸준히 중요한 분야로 남지 않을까 싶다.
# 4: Continual learning
Active Learning 에 대해 알아가면서 자연스럽게 관심을 갖게 된 Continual Learning 튜토리얼에 참여했다. 해당 튜토리얼 외에도 흥미가 가는 주제가 많았기에 고민했다. 데이터 기반의 학습으로 대부분의 일반화 성능이 필요한 문제를 꽤 잘 해결하기에, Specific한 정보 학습에서 발생하는 forgetting 문제 등을 다루는 continual learning 문제도 다수 해결되었다는 생각 때문이다. 다행히도 이런 걱정은 나만의 걱정은 아니였다. 연사의 강연 이후 질문에서 종종 등장했던 “LLM의 등장에 대해 어떻게 생각하느냐”(더욱 구체적이고 좋은 질문이였으나, LLM 관련 지식이 짧아 완벽히 이해하지 못한 점을 사과드립니다)는 질문은 가려운 속을 시원하게 긁어줬다. 우선 연사들의 입장은 1) LLM은 아직 모든 문제를 풀기에 완벽한 기술이 아니다 2) 해당 기술이 성숙되더라도 Continual Learning은 여전히 필요하다. 대용량 모델을 끊임없이 업데이트 하는 것은 어렵기 때문이다.로 축약할 수 있을 것 같다. 또한 첫번째 연사분이 특히 기억에 남는데, 이후에 등장할 매체인 엣지 디바이스/개인화 기기를 위해서는 continual learning이 더욱 필요할 것으로 전망하며 관련 연구를 소개했다. LLM의 소문으로 어림짐작했던 continual learning 전망에 대한 고민이 식견이 부족한 내 탓 이였음을 느꼈다(매체의 발전, 기술의 발전 방향 등 다방면으로 해당 연구의 미래에 대해 고민하신 것 같았다). 해당 워크숍장에는 약 40분 가량 일찍 도착해 거의 마지막 발표까지 참여했는데, 전반적으로 분위기가 매우 좋았다. 세션 준비 전에 연사들이 일찍 온 참여자들과 농담도 많이 주고받았는데 전체적으로 continual learning에 대해 많은 관심을 갖던 사람들이 모인 것 같아, 그 자연스러움이 부럽기도 하고 신기했다. 그 외에 (나에게는) 새로운 키워드였던 unlearning 등의 용어가 해당 워크숍에서 자연스럽게 사용되고 있었다. 기억해두었다가 이러한 키워드에 대해서도 차차 알아볼 계획이다.
# 5: Explainable AI
사실은 이해가 어려웠던 Intervenability
한창 석사 1학년 때, XAI 공부를 위해 해당 자료를 공부하려고 했던 기억이 난다. (물론 공부하지 못했지만) 그 이후로 Explainable AI에 대해 사실상 관심을 두지 못했는데, 해당 단어가 내가 알던 의미와 다르게 사용됨을 이제야 알았다. 학회에서 느끼기에 대부분의 XAI가 LLM을 활용한 VQA(Visual Question Answering)와 분야와 관련된 의미로 사용되는 것 같았다. 동작에 대한 Human-Level 이해랄까.. 내가 기존에 받아들이고 있었던 XAI의 의미는 Intervenability(개입가능성)에 더욱 가깝게 사용되는 것 같다. Intervenability 관련 튜토리얼도 들었는데, 이해가 어려워 해당 리뷰에서는 다루지 못했다. 추가로 공부하여 이후 세미나 등을 통해서 다루어볼 예정이다.
# 6: 그 외
(1) 몰리는 곳은 따로 있기도 하다. (1) 몰리는 곳은 따로 있기도 하다. (1) 몰리는 곳은 따로 있기도 하다. (2) 내가 보려했던 포스터가 없기도 하다. (3) 포스터 세션에서 낯익은 발음이 들리기도 한다. (3) 포스터 세션에서 낯익은 발음이 들리기도 한다. (3) 포스터 세션에서 낯익은 발음이 들리기도 한다.
(1) 몰리는 곳은 따로 있기도 하다. 마지막 날에 세션장을 잘못들어갔다. 10분정도 일찍 들어갔는데 사람이 없어서, 우리가 좀 부지런했구나! 생각했는데, 세션이 시작한 직후에 잘못된 발표장(Hall C)에 있던것을 알고 원래 가려했던 바로 옆 세션장(Hall B)으로 이동했다. 그러나 가려했던 세션장(Hall B)은 사람이 이미 가득 차 세션을 서서 들어야 했다. 옆 세션장(Hall C)은 아직 앉아있는 사람이 드물었는데… 사람이 몰렸던 세션장은 image generation/대형 모델 관련 연구였고, 해당 분야가 확실히 CVPR의 메인 주제라고 생각하게 되는 경험이였다.
(2) 내가 보려 했던 포스터가 없기도 하다. 포스터를 보기 전날 혹은 아침에 보고 싶은 연구를 표시해 놓았는데, 신기하게도 표시했던 포스터에만 사람이 없거나 포스터가 없었다. 시간이 꽤 충분하니 한 바퀴를 둘러보았는데, 보려 했던 포스터만 보는 것보다 전반적으로 제목을 읽어보는 것도 도움이 될 듯 하다.
(3) 포스터 세션에서 낯익은 발음이 들리기도 한다. 한국인 연구자의 포스터에 가면, 한국어로 논문을 소개하는 연구자들을 꽤 볼 수 있었다. 사람이 좀 없는 시간대에 가면 국문으로 저자의 소개를 들을 수 있는 기회가 있다. 심지어 운좋게도, 한국 카이스트에서 박사학위를 취득하신 홍콩과기대 Wang Lin 교수님이 연구에서 정의한 uncertainty에 대해 한국어로 설명들을 수 있었다. (또한 교수님의 기존 연구인 이벤트 카메라 도메인 기반의 일반화된 인코딩 모델을 구축한 연구인 EventBind에 관해서도 직접 설명들을 수 있어 감사했다. 해당 연구에 관심있는 팀은 확인해보길 바란다.) 앞선 경험으로 보아, 이제 중국인 참여자가 많은 만큼 포스터장에서 중국어로만 연구를 소개하는 사람들을 보는 것은 너무 당연한 일인것 같다. 내가 중국인이 이닌지 몰랐겠지……
좋은 기회로 학회 참관기를 남기게 된 것에 감사의 글을 남기며 글을 마칩니다.
추가로 궁금하신 점은 댓글로 남겨주시길 바랍니다.