안녕하세요. 이번에 좋은 기회로 8월 12-14일 3일간 부산 벡스코에서 개최된 KCCV2024에 참석할 수 있었습니다. 참석할 수 있도록 도와주신 교수님 및 박화원 선생님, 그리고 학회 기간 동안 저희를 통솔하셨던 이상인 연구원님께 감사의 말씀 남깁니다.
KCCV는 NeurIPS, CVPR, ICCV 등 다양한 국제학술대회에 게재되었던 국내 대학의 논문과 연구들에 대한 포스터와 구두 발표를 들을 수 있는 한국 컴퓨터비전 커뮤니티의 큰 행사입니다. 단순히 학위과정에 있는 학생들뿐만 아니라 기업 연구원이나 교수님들도 많이 참석하여 연구 성과 및 향후 컴퓨터비전 커뮤니티 발전 방향을 공유하는 자리입니다. 아직 제가 부족하여 3일간 모든 것을 이해하고 궁금했던 것을 해소할수는 없었으나, 다양한 최신 연구들의 동향을 살펴볼 수 있었고 실제로 어떤 방향 및 분야에서 연구들이 수행되고 있는지 흐름을 잡을 수 있었습니다.
프로그램은 전반적으로 아침부터 oral 발표나 keynote등의 발표가 이어지나 중간에 1시간 30분가량의 포스터 발표 시작이 주어지는 형식으로 진행되었습니다. oral session에서는 해당 논문을 작성한 연구실의 교수님께서 논문의 개요 및 전체적인 프레임워크를 설명해주셨으며, 발표와 질문을 합쳐 20분정도로 계획되었습니다. 보통 발표 18분 질문 2분정도로 진행되었던 것 같네요. 요일에 따라 oral 중간중간에 연사들이 하나의 주제에 대해 1시간 가량 발표하는 keynote session, 프레시(혹은 졸업 예정인) 박사들이 학위기간동안의 연구를 발표하는 Doctoral Colloquium session, , 기업(포스코DX, 삼성전자,루닛 등)에서 온 연구원/기술자가 자신들이 사용하는 기술이나 나아가고자 하는 방향에 대해 발표하는 industry session, 연사들이 함께 나와 토크쇼를 하는 형식으로 이후 컴퓨터비전 연구 커뮤니티의 미래 지향점에 대해 이야기 나누는 panel discussion 이 있었습니다. 구성이 알차서 자리에 가만히 앉아서 듣는 것많으로도 많은 인사이트를 얻을 수 있었습니다(하지만 6시에 학회가 끝나고 나면 너무 힘들어서 저녁 먹고 아무것도 못했던 기억이 나네요)
Oral session
날짜마다 다르지만, 매일 6~9개의 oral session 발표가 있었습니다. 위에서 적었듯 oral session 발표는 (평소에 연구실 세미나를 하는 것처럼) CVPR, NeurIPS 등 우수 국제학술지에 게재된 논문에 대한 20분 발표로 구성됩니다. 발표는 논문을 작성한 연구실의 교수님들이 직접 하셨으며 논문 task에 익숙하지 않은 청중들을 위한 간략한 introduction 설명 후 방법론과 실험 결과 에 대한 순서로 진행되었습니다.
제가 아직 CV분야를 넓게 알지는 못해서 제가 평소에 관심을 두고 있는 분야와 미리 읽어보고 간 논문을 제외한 분야의 논문들은 깊게 이해하기 힘들었지만, 최근에 어떤 연구들이 수행되고 있는지 흐름을 읽을 수 있었습니다. 아직 저는 제가 논문 작업중인 분야 관련된 논문만 읽어왔기에(대부분 20-21년 즈음 논문들입니다) 요즘에는 어떤 논문들이 나오고 있는지 팔로업을 해야겠다고 느꼈습니다.
Keynote / Doctoral Colloquium session
키노트는 하루에 한 번 한시간 정도의 분량으로 진행되었습니다. 초청 연사로는 LLaVa의 저자 이용재 교수님, 미시간대의 Stella X.Yu 교수님, Inria의 Laptev 박사님이 진행하셨습니다. 키노트를 들으면서 가장 인상 깊었던 토픽은 LLM 및 멀티모달과 관련된 주제였습니다. LLM이 거듭 발전하면서 일반적 상식을 추론하고 세계에 대한 이해가 깊어지면서 이와 결합된 컴퓨터비전에서도 다양한 시각인지작업을 할 수 있는 모델이 발전하고 있습니다(보통 foundation 모델이라고 하죠). 모델이 세계를 이해할 수 있는 능력이 생기면서 굉장히 다양한 일을 할 수 있기 때문에 이러한 방향으로의 발전이 계속 될 것으로 보이기에 이제 LLM과 multimodal foundation model에 대한 이해는 필수인 것으로 보이네요. 대학 연구실에서 LLM 및 Foundation model을 개발하기는 어려울 것이고 이러한 모델들을 어떻게 활용할 수 있을지 고민하는게 좋을 것 같습니다.
Poster session
포스터 세션에서는 관심이 가는 제목의 포스터를 찾아가서 저자에게 설명을 부탁하기도 하고, 미리 읽어놓았던 논문의 경우에는 읽는것만으로는 이해가 가지 않았던 부분이나 디테일에 대한 질문을 주고받았습니다. 사람들이 너무 많아서 제대로 설명을 듣거나 하고싶던 질문을 많이 하지 못해서 아쉽긴 하지만 저자들에게 직접 이것저것 물어볼 수 있었던 점이 좋았습니다. 저는 주로 방법론에 대해 이해하고자 하였는데 학회가 끝나고 보니 다른 분들은 문제를 정의하는 방법, 어떻게 논문까지 완성되었는지, 어떤 시행착오가 있었고 어떻게 극복하였는지 등등 논문의 내용 그 자체보다는 접근법이나 문제 정의 그 자체에 대해 질문하셨다고 하더군요. 저도 그런 질문들을 했으면 좋았을텐데 하는 아쉬움이 남아 있습니다. 다음에 혹시 또 다른 기회가 있다면 연구를 어떻게 진행하였는지에 관련된 질문을 해야겠습니다.
기업 단위의 foundation 모델 관련 키노트를 듣다가 대학 연구실에서 연구한 논문들을 보면 그래도 이런건 연구실에서 할 수 있구나.. 라는 느낌이 드는 연구들이 대부분이었습니다. 주제만 잘 잡으면 연구실에서도 할 수 있는 연구가 충분히 많이 남아있는 듯 합니다.
Industry Session
Industry session에는 루닛, 델타엑스, 삼성전기, 삼성전자SAIT, 포스코DX에서 발표하였습니다. 각각의 발표스타일이 많이 상이했지만 전반적으로 각 기업이 어떤 기술을 가지고 어떤 솔루션을 제공하는지(혹은 어떤 제품을 만드는지)를 소개했습니다. 자율주행을 위한 비전기술도 있고 자율제조를 위한 비전 기술을 소개하기도 했습니다. 특히 재밌게 들었던게 삼성전자와 루닛인데요, 삼성전자는 모두 잘 알고있다시피 반도체 8공정을 모두 수행하게 되죠. 하지만 공정기술을 개발하고 최적화하는데에 지금까지는 고연차 실무진들의 경험과 직관에 의존했다고 합니다(어떤 환경에서 어떤 조건화 농도로 반도체에 어떤 공정을 가해야 원하는 수율이 나오는지 등등.. AI로 비교하면 하이퍼파라미터 튜닝으로 비교할 수 있겠네요). 하지만 공정기술이 시간이 지날수록 극도로 복잡해져서 이런 방식이 한계에 부딪혔고 이 문제를 자체 제작 AI를 개발해 풀어나가고자 한다고 했습니다. AI를 이런 곳에서도 사용할 수 있다는 아이디어가 저에게는 굉장히 신선했습니다.
루닛은 대부분 아시겠지만 의료 AI 솔루션을 제공하는 벤처입니다. 지금은 AI를 통한 암 정복을 목표로 하고 있습니다. 유동근 루닛 CTO(교수님과 같은 KAIST RCV에서 학위과정을 거친 분입니다)께서 직접 발표를 하였는데, 루닛이 구체적으로 어떤 목표를 가지고 있고 해당 목표를 위해서 어떤 솔루션을 개발하는지 전반적인 설명을 들을 수 있었습니다. 컴퓨터 비전 기술을 활용하면 암을 조기 발견할 가능성이 커지고, 진단받은 암에 따라 어떤 처방을 내려야하는지도 보다 쉽게 알 수 있습니다(같은 부위의 동일한 암이더라도 사람에 따라 치료법이 천차만별입니다. 어떤 치료를 적용해야하는지 환자 데이터를 이용해 예측하면 진단에 활용할 수 있겠죠). 병변 조직의 경우에도 segmentation을 보조로 활용하면 영상의학과 교수가 직접 판독하는것보다 훨씬 빠르게 진행할 수 있기에 실제로 암 치료 과정에서 AI솔루션이 큰 도움이 된다고 합니다. 루닛은 실제로 국내 및 유럽의 병원에 본인들의 서비스를 제공하고 계속 새로운 솔루션 개발 및 기존 모델 발전에 힘쓰고 있다고 합니다. 의료분야 특성상 규제가 심해 어디까지 의료 AI를 적용시킬 수 있을지는 모르지만 조금씩 개선되고 있는것은 분명해 보입니다.
쉽게 진단 및 치료받지 못하는 많은 사람들이 의료 AI를 통해 생명을 연장할 수 있다면 그 보람이 정말 클 것 같네요.
Pandel discussion
해당 세션에서는 포스텍 조민수 교수님, 서울대 이경무 교수님, KAIST 심현정 교수님, 연세대 김선주 교수님, LLaVa의 저자 이용재 교수님 다섯 분이서 토크쇼 평식으로 향후 컴퓨터비전 커뮤니티 발전 방향을 논하셨습니다.
기억이 남는 발언이 몇개가 있는데요, 대가들이 바라보는 시야는 굉장히 넓더군요.. 3일의 학회 중 가장 재밌는 세션이었습니다. 몇가지 기억 남는 발언들을 적어보자면
‘이제 소위 탑티어라고 불리는 학회에 충분히 많은 논문을 내고 있다. 논문 게재 수를 인구 수로 나누면 한국이 전세계 1등이다’ ‘하지만 한국의 비전 연구가 그만큼 임팩트를 가지지는 못한다’ ‘매년 탑티어 학회에서만 1만편 가량의 논문이 쏟아진다. 하지만 1년 뒤 단 한번이라도 인용되는 논문이 20%가 채 안된다. 논문 붙은것에 일희일비하지 마라. 리뷰 받아보면 알지 않냐. 리뷰어들이 절대 expert가 아니다. ‘ ‘논문 몇편 수 내는게 중요한게 아니고 citation이나 github star 개수만큼 개별 연구의 impact가 중요하며, 연구자의 평가 방법도 자연스럽게 이쪽 방향으로 흘러갈 것이다. 지금은 너무 정량적으로 몇 편 accept되었는지에 치중되어있다’ ‘연구가 impact를 가질 수 있는 좋은 방향 중 하나는 industry를 고려하는 것이다. 학계와 산업계를 구분해서 생각하지 말자’
이러한 말들을 하시더군요.
또한, 한국 연구 커뮤니티는 너무 경쟁적인 면이 없지않다고. 학회 와서도 연구실 사람들이랑만 밥먹고 돌아다니는데, 처음 보는 사람들에게 말 걸어서 연구 주제도 나눠보고 하는 문화가 활성화되지 않아서 아쉽다고 하셨습니다(해외 학회 가면 그냥 갑자기 와섭 너 연구 뭐해? 이런다고 하더군요). 확실히 거리낌없이 의견을 나누는 문화가 정착되어 지식을 나누는 문화가 활발해지면 좋겠지만 한국 정서에 쉽지 않을 것 같습니다.
3일간 많은 것을 보고 느꼈습니다. 좋은 양분으로 삼아 좋은 연구자가 되어보겠습니다. 감사합니다.