안녕하세요. 이번에는 kccv 2024를 다녀온 이후의 참관기를 작성해보고자 합니다. 작성에 앞서 kccv를 참석할 수 있도록 도와주신 교수님, 화원 선생님께 감사하다는 말씀을 먼저 드립니다.
kccv 참관에 앞서
kccv 참관이 확정된 후, 참관 며칠 이전부터 스스로 어떤 점에 포커스를 두고 둘러볼 것인지를 정하였습니다. 작년 kccv 2023에 미참석한 이유는 스스로 아직 학회의 논문과 다양한 대화를 소화하기에 힘들 것이라 예상하여, 일년 후를 기약하게 되었습니다. 이번 kccv는 작년과 달리 부산 벡스코에서 진행되다 보니, 비교적 포스터 수가 줄어들긴 하였으나 그럼에도 꽤나 좋은 논문들을 다수 볼 수 있었습니다. 작년의 참관기를 살펴보니 다양한 학교에서 참석하였다고 하나, 이번에는 부산에서 가까운 KAIST, 포항공대가 대부분이였으며 서울의 주류 학교(서울대, 연세대, 고려대)가 그 다음으로 많이 참석하였습니다. 그럼에도 계명대학교와 같은 대구 소재의 대학교가 눈에 띄었는데, 대구 출신인 저로써는 (대구 출신이기에 이렇게 말해도 학교에 대한 비하가 되지 않으므로) 이런 인재가 계명대학교에? 그리고 지방의 대학교에서 탑 티어 학회에 도전했다는 점 또한 눈에 띄었습니다.
학회는 오전 9시부터 oral 발표 논문 2-3편, Keynote (한 논문에 대해 20분 내 발표를 하는 oral과 달리, 초청 연사를 모셔 하나의 태스크에 대해 한 시간 가량의 전체적인 설명을 진행하는 발표) 1번, 점심 식사 이후 다시 oral 발표 논문 2-3편, 그리고 Industry (후원사 기업에서 한 명씩 대표로 나와 각 기업에서 하는 비전 연구를 소개), 마지막으로 포스터 발표로 이루어져 있었으며, 오늘 주로 다룰 내용은 마지막 날 진행된 Pannel discussion입니다.
Oral
지금 세어보니 총 22편의 Oral 발표가 있었습니다. Oral 논문의 선정 기준은 알 수 없었으나, 대부분 학교 연구실의 교신 저자인 교수님들이 나와 CVPR, ICCV 등에서 발표한 논문에 대해 설명해주셨습니다. 아무래도 20분의 한정된 시간 때문인지, 발표 시 방법론에 대해 자세히 다루기 보다는 대부분 태스크 소개, 문제 정의 등에 대해 소개해주셨습니다. 오히려 더 좋았던 이유는 위 단락에서 말씀드린 바와 같이 어떤 부분에 포커스를 둘 지에 대해, 사실 방법론에 대해서는 큰 관심이 있지 않았습니다. 논문을 읽어보고, 코드를 보면 방법론을 이해할 수 있는 수준은 되었습니다. 하지만 문제 정의를 잘 듣다 보면, 동일한 학회에 제출한 논문일지언정 다른 점을 발견할 수 있습니다. 본 점은 보통 논문을 읽으면서 발견하긴 어려운데, 그 이유로는 정작 본인들의 연구가 “A를 적용해보고, B를 적용해보고, C를 적용해보.. 어 좋은 성능을 보인다. 논문을 작성해보자”에서 시작되어 문제 정의를 그 이후에 시작하고, 논문을 쓴다면 논문을 읽을 때는 문제 정의로 부터 C라는 방법론을 고안해낸 것과 같이 읽힙니다. Top-down의 연구를 해야 한다는 말을 몇 번 즈음 들어보셨을 텐데, 그런 연구를 이번 kccv에서 찾아내고 싶었습니다. 물론, “A를 적용해보고, B를 적용해보고, …”의 방식이 틀렸다는 건 아닙니다. 만, 아무래도 요즘 굵직하다는, 임팩트를 준다는 연구들이 Google, OpenAI 등의 대기업에서 주를 이루다보니, 새로운 패러다임을 제시하는 연구에 눈이 가는 것 같습니다. 이는 뒤 Pannel discussion에서도 언급할 내용이구요. Oral 세션에서 가장 눈에 띈 연구는 네이버의 Neglected Free Lunch – Learning Image Classifiers Using Annotation Byproducts입니다. 해당 논문은 몇년 이전 부터 주류를 이루던 Unsupervised, Self-supervised가 아닌 이런 방식으로 Annotation을 해서 학습하면 더 좋다는 방식의 논문인데, 왜 주류의 “데이터가 부족한 상황을 상정하는”이 아닌 “데이터가 많은 상황에서 Annotation이 단순 객체에 대한 단일 Annotation만 있어서는 안된다”는 연구를 한 지에 대해 하루 뒤 네이버 기업 부스에서 여쭤보니, “네이버는 데이터가 너무 많다. 너무 많은데, 못 써서 아쉬울 뿐이다”라는 대답을 들었습니다. 반면 옆의 루닛 부스에서 의료 분야에서 Self-supervised가 정확성 등의 문제로 아쉬울 수 있는데, 그런 연구를 진행하는 Insight에 대해 물어봤는데, (사실 정답은 알고 있었습니다. Self-supervised를 활용한 Annotation을 해야한다는 입장이였죠) 음, 개인적으로 질문 받으시는 분이 굉장히 기분 나빠하시더라구요? 허허.. 뭐 그랬습니다.
Poster
아무래도 1저자 혹은 2저자인 학생과 직접 의견 교환을 나눌 수 있는 포스터 세션이 가장 좋았습니다. Oral에서는 보통 20분 발표를 가득 채우는 바람에 질문을 할 수 있는 시간이 한정적인데 비해, 1시간 30분 가량의 포스터 세션에서는 물론 줄을 서서 듣긴 하지만, 다 들은 이후에는 저자에게 방법론에 대해 전체적으로 물은 이후 문제 정의, 연구 동기, 방법론에 대해 상세히 물을 수 있어 좋았습니다. 이 점에서 제가 위 단락에서 말한 “Top-down의 연구인지, 혹은 그렇지 않은 연구인지”를 알 수 있었는데, 특히 저자에게 기존의 연구에 대해 묻거나, 혹은 문제 정의에 관해 토론하다 보면 몇몇의 저자분들은 “타 연구에서 유망한 방법을 본인의 연구에 직접 적용을 해보았더니, 괜찮은 성능을 보였다. 해당 부분에서 Insight를 얻어 다양한 방법을 시도하였다”는 답변도 있었고, “연구 과제에 맞추어 새로운 방안을 시도해보았어야 했는데, 이 때 해당 문제를 풀기 위해 새로운 패러다임을 시도한 것이 유효하였다”는 답변도 있었습니다. 물론 제가 얻고자 함은 “탑 티어 학회의 논문, 그 논문을 집필한 저자들의 Insight, 해당 저자들은 어떤 문제 정의부터 시작되었는지”에 주로 관심이 있었기에, 방법론은 그들의 설명만으로 충분하였습니다. 그래도 연구실에 들어온지 2년정도 되다보니, 어느 정도 알아들을 수는 있어 다행이였습니다.
다시 포스터 세션의 내용으로 넘어가자면, 정말 다양한 분야를 보았습니다. 3D, 2D, 비디오, 멀티모달 등의 다양한 연구에서 이번 2023-2024에 제출된 논문의 주된 공통점은 “Language”, “Foundation Model (or LLM)”이였습니다. 연구의 트렌드가 Foundation model을 어떻게 활용할지, Language 정보를 어떻게 활용할지에 관심이 많다보니, 정말 많은 연구들이 Foundation model을 처음이나 중간 단에 활용하여, 그들로부터 얻은 정보 등을 어떻게 활용할지, 기존의 태스크에서 발전시킬지 또는 새로운 태스크에서 접근시킬지에 관한 것이였습니다. 이렇게 포스터 발표를 듣다 보니, 그 생각은 누구든 할 수 있으나 (해당 저자들의 연구를 비하하고자 함이 아닌, 우리들도 할 수 있다는 의미입니다), 어쩌면 부족한 코딩 실력이 길을 막진 않았나하는 생각도 듭니다. 아니면 Foundation model을 활용함이 새롭게 느껴지진 않아보여 그럴 수도 있습니다.
Pannel Discussion
Pannel Discussion은 한 시간 – 한 시간 20분 내로 포항공대 조민수 교수님이 좌장으로 서울대 이경무 교수님, 연세대 김선주 교수님, 위스콘신 이용재 교수님, KAIST 심현정 교수님이 참석하셨으며 주 대화 내용은 “컴퓨터비전 강국으로서 한국, 연구 커뮤니티의 역할과 방향”이라는 다소 무거운 주제로 시작하였습니다. 해당 Discussion에서는 실제 질문하고 싶은 점도 있었습니다. 개인적으로는 김선주 교수님이 시작한 “과연 오늘 시점에서 대한민국의 컴퓨터 비전 연구는 양이 많아지고 있기는 하지만, 임팩트 있는 연구를 진행해야할 필요가 있으며 이를 위해서는 마치 캐나다와 같은 국가에서 그러하듯 GPU도 필요하고, 다양한 인원들도 필요하며, 그런 커뮤니티가 생성되어야 할텐데..”라고 언급하셨는데, 이는 요즘 컴퓨터 비전 분야, 아니 자연어 처리 분야도 마찬가지 일테지만 “다양한 연구를 진행함에도, OpenAI와 같은 기업에서 Foundation model이라 하며 수백대의 GPU, 수 조의 돈으로 학교 연구실이나 중견 기업 급의 연구들이 무색해져버리는 요즘 시대에서 어떠한 연구를 진행해야 하는지”에 관한 의견이였습니다. 음, 굉장히 쉽지 않은 주제입니다. 간간히 주식을 하는 저로써 최근 엔비디아의 급등과 급락을 보며 하나의 생각이 들었는데, “인공지능에 대한 투자가 굉장히 성행하는 요즘, 과연 인공지능을 활용하는 비즈니스 모델은 어떤 것들이 나와있는가?”에 대해, 쉽사리 대답하기 어려웠습니다. 예를 들어, NLP 분야에서 아무래도 대중들에게 가장 익숙한 ChatGPT의 경우 일부 수익성을 보이긴 하나 과연 무료 버전이 아닌 유료 버전의 사용자가 몇 명이며, 그들로부터 흑자 전환까지 가능할지는 의문입니다. 컴퓨터 비전은 더 심합니다. 과연 컴퓨터 비전에서 비즈니스 모델이 실제로 나온 점이 몇이 될까요? 물론, 연구를 하는 우리 입장에서 이것까지 생각해야 하나 한다면, 또 무조건 생각해야 한다고 말하긴 어렵습니다. 학술적인 분야와 산업적인 분야는 어느 정도 다른 점이 분명 존재하기 때문입니다. 이경무 교수님도 다음과 같이 말씀하셨습니다. “이들 중 절반에서 절반 이상은 산업쪽으로 갈 것이며, 그렇기에 비전 연구에서의 수익화도 고려는 해야할 것”, 음 제가 앞서 우리 입장에서 이것까지 생각해야 하냐의 질문을 던졌지만, 개인적인 생각에서는 “그래야 한다”입니다. 인공지능에 과연 새로운 겨울이 다가오지 않을 것임을 누가 확신할 수 있을까요?
부산에서 진행되어 SRT를 타고 다니며, 벡스코까지 다시 한 시간 가량 버스를 타고 다녀야 하여 쉽지 않았지만 문제없이 잘 다녀온 동료 연구원 분들, 분명 저와 비슷한 새로운 Insight를 얻거나, 또는 새로운 고민에 빠졌을 수 있겠지만, 연구는 지금도 끊임없이 진행되고 있다는 점이 중요합니다. 그럼 이상으로 글을 마무리 짓겠습니다.