안녕하세요. 지난 일주일 (19-23) 간, 미국 애틀랜타의 ICRA 2025 학회를 참관하고 느낀 점을 연구원 분들과 공유드리고자 합니다. 우리가 흔히들 말하는 CVPR/ICCV 등 주요 학회의 논문은 자주 읽어보았지만 실제로 학회는 외국에서 열리다 보니 참가할 기회는 흔치 않은데, 이번 팀 동료 연구원인 권석준 연구원이 RA-L with ICRA에 투고함과 동시에 교수님께서 함께 참관할 기회를 주셔서 다녀오게 되었습니다.
우선 학회의 일정에 관해 간략히 말씀드리고자 합니다. 제가 들어본 다른 학회의 일정과는 달리, 제게는 나름 좋았습니다. 이 좋았다라는 말은 곧, 모든 포스터 발표자들도 주제 별로 나뉘어 배정된 방에서 5분 이내의 프리젠테이션을 단상 앞에서 하게 되며 그 이후 해당 방에서 30분 가량의 질의응답이 이루어졌습니다. 어찌보면 포스터만 보고서는 또는 포스터가 흥미로워보여 그 자리에서 논문만 쓰윽 훑어보고선 질문할 거리를 찾기도 쉽지 않았는데, 또한 해외이다보니 아무래도 포스터 앞에서 발표자가 간략한 요약을 설명해준다한들 그 내용을 충분히 알긴 어려웠을텐데, PPT와 함께 5분 가량의 프리젠테이션을 해주다 보니 그 방법에 대한 이해력은 더 높을 수 있었습니다. 반면, 이는 다른 말로는 각 주제 별 방이 배정되어 있기에 한 타임 (보통 7개의 논문, 각 발표는 5분, 포스터 질의응답 30분을 포함하면 약 1시간 15분)에 한 방에만 들어갈 수 있었습니다. 초반에는 Navigation이나 다른 주제들의 방에도 들어가보았지만 해당 지식이 거의 전무한 상태였기에 논문은 더욱이 이해가 안되었으며, 그렇기에 이후에는 제가 아는 주제들에만 들어가다 보니 또 새로운 주제들을 많이 보기는 어려운 (모든 논문이 포스터처럼 붙어져 있었다면 한 번쯤 지나가며 제목과 그림이라도 봤을테니 말이죠), 그런 장단점이 있었습니다.
ICRA, 이름에서부터 R-Robotics의 학회여서인지, 이전 해당 학회를 참석한적은 없었지만 더욱이 비젼 분야의 논문은 극소수였습니다. 제 생각에선 로봇 이외의 순수 비젼에 대한 연구는 합쳐도 10-20편 이내로 보였습니다. 사실 그렇기에 많은 논문들은 이해조차 쉽지 않았습니다. 그 이유는 특히 AI라해도 그 기반이 로봇이기에 비교적 하드웨어와 관련된 사항도 많이 포함되어 있었으며, 몇 남지 않은 비젼 논문들을 찾아나섰습니다. 그 중에는 저의 최근 관심사인 MLLM (LLM)에 관한 논문도 한 편 있었습니다. 포스터를 보고, 뒤에서 논문을 찾아 대충 읽고서, 이제 챗지피티한테 제가 묻고 싶은 것을 “원어민처럼 영어적으로” 번역해달라고 한 다음, 뒤에서 한 번 입으로 뱉어보고 저자에게 용기내어 물었습니다. 문제는 질문 자체는 할 수 있었지만, 그리고 다행히 질문이 Yes/No로 시작하는 답변이 나올 질문이었기에 그것까진 알아들을 수 있었으나, 갑작스레 흥미로운 질문이라 하며 스스로 10초 가량 고민한 다음 열변을 뱉어내었지만, 그 열변은 제가 이해할 순 없었습니다. 나름 고등학교 수능 시절까지는 영어 듣기를 하며 맨 뒷장의 40번 문제부터 풀면서도 답만 체크할 수 있는 수준이였지만, 현지인은 다르더군요 (그 분은 MIT였습니다).
하여튼, MLPD를 cite한 Multispectral PD 논문도 한 편 보여 가서 저자와 이야기도 해보고, 또 다른 MLLM 논문에서 저자와 이야기도 해보며 첫 날은 한 편, 두 번째 날은 두 편, 세 번째 날은 세 편, 이런 목표로 질문을 던졌습니다. 사실 한국 KCCV와 같은 곳에선 하루에 모든 포스터를 돌아보며 간단한 질문 한 두개쯤이야 당연히 할 수 있었겠죠. 하지만 영어로 질문을 하는데 딱 상대방이 못알아듣겠다는 표정을 짓는 순간, 곤란해집니다. 상대편의 답변이 제가 질문한 것이 아닐때도 있었습니다 (이때는 중국인이였습니다). 어찌되었든 영어의 중요성을 지금 참관기에서 말하고자 함은 아니고, 참 다양한 연구자들이 다양한 분야에서 연구를 하고 있구나 하는 것을 느꼈습니다. 오히려 비젼에 집중된 학회가 아니였기에 더욱이 그런 점을 느꼈습니다. 2025년 지금 유튜브에서는 로봇이 백덤블링을 하고, 로봇이 설거지를 해주고, 자율주행차가 돌아다니고 있지만 연구자들은 조금 더 새로운 시각에서 연구를 진행하고 있었습니다. 하나의 예로 포스터에서 꽤 많이 보이던 단어는 “Transparent’였습니다. 투명한 물체에 대해 segmentation은 어떻게 할 것인지, grasping은 어떻게 할 것인지에 관한 주제가 꽤나 많이 보였습니다. 그런 것을 보면 단순히 예전에는 “로봇이 걷게 할꺼야/로봇이 물건을 집게 할꺼야”에서 이제는 더욱 세부적인 챌린지를 해나가는 모습이, 마치 몇년 전의 비젼 분야를 보는 듯 했습니다.
이제는 개인적인 사담으로, 권석준 연구원과도 많은 이야기를 나누었습니다. 가장 최근까지 논문 작업을 같이하고, 리부탈 철회하고 학회 참관을 위해 가장 많은 DM을 한 인원입니다. 또한 말씀드린 것과 같이 최근 낸 ICCV의 점수가 그다지 좋지 않아, 그냥 철회하고 다른 곳에 투고할 계획에 있습니다. 사실 그 떨어졌다는 것 자체는 크게 개의치 않았습니다. 어찌되었든 그 당시 ICCV라는 곳에 투고하기 위해 밤낮 바꿔가며, 약 1-2달 머릿 속에 연구 생각만 있었던 경험이 생각보다 소중했습니다. 나름의 애정도 있었지만, 결과 자체는 충분히 받아들일 수 있었습니다. 하지만 저널도 물론 마찬가지이지만 논문을 철회하는 순간 결국 그 논문을 다시 작업하여 새로이 제출하고, 이 작업의 지속성에 대해 어느 날 자다가 생각이 드는 순간, 흔히들 말하는 공황장애라고 할까요, 제가 공황장애를 겪진 않았지만 일어나서 숨이 막혔습니다. 뭐 이런 말을 하면서도, 사실 지금 이런 말을 하는 것도 굉장히 어린아이같은 생각이라는 것은 저도 압니다. 제가 택한 길에서 연구에 대해서도 몇 번 고민해오며 교수님 및 선배 연구원에게도 흔히 듣던 말인데, 그냥 끝맺음이 쉽지 않음을 직접 경험해보니 다른 생각이 많아졌습니다. 글로는 표현이 잘 되지 않고 표현을 하지 않았지만 약 학회가 떨어진 이후 일주일 가량 멍때리며 살았는데, 이번 학회 참석으로 나름의 동력을 다시 얻은듯 합니다. 다양한 인종의 사람이 한 곳에 모여 자신의 연구에 열변을 토하며 서로 의견을 나누는 모습에서 작은 불꽃을 보았습니다. 또 한 번 마무리지어보아야할 논문, 그리고 지금 작업 중인 논문, 그리고 후배 연구원인 안우현 연구원과 작업할 논문까지, 짧은 시간이지만 그 작은 불꽃을 조금 크게 만들어 잘 마무리를 지어보아야겠습니다.
학회 마친 이후 여행에 관한 썰이나 미국에 관한 꿀팁이 궁금하시다면 (나는 어떻게 영어를 하였는지 등), 저를 찾아와주시면 됩니다.