안녕하세요. 역시 폴 자네의 법칙에 의해 작년보다 올해가 더 빠르게 지나갔네요. 저희보다 훨씬 더 빠른 시간을 보내고 계실 부모님 생각도 나네요. 허허.
이번 다이어리에는 2025년 한 해를 스스로 돌아보면서 올해의 경험을 글로 정리해보고 새롭게 맞이할 2026년을 어떤 마음으로 보내고 싶은지도 함께 한번 작성해보려고 합니다.
2025년을 돌아보며
2025년은 URP를 시작으로 연구실 기초교육, 학부 졸업, 인생 첫 논문 작업, 과제 관련 실무까지 겹치면서 그 어느 해보다 밀도 있게 보낸 한 해였던 것 같습니다. 매일 매일이 정신없이 흘러갔지만, 돌이켜보면 많이 했다 라기보다 많이 부딪히고 많이 배웠다 라는 생각이 듭니다.
먼저 상반기에는 기초교육이 어느 정도 마무리된 이후, OVOD와 Monocular Depth Estimation을 중심으로 논문을 읽고 공부했습니다. 상인님의 도움으로 아무것도 모르던 저로써는 많은 것을 배울 수 있는 기회였고 공부한 내용을 바탕으로 논문작업을 한번 처음으로 진행해 볼 수 있는 기회도 생겼습니다. 따라서 기존 처럼 탐지 모델과 깊이 모델을 따로 돌린 뒤 후처리로 객체별 거리 정보를 뽑아내는 방식은 구조적으로 비효율적이라는 점을 기반으로 자연스럽게 하나의 모델로 depth 추정과 detection 까지 수행할 수 있는 연구를 진행하게 되었습니다. 처음에는 멀티 태스크 러닝 관점에서 ScaleDepth 계열의 접근을 기반으로 DETR의 object query 개념을 일부 도입해서 depth 뿐 아니라 detection까지 함께 수행하도록 확장하는 방향으로 연구를 진행했습니다. 하지만 막상 구현과 실험을 시작하니 마주하는 현실적인 어려움이 많았던 것 같습니다. depth 라벨과 bbox 라벨이 동시에 갖춰진 데이터셋을 생각보다 확보하기가 어렵고, depth와 detection이 encoder를 공유하는 구조를 선행연구로도 쉽게 찾기 힘들었습니다. 물론 그 당시에는 이러한 어려움은 생각하지 않고 무작정 아이디어를 코드단에서 실제로 성립시키기 위해 모델 구조를 뜯어 고치고, loss도 여러 형태로 바꿔가며 밀어붙여 보긴 했습니다. 그런데 결과적으로는 detection 성능과 depth 성능이 둘 다 떨어지는 방향으로 흘러갔습니다. 결과적으로 판단했을 때 단순히 두 태스크를 같이 한다 수준이 아니라, depth와 detection이 요구하는 표현이 어떤 지점에서는 서로 상충될 수 있고, encoder를 공유하는데 있어서 학습시키는 과정에서 생각보다 다양한 제약과 한계가 존재한다는 점을 알게되었던 것 같습니다. 지금 돌이켜보면 모르는게 많았고 확신이 서지 않은 시점에서 이렇게 하면 생각대로 될거야 라는 생각에 현재 하고 있는 실험 설계가 탄탄한지, 정의한 문제, 참고할 만한 선행 연구가 존재하는지, 없다면 어떤 어려움이 있길래 없었을지 고민 없이 무작정 뛰어 들었던 것 같습니다. 그래서 그런지 실제로 결과가 좋지 않으면 어디서 부터 어떻게 해야할지 길을 잃고 헤맸던 경우가 많았습니다. 결과적으로는 내가 이 문제를 지금 단계에서 끝까지 해결할 수 있을지 계쏙해서 끌고 나가도 괜찮을지,, 결론적으로는, 현실적으로 어렵다고 판단했고… 그때는 깔끔하게 포기 선언을 했습니다. ㅋㅋ 하지만 지금 와서 생각해보면, 그 포기는 단순한 포기가 아니라 내가 어디까지 할 수 있고, 지금 무엇을 선택해야 하는지 판단하는 경험이었던 것 같습니다.
이후에는 방향을 다시 고민하다가, 예전부터 관심이 있던 효율화/경량화 쪽으로 시선을 옮기게 되었습니다. 마침 당시 사수이셨던 상인님께서 토큰 프루닝을 연구하고 계셔서, 이번 기회에 관련 분야를 제대로 배워보자는 마음으로 논문들을 처음부터 다시 서베이하고 공부를 시작했습니다. 토큰 프루닝 분야를 공부하면서는 어떤 기준으로 토큰을 줄이는지 그리고 성능,속도 간 trade-off가 어떻게 만들어지는지를 비교적 구조적으로 이해할 수 있었습니다. 또 앞서 OVOD+MDE 멀티태스크를 진행하며 모델을 뜯어보고 수정하고 학습시키는 과정에서 쌓였던 경험이 그대로 경험치로 작용했는지는 모르겠으나, 토큰 프루닝 실험을 진행할 때는 상대적으로 수월하게 느껴지기도 했습니다. 물론 모델 구조를 수정하고, 학습이 흔들리는 원인을 파악하고, 실험 조건을 다시 정리하는 과정 자체가 쉬웠던 건 아니지만, 적어도 예전보다는 어디서부터 점검해야 하는지 감이 잡히는 느낌은 생겼던 것 같습니다. 당시에는 제가 정의한 문제나, 설계한 실험이 타당한지 같은 부분을 충분히 고민하기보다, 일단 성능을 올리고 효율을 챙기자는 다소 두루뭉술한 문제의식으로 실험을 시작했고 관련해 무작정 이것 저것 실험을 돌리다 보니 결과적으로 쓸모 없는 실험부터 갑자기 스스로도 문제 의식이 흔들리는 상황, 갑자기 원점으로 또 돌아오게 되는 그러다 보니 이런 과정이 연구의 흐름 자체를 비효율적으로 만들기도 했던 것 같습니다. 결과적으로 짧은 분량의 논문의 글이지만 많은 피드백을 받으면서 논리적인 글을 쓰기 위한 과정을 배웠고 아직 부족한 저로써는 충분한 경험이 되었다고 생각합니다. 전반적으로는 첫 단추의 중요성을 크게 느꼈던 것 같고, 나중에 2026년에 논문을 쓰게 된다면 결국 하고자 하는 분야에 대해 깊게 이해하고 다양한 방향에서 마주칠 문제를 염두해두고 내가 생각한 문제 정의가 타당한지 선배들에게 자문을 구하고 10수 앞은 아니어도 적어도 2-3수 앞은 그린 상태에서 실험설계를 하고 논문 작업을 들어갈 것 같습니다.
논문 작업이 어느 정도 마무리된 직후, 곧바로 센서과제 워크샵 일정이 잡혔고, 이어서 연차보고서까지 준비해야 해서 약 한 달 정도는 과제 업무로 시간이 흘러갔던 것 같습니다. 그 기간에는 상인님께서 기존에 진행해오셨던 실험 흐름에 더해, 이번에 제가 진행했던 토큰 프루닝 관련 내용도 결과로 정리해 포함시키는 작업을 했습니다. 실험 결과를 정리하고, 이를 바탕으로 ppt발표 자료를 구성한 뒤 스크립트까지 작성하면서, 실무용 발표가 기존 세미나와 같은 발표와는 결이 다르다는 걸 확실히 체감했습니다.
단순히 내용만이 중요한 것이 아닌 목적에 맞는 메시지 구성과 형식이 갖춰져 있어야 하고, 발표자와 흐름을 고려한 스크립트 작성 방식, 그리고 보고서 문장을 정리하는 방식까지 전반적으로 상인님께 정말 많은 것을 배웠습니다. 상인님 졸업이 늦춰지지 않았다면 이 모든 걸 제가 혼자 감당해야 했을 거라 생각하니, 지금도 솔직히 조금 까마득합니다.
워크샵 날에는 버스를 타고 청주에 함께 다녀왔는데, 현장 일정이 끝난 뒤 상인님과 단둘이 산책하면서 도란도란 이야기를 나눴던 시간이 특히 기억에 남습니다. 그때 사주셨던 닭볶음탕이 너무 맛있어서, 가끔씩 문득 생각나기도 합니다.
이후에는 Visual navigation쪽의 연구를 서베이 해보고, 그 중에 괜찮은 방법론을 시뮬레이터 부터 실제 모바일 플랫폼에 올려서 동작시켜보는 그러한 과정을 진행하였습니다. 아마 2026년에는 더 나아가서 해당 분야와 관련해서 많은 시행착오를 겪어 보면서 다양한 실험이나 연구를 진행해보고자 할 생각입니다.
마무리하며
2025년은 스스로 만족할 수 있는 한해를 보냈다고 생각합니다. 근데 조금 아쉬운점이 있다면 조급한 마음에서인지 모르겠으나 배우는데 급급한 나머지 조금 더 긴 호흡으로 앞으로 미래를 그려보는 시간을 갖지 않으면서 한해를 보냈다는점? 내가 이 길을 선택한 이유에 대해서 그리고 앞으로 어떤 방향으로 나아가고 싶은지에 대한 질문을 자주 꺼내어 보지 못했던 것 같습니다. 좁은 시야도 넓혀보면서 2026년에는 앞으로의 방향성을 진지하게 고민해보면서 굵직한 연구방향을 정해서 연구를 해나아갈 생각입니다.
돌아오는 새해에는 모두가 하시는 연구나 일들 무엇이든 다 잘 되었으면 좋겠고 건강하고 행복한 한 해가 되었으면 좋겠습니다~
감사합니다.
안녕하세요 우현님, 회고글 잘 읽었습니다.
상인님이 사주신 닭볶음탕이라,, 이거 귀하네요. 2025년의 우현님은 친구 입장이 아닌 같은 연구원 입장으로써 생각해봐도 정말 열심히 살아왔다고 생각이 듭니다. 특히 정민 상인 석준님 밑에서 많은 것을 배우려고 노력하시는 것 같아서 보기 좋았습니다. 또 최근에는 네비게이션 데모 촬영하는 것도 슬쩍 봤는데 스카우트 이동하는 게 오 뭔가 설레더라구요. 그거 보다보니 드는 생각은 모빌리티팀에서 우현님도 이제 점차 핵심인력으로 자리잡고 있는 것 같다는 생각이 듭니다. 같이 화이팅 합시다 ^,.^