2025년 상반기 회고

안녕하세요. 2025년도 상반기를 마무리하며 짧은 회고를 남깁니다.

올해는 연구실에 들어오고 동시에 석사과정 첫 학기를 보냈습니다 . 원래 같았으면 종강만을 손꼽아 기다렸을 텐데 이번학기는 오히려 그 반대였습니다. 앞으로 연구실 생활이 더 바빠질 테니, 시간이 더 빠르게 지나간다고 생각할지 모르겠습니다. 그런 걸 보면 석사 2년이 결코 긴 시간이 아니라는 생각도 듭니다.

이번 학기동안 수업을 들으며 4개월 간 기초 교육을 같이 받았습니다. 컴퓨터 비전의 기초 내용을 정리한 후 부턴 매주 논문을 한 편씩 읽고 원복도 하는 일정으로 기초교육이 진행됐습니다. Text Spotting 분야의 논문을 집중적으로 읽으며 이 분야의 흐름과 주요 방법론에 대한 감을 잡을 수 있었습니다.

해당 분야의 연구에 대해 조금 설명을 드리자면 이렇습니다. 우선 Text Spotting이란 task는 이미지에서 텍스트의 위치를 찾고 (Text detection) 찾은 텍스트의 내용 즉 character sequence를 인식 (Text Recognition)하는 작업으로 이뤄집니다. 저는 주로 natural scene에서의 scene text에 대해서 해당 태스크를 수행하는 연구 위주로 팔로우업했습니다. 이 작업이 동시에 이뤄진다면 end-to-end 한 text spotter이 되는 것이고 투스텝은 주로 이미지에서 location이 우선 수행되고 찾은 텍스트를 이미지에서 크롭해 해당 단어난 문장을 인식하는 방법이었습니다. horizontal 하고 문서와 같이 배경이 복잡하지 않고 배경과의 대비가 뚜렷한 경우에 대한 text detection과 recognition은 이제 문제 없이 잘 수행됩니다. 하지만 굽은 형태이거나 상하 반전이 돼 있는 경우나, occlusion 의 상황에서는 그 난이도가 급증합니다. arbitrarily shaped text에 대한 detection 정확도를 개선하기 위해서는 text boundary를 기존의 정 혹은 직사각형인 아닌 control points로 구성되는 polygon으로 나타내거나 bezier 곡선의 형태로 예측해 여러 형태의 텍스트에 대해서 유연하게 찾을 수 있도록 하였습니다. 이때 이 control points를 DETR 의 방법으로 예측하도록 설계한 것이 TESTR 연구였습니다. 그리고 occlusion 에 강인하게 동작하는 recognition model을 만들기 위해서는 mask image modeling이나 단어나 패치 단위로 contrastive learning을 수행하는 연구도 있었습니다. 특히 mask image modeling에서 가려진 부분을 reconstruct하는 과정에서 occlusion에도 정확하게 인식할 수 있었습니다. 또한 사전 학습된 언어 모델을 사용해 context information을 활용해 occlusion 상황에서도 가려진 글자를 정확하게 인식할 수 있게 하는 연구를 진행 중입니다. 특히 제가 최근에 리뷰한 것 중에 CLIP4STR이란 연구는 CLIP이 가지는 text 에 대한 perception skill을 조명하며 CLIP의 두 인코더를 활용한 text recognition 모델을 설계하였습니다. 이렇듯 앞으로도 language model을 활용한 연구가 활발히 이루어질 것 같습니다.

아무튼 교육이 끝난 지금 도메인을 바꿔 industrial scene에서의 text recognition을 하는 것을 주제로 논문 작업을 하고 있습니다. 그리고 어느새 URP 다음 기수 분들이 들어왔습니다. 아는 것이 많지 않지만 서브 멘토로서 도움을 주고 있습니다. 제가 얼마나 도움이 되는지는 모르겠지만 그래도 이렇게 시간이 흘러 멘토로 참여를 하는 게 또 신기하네요.

제가 연구실에 들어온 지 이제 꽤 되었는데요, ‘많은 성장을 이뤘는냐’는 질문에 선뜻 “그렇다”고 답하기는 어려울 것 같아요. 분명히 이전보다 많은 것을 배우고 있고, 지금도 배워가는 중이지만, 공부를 하면 할 수록 부족한 점이 눈에 잘 띕니다. 배운 지식들이 쌓이기보다는 자꾸 휘발되는 느낌에 마치 구멍 난 독에 물을 붓는 것 같아 씁쓸할 때도 많습니다. 논문을 읽고 세미나를 들어도 여전히 제게는 낯선 개념이 많습니다. 부족함을 인정하며 틈틈히 기초를 채우고 있습니다. 그래서 앞선 질문엔 “성장중이다”라는 답변이 더 적절할 듯 싶네요!

그래도 다행히 논문을 읽는 데는 조금 익숙해졌습니다. 논문 서베이를 할 때도 어떤 단락에 어떤 내용이 있겠다 는 것도 파악이되고 논문의 저자가 제안한는 바도 이전 보다 빠르게 캐치할 수 있게 되었습니다. 그리고 논문을 읽을 때나 공부할 때 이전엔 조금만 어렵다고 느끼면 피하는 경향이 없지 않아 있었는데. 지금은 의식적으로라도 어려운 부분을 더 봐서 확실히 하고 가려고 합니다. 쉬운 내용을 두번 세번 반복해서 봤던 시간을 어려운 부분을 다루는데 더 할애한 것이 도움이 됐던 것 같습니다. 늘 쉬운 것과 어려운 일 중에 어려운 일을 택해 하는 것이 많은 노력을 필요로 하는 것 같습니다. 특히 이런 게 엑스 리뷰를 쓰면서 도움이 되었네요.

또 하나, 저는 사람들 앞에서 발표하는 것을 정말 어려워했는데, 연구실에 들어오고 나니 자신이 없고 못한다고 피할수가 없더라고요. 그리고 연구를 하면서 내 생각과 지식을 상대방한테 잘 전달하는 것도 매우 중요한 능력임을 깨닫고 꼭 극복하고 싶은 마음이 들었습니다. 물론 100% 자의는 아니지만 매주 세미나를 하고 미팅 준비하면서 그동안 회피하던 발표라는 일을 반복적으로 직면하며 극복한 것 같습니다. 물론 지금이 전보다 달라지게 잘하게 된 건 아니고 여전히 보완할 부분이 많고 또 여전히 세미나나 미팅을 앞두고 마음이 가볍지만은 않지만 예전처럼 “이건 진짜 못 하겠다”는 생각보다는 “그래도 해볼 만하다”는 마음이 더 큽니다. 계속 하는데도 뭔가 발전이 없다는 생각이 들어 그만하고 싶단 생각도 들텐데 그럼에도 계속 도전했단 점에선 스스로 잘 한 일이라 생각합니다.

사실 이번엔 저의 장점보단 부족한 점을 마구 마구 찾는 게 더 쉬웠습니다. 찾으려고 하지 않아도 알게 되던걸요.. ^^

예를 들면 제가 또 부족하다고 느끼는 것 중 하나가 코드를 이해하고 이것 저것 바꿔가며 짜보는 게 빠르게 잘 안된다는 것이었는데요. 그래서인지 코드를 보는 것 자체에 장벽을 느끼는 것 같습니다. 그래서 논문을 읽어도 읽는데만 그치는 경우가 많았는데 논문에 코드가 공개돼 있다면 받아서 학습 돌려보고 코드로 확인해보는 것을 게을리 하지 않아야 겠다는 생각을 했습니다.

연구적인 것 외에도 생활적인 부분에서도 변화가 필요하다고 느낍니다. 연구실에 오래 있다보면 앉아 있는 만큼 집중하고 있지 않다는 것을 알게 되는데 귀찮다는 이유나 곧 저녁 먹을 시간이란 이유로 그냥 앉아만 있는 경우가 많은데 귀찮음을 무릅쓰고서라도 자주 공부하는 환경을 바꿔줘야 겠다는 생각이 들더라고요. 환경을 바꿔주는 것 만으로도 집중력을 끌어올릴 수 있음을 경험하고 나니 꼭 제게 필요한거란 생각이 들었답니다.

그리고 엑스 리뷰와 리뷰를 읽고 댓글을 다는 것을 늘 마감 직전에 허겁지겁 제출하곤 하는 데요 그래서 충분히 제가 쓴 글을 점검하지 못하고 하는데 일요일 자정까지는 마친다는 생각으로 조금 빨리 쓰고 포스팅하기 전에 최소한 한번은 꼭 보고 수정해서 올려야 겠습니다.

또한, 제가 연구실에 들어옴과 동시에 운동을 소홀히 하게 되었고 지금은 일절 하지 않고 있는 상태인데요. 체력도 .. 일상의 활력도 함께 잃어 가고 있는 것 같습니다. 이번 회고록을 쓰는 지금을 계기로 다시 운동을 간단한 것 부터 시작하려고 합니다.

다음은 제가 두달 간 첫 논문 작업을 앞두며 내린 저의 다짐을 적고자 합니다. 제가 연구하는 주제가 지금 새롭게 부상하는 분야는 아니지만 이 분야 만큼은 누구보다 더 잘 안다는 생각을 가지고 임해야겠습니다. 그리고 두달 동안 의 과정에 후회가 없게 여러가지를 시도 해보고 싶습니다. 지금 논문 작업을 시작할 때 받은 조언이 방법론을 코드로 빠르게 구현해보고 확인하는 과정을 여러번 연습하는 게 도움이 된다는 건데 저도 그 조언에 동의하며 앞으로 두달 간의 논문 작업에서도 그래볼 생각입니다. 두 달이 지나고 다른 주제로 연구를 시작하게 되더라도 지금 하는 것을 발판 삼아 지금처럼 하던 대로 하면 될 수 있도록 지금 좀 더 힘을 내보겠습니다.

돌이켜 보면 이번년도에 제게는 처음인 게 많았습니다. 작년 이맘 때 졸업하고 집에 올라왔을 때는 제가 대학원을 갈 줄도 컴퓨터 비전 분야의 연구를 하고 있을 줄 전혀 몰랐습니다. 1년이란 시간에 많은 게 바뀌고 새로운 환경에 놓이고 또 적응하고 조금 나아진 제 자신을 지켜보는 게 참 신기합니다. 하반기 회고록을 쓸때는 후회나 아쉬움 보단 “이제 이건 잘 할 수 있다”고 말할 수 있는 것들이 많았으면 좋겠네요. 물론 지금 처럼만 즐겁게 꾸준하게 해주었으면 합니다.

Author: 류 지연

Leave a Reply

Your email address will not be published. Required fields are marked *