벌써 개강을 일주일 앞두게 되었습니다. 세상에 벌써 저의 석사 1학기가 끝이 나다니, 새삼스럽지만 시간이 정말 빠르다는 걸 피부로 느끼고 있는 요즘입니다.
저는 매번 새로운 전환기가 있을 때마다 더 발전한 사람이 되기 위해 결심을 하곤 했는데요. 비록 그게 아주 사소하더라도 항상 스스로에게 약속을 하고 실천하기 위해 노력하곤 하였습니다. 이제 다시 개강이라는 새로운 전환점이 등장한 만큼, 또 다시 새 사람으로 태어날 시기가 왔습니다. 게다가 어제 짧지만 달콤한 제주도 힐링을 경험한 저로서, 이보다 완벽한 시기가 있을까 라는 생각이 들기도 하네요…ㅎㅎ
서론이 길었습니다. 각설하고 저의 상반기 회고를 시작해보겠습니다.
꾸준함이라는 특징을 장점으로!
저는 이번 회고를 약간 발랄하게 제가 잘한 일을 먼저 돌이켜 보려고 합니다. 저의 상반기 중 하나를 골라 칭찬하라고 한다면,, 저는 꾸준함에 대해 말하고 싶습니다.
저는 학기 초, 약한 허리로 인해 많이 고통받았었는데요, 허리가 아파서 앉아있는 거 자체가 힘들었고, 조금이라도 무거운 것을 못들기도 했습니다. 그로 인해 거진 백만원이라는 거금을 도수치료에 헌납하기도 했습니다. 물론 지금은 완치하였지만, 다시 허리가 망가지지 않도록 운동을 시작하게 되었습니다.
그렇게 시작한 운동이 벌써 반 년이 다 되어가고 있습니다. 그리고 연구 스케줄을 맞추기 위해 오전으로 시간을 바꾸며 체력도 키우고 아침형 인간이 되도록 노력하곤 했습니다.
그리고 이번에는 영어공부를 해볼까 하고 시작한 영어학원 역시 벌써 반 년이 다 되어가고 있습니다. 아직 옹알이하는 아기 수준이지만, 금붕어에서 시작한 저의 하찮은 영어실력으로는 꽤나 성장하였다고 할 수 있습니다.
체력과 영어 같은 연구자가 갖추면 좋을 스택은 느리지만 꾸준하게 키우려고 노력한 상반기였습니다. 스며들었다는 말이 유행이던 때가 있는데, 저는 이렇게 스며드는 스타일인가 봅니다. 어느순간 정신차려보니 꾸준히 열심히 하고 있는 제 모습을 발견하였으니, 아마 다음 목표는 알고리즘 혹은 통계/수학적 이론이 될 것 같습니다.
이제는 연구의 스택을 키워보자!
하지만 연구자의 핵심이자 본질은 당연히 연구 그 자체… 아쉽게도 이 부분이 너무너무 부족한 한 해입니다.
올해 제가 한 일을 생각해보니… 우울증 논문 작업, 다크데이터 과제 회의 준비 및 실적 관련 준비, 그리고 빠른 감정인식 관련 서베이 논문 작성 등등 다양한 작업을 해보았습니다. 이 부분도 당연히 연구자로서 필요한 덕목이지만
제가 생각했을 때, 저는 아직 해결해야할 문제를 정의하고, 분석하고 그리고 솔루션을 찾기 위한 방법론을 생각하고 증명하는 그 일련의 과정을 해결하는 경험이 절대적으로 부족하다고 늘 생각하곤 하였습니다. 논문도 많이 읽어보고 다양한 실험을 돌려보고 내 실험 결과와 아이디어를 구현해보는 과정이 중요한데도 말이죠.
그래서 이 시간을 확보하고 제 스스로 여기에 더 투자하고 싶은 욕심이 더 커져가는 요즘입니다. 아직 부족한 저의 실력을 커버하기 위해 코드 공부도 이론 공부에 대한 욕망이 아주아주 커져가고 있습니다. 게다가 최근 KCCV 라는 학회 참석으로 세상이 아주 넓고 나는 아주 작다를 느끼고 있는 사람으로써 조급함이 생겨버렸습니다.
하지만, 앞서 얘기한 저의 꾸준함을 발판삼을 수 밖에 없습니다. 저는 요령이란 걸 모르는 사람인지라 무식하다고 할 수 있지만 차근차근 배워서 올라가야합니다. 그래서 이번학기 연구 스택 향상에 몰빵하도록 저의 모든 신경을 조율해봐야겠습니다.
앞으로의 다짐은?
이번 학기 저에게는 2가지의 목표가 있는데요. (1) 다크데이터의 성공적인 마무리 (2) 나만의 연구를 찾고 달려보기.
일단 저는 9월 중으로 다크데이터 과제에서 요구하는 실적을 빠른 시일 내에 @황유진 연구원과 마무리하려고 합니다. 최근 워크샵에서 시연 영상에 대한 수정 제출이라는 이벤트가 또 생겨버렸지만, 해낼 수 있습니다. 과제의 성공적인 마무리를 위해서 해야할 일이니까요. 워크샵 전까지는 추석을 기점으로 실적을 완료하는 것을 목표로 했었었었었었었(?)지만, 이 계획은 아쉽게도 약간의 수정이 필요할 것 같습니다. 그래도. 곧 죽어도. 9월 중으로 반드시 완료하도록 달려보겠습니다.
다음으로, 가장 중요한 연구파트입니다. 인간의 뇌는 실제로 어떤 결론을 내릴 때, 한 가지의 정보만을 사용하지는 않다는 것을 모두 아실 겁니다. 기존에 알고있던 굳이 정의내리지 않더라도 암묵적으로 알고 있는 암묵지, 혹은 서로 다른 도메인의 데이터, 그 외의 쏟아지는 많은 정보를 고려합니다. 이런 것을 근거로 많은 연구들이 점차 여러 도메인을 적용할 수 있도록 연구가 확장되고 있다는 것을 KCCV에서 또 새삼스럽게 깨달았는데요. Detection과 Captioning을 함께 사용하였더니 오히려 Detection 성능이 좋아지는 HOI(Human Object Interaction) 연구를 예로 들 수 있을 것 같습니다. 저는 이렇게 기존의 틀을 깨는 연구에 많은 관심이 가는 것 같습니다.
그래서 그런지 다크데이터 중간 워크샵에 집중하기 전 봤던 멀티 태스크 러닝 연구를 다시 살펴보려고 합니다. 멀티 태스킹 연구도 앞 단락에 설명한 것과 같은 맥락으로, 동시에 서로 다른 태스크를 학습하여 일반화된 성능을 끌어올리자는 것이 목표인데요. 그러나 해당 태스크는 최적화가 어렵습니다. 제가 이 최적화 이슈 굴레에 빠져 아직 디버깅 중이던 코드가 있는데, 이를 극복하기 위해 PCGrad 라는 Gradient Surgery 방식을 적용해보았지만 여전히 미궁이었습니다. 따라서 다크데이터로 인해 접어둔 이 연구를 다시 펼쳐 분석하고 연구해보려고 합니다. 정말 논문에서 제시한 Gradient Conflict가 발생하는지, 또 다른 문제는 없는지 제 스스로 분석해보고 해결하는 마침표를 찍어보려고 합니다.
이것 말고도, 올해 다크데이터에서 집중하고 있는 데이터 드리프트 문제를 해결하는 데에 솔루션으로 제안했던 TTT(Time Test Training) 이라는 태스크를 다시 살펴보고 싶기도 합니다. 해당 연구는 테스트 타임에도 모델을 업데이트하여, 인퍼런스 타임에 들어오는 새로운 도메인의 데이터에 대해서도 잘 적응해내지 않을까 하는 나이브한 생각입니다. 또한 MLOps의 관점과 다크데이터를 활용하는 데에 Active Learning 과 결합하면 괜찮을 사이클이 되지 않을까 하는 호기심이긴 하지만.. 아직 실행에 옮기기에는 해결해야할 산이 좀 많이 있습니다. 따라서 이건 앞서 정의한 문제를 더 연구한 뒤 견적을 봐야겠습니다.
부족한 저의 연구 스택을 올리기 위해서는 그동안과는 다르게 연구에 더 매진하고 몰두해야 합니다. 연구자로서 가장 큰 도약을 할 수 있는 한 학기가 될 수 있도록, 다음의 다짐을 가장 우선순위로 설정하려고 하는데요…
제가 살면서 가장 열심히 살았던 때를 꼽으라면, 재수 시절이라고 할 수 있습니다….ㅎ 그 때 저의 목표가 공부를 너무 열심한 탓에 수학 문제 풀다가, 갑자기 코피가 뚝뚝 떨어지는.. 그런 낭만(???) 이 있었는데요. (다들 그런 낭만 하나씩은 가슴에 품고 살잖아요) 그 친구를 다시 꺼내야겠습니다. 안타깝게도 저의 튼실한 코로 인해 살면서 코피 나본 적이 없어 목표 달성에 실패하였습니다. 허허
그리고 아주 큰 다짐이지만 내년 상반기 안으로 다크데이터 팀에서 메이저 컨퍼런스에 투고라도 하는 그런 학기가 될..수 있을까요 @황유진 연구원님? 서로 자극시키고 이끌어주는 그런 팀이 되기를 .. 기대해봅니다.. 한번 열심히 달려보겠습니다!
목표를 달성하는데 소요되는 시간은 사람마다 다릅니다. 포기하지만 않는다면 그대들이 원하는 그곳에 도착해 있을 겁니다. 꾸준함도 능력이지요. 건투를 빕니다.
꼭 투고를 해봅시다 ^^ 홍주영 연구원님 ㅎㅎ
코피나게 열심히 하는 모습으로 같이 임해봅시다 ^^