“내가 석사라니” 라는 조급함과 함께 시작한 학위기간이 끝나지 않을것같다가도 끝이 나버렸습니다. 정말 순식간이네요. 아직 2023년의 마무리에 미흡한 점이 많아 정리하기에는 정신이 없습니다만, x 다이어리를 기회 삼아 2023년에 저에게 있었던 빅 이슈 2가지를 되집어보겠습니다.
Big 1: (졸업 논문에 쓸 작고 소중한) 연구 주제를 찾아서
” 그래서 Active Learning 이 뭔데? “
” 딥러닝에서 사용되는 데이터의 효율성을 높이기 위한 기술로 고가치 데이터를 선별하기 위해 모델의 지식을 이용하는 방법이다. 크게 분포를 기반으로 데이터의 가치를 산출하는 방법과 모델의 데이터에 대한 불확실성을 기반으로 가치를 산출하는 방법이 있으며… “
” 그렇지.. 그래서 뭔데? 뭔데? 뭘 해야되는데? “
기술은 배지 위에 미생물처럼 변화를 거듭합니다(새로운것이 계속 생긴다는 뜻입니다). 석사 연구생으로서 저는 그 변화를 관측하는데로 벅찼었습니다.
관측이 아니라 실험을 해야했던 타이밍에 말이죠.
학위를 진행하려면, 발전하는 기술을 관측하고 팔로우하는것 뿐 만 아니라, 내가 해결하고자 하는 문제를 알아야합니다. Active Learning을 관측하는게 아니라, Active Learning에서 어떤 문제점을 내가 다루고싶은지 알아야합니다.
제가 느꼈던 연구와의 심적 거리감의 원인은 이것 같네요.
저는 “기계는 생각을 어떻게 할까?” 라는 궁금증의 답을 얻기 위해 학부연구생을 시작했습니다.
(제가 뇌과학에 관심이 있었다는걸 아마 다수의 동기분들은 알것입니다. 그 방향에서 확장한 생각이였네요)
문제에 대한 관측을 하고싶었던 거죠.
그런데 저놈의 문제가 생각보다 어려워서.. 관측을 한 이후에 해결하고 싶은 문제를 정의해야하는데, 아직까지도 저놈의 관측을 끝마치지 못했습니다. 덕분에 통계학의 개념으로 시작해서 XAI, GAN 다양한 분야를 헤매었습니다.
관측에는 어느 정도 만족을 하고 문제를 정의했다면 아마 연구와 더욱 친해졌을지도 모르겠네요.
어찌되었든 조원 연구원의 도움으로, 관측을 어떻게든 마치고 문제 정의에 들어갔습니다.
” 그래서.. 그만 보고.. 그럼 Active Learning의 뭘 다뤄야하는데? 아니 뭘 다룰 수 있지? “
” 우선 리소스와 기간(석사 기간의 50%를 이미 보내버린 시점)을 고려했을때, large scale dataset에 대한 접근은 어려울것같고,,,”
” 이것저것 고려해보니 내가 해결하고싶고, 해결할 수 있는 문제는, Active Learning 기술의 분석을 통해 더욱 안정적으로 작동하도록 만드는것에 대한거야! “
네.. 뭐 그 이후는 실험 열심히 하고, 열심히 정리해서 논문 작성하는것이였습니다. 여기에는 그동안 읽었던 논문들에 대한 지식 등이 필요하겠죠? 다른 훌륭한 연구원들이 해당 부분을 자주 언급하셨으니 해당 자료들을 보시면 좋을 것 같습니다. 석사 1년 차가 지나고 서야 겨우 작고 소중한 연구 주제를 발굴해냈었습니다.
해당 과정에서 제가 정리해드릴 수 있는 것은 아래와 같습니다.
첫째, 문제 정의를 하려고 노력하자. 혹시나, 내가 아무것도 모르는 것 같아도 계속 내 문제를 찾으려고 시도하자. 관측과 문제 정의는 병행해야 효과가 있다.
둘째, 문제 정의가 너무 광범위해서 어렵다면 내가 사용할 수 있는 리소스(GPU, 데이터 셋, 시간까지 모두 포함)를 기준으로 먼저 추려봐라.
하나 더 추천드리고 싶은 부분은, 혹시나 아직 연구 방향을 정하지 못한 석사생분들이라면 한 달정도에 한번 씩 문제 정의를 하는 날을 잡아, 마음먹고 추려보는것도 좋을것같네요.
물론 다들 잘 하고 계시는것같지만, 혹시나 하여 이렇게 제 시행착오에 대해 말씀드립니다.
Big 2: 내가 하고 싶었던 말은 뭘까?호랑이는 죽어서 가죽을 남기고 석사생은 죽어서 졸업논문을…
사실 2023년 하반기의 대부분은 졸업 준비를 위한 시간이였던것 같습니다.
저는 비교적 다양한 분야를 떠돌았기 때문에 졸업 논문의 주제를 하나로 통일시키기가 어려웠습니다.
그래서 제가 논문의 구성을 위해 중점을 두고 생각한 것은 “내가 연구생을 하면서 하고싶었던 말은?” 입니다.
저는 “사람이 어떻게 생각하는가”에 관심이 있었고
이에 확장하여 “기계가 어떻게 생각하는가”를 알기위해 시간을 보냈습니다
점차적으로 “사람과 기계가 생각하는건 개념적으로도 작동 방식 측면으로도 다르다” 라는 생각을 하게 되었고,
그때쯤에 “ㅇㅇ가 어떻게 생각하는가”의 질문에 대한 호기심은 사라졌었습니다.
이후에 하고싶었던 일은 “사람을 위한 머신러닝”을 다루는 것이였기에 해당 키워드를 표현할 수 있도록 작성하고자 했습니다. “사람을 위한 머신러닝”을 위해서는 실생활에 기술의 적용이 가능해야합니다. 이러한 생각을 기반으로 제 석사학위논문은 “A Study on Data Selection and Utilization Considering Real World Data Characteristics” 를 중심으로 정리됬습니다.
저에게 주어졌던 약 5년의 기간을 최대한으로 활용했다면, 멋지게 진행했던 연구 만을 정리하면 되겠지만
(아 근데,, 학부생이었으니 봐주세요 ㅋㅋ)
제가 하고싶은 말을 연구로는 다 못했다는 생각에 몸짓을 잔뜩 부풀려 약 100장 정도의 욕망덩어리가 탄생했습니다;;
사실 정말 제 욕심을 가득 담았기에 해당 과정에서 조언해 드릴 사항은 크게 없네요.. 썩 잘쓴지는 모르겠습니다.
그래도 졸업논문 작성에 대해 제가 드릴 수 있는 말을 정리하자면
첫째, “내가 연구를 하며 하고싶은 말은 무엇인가” 를 생각하며 쓰면 작성 방향을 잡기 쉽다.
둘째, 가능하면 6개월 전 쯤 부터 긴장하고 시작하자. 보통 12월에 심사가 있으니 계산해보시길.
이외에도 다크데이터 과제와 연구를 진행하며 다사로웠던 2023년 이였습니다. 일은 많았지만 즐겁게 한 해를 보낼 수 있게 도와준 옆자리의 홍주영 연구원님과 모든 연구실 구성원들께 감사드리며 남은 이야기는 금일 세미나에서 뵙겠습니다.
아! 앞으로의 계획은 역시 사람을 위한 일을 하고싶습니다. 특히 “사람의 즐거움”에 관심이 있습니다. 그런데… 우선 시장이 좋지않기도 하고 다양한 이유로 살짝 손을 놓았었습니다. 아무쪼록 정신차려서 좋은소식 들려드리면 좋겠습니다~