Author: 황 찬미
[CVPR 2023] Align and Attend Multimodal Summarization With Dual Contrastive Losses
황 찬미 11/03/2025 6 Comments on [CVPR 2023] Align and Attend Multimodal Summarization With Dual Contrastive Losses
안녕하세요 황찬미입니다. 오늘 살펴볼 논문은 비디오 요약 task에서 multimodel summarization의 문제를 다루는 논문입니다. 동영상이 인풋으로 들어왔을때 통합모델 하나로 텍스트도 요약하고 비디오도 요약할수 있는 MSMO(Multimodal Summarization…
[ICML 2021] Learning Transferable Visual Models From Natural Language Supervision
황 찬미 10/13/2025 3 Comments on [ICML 2021] Learning Transferable Visual Models From Natural Language Supervision
< Intro > 1. Zero-shot image classification 제로샷 이미지 분류는 한마디로 말하자면 학습데이터에 존재하지 않는 새로운 class에 대해 classification을 할수 있는 기술을 말합니다전통적인 이미지 분류에서는…
[ECCV 2020] End-to-End Object Detection with Transformers
안녕하세요 황찬미입니다 !두번째 x-review로 transformer를 ODtask로 사용한 DETR에 대해서 리뷰하겠습니다! 1. Intro Faster R-cnn과 같은 전통적인 OD모델은 앵커박스나 region proposal같은 엄청나게 많은 후보박스를 만들고 그…
Improving Language Understanding by Generative Pre-Training
안녕하세요 황찬미입니다.첫 x-review로 GPT1에 대한 논문을 리뷰해보고자 합니다. 9월이 된 후로 LLM관련된 내용을 공부하는 중인데 대학생활을 함께한 GPT가 몇번이고 언급되길래 이 GPT…과연 어떻게 태어나게 된…
Posted in X-Diary
[2025-하계][황찬미] URP를 마치며
안녕하세요. 이번 동계 urp프로그램에 참여한 황찬미입니다. 저는 이 기간동안 배운 점들과 앞으로 URP에 참여할 후배들에게 전하고 싶은 이야기를 후기에 담아보았습니다. [URP 참여 후기] 저는 이미…
안우현 연구원님 안녕하세요, 하나씩 답변 드리도록 하겠습니다. 1. 논문에 백본 네트워크와 트랜스포머 인코더/디코더 모듈의 초기화 방법은 설명되어 있지만, CMM module의…