1,2차:SSD 논문 원복 하며 디버깅하면서 코드 오류 잡기
3차:backbone을 VGGNet에서 EfficientNet으로 바꾸어 backbone변화에 따른 성능 변화 리포팅
시도한 step
1. normalize&width scaling
2. resolution scaling
3.FPN
4. deconvolution
Result

1,2차:SSD 논문 원복 하며 디버깅하면서 코드 오류 잡기
3차:backbone을 VGGNet에서 EfficientNet으로 바꾸어 backbone변화에 따른 성능 변화 리포팅
시도한 step
1. normalize&width scaling
2. resolution scaling
3.FPN
4. deconvolution
Result

질문 감사합니다. φ_db와 φ_llm을 곱하는 게 아니 더하는 등의 다양한 조합에 대해서는 논문에 따로 언급하고있지 않습니다. (Supplementary Material에도 따로 없네요)…
안녕하세요 우진님 댓글 감사합니다. 리뷰에서 말씀드렸다 싶이 예를들어 어떤 샘플이 현재 이미지 + 언어 프롬프트만 있고 2D 포즈/goal image가 없다면,…
좋은 질문 감사합니다. q–v를 각각 평가하거나 q와 여러 비디오를 한 번에 비교하는 방식은 계산적으로는 효율적이겠지만, LLM이 각 비디오를 절대적인 기준으로…
좋은 질문 감사합니다. X-CoT를 단순히 백본 모델의 오답을 고치는 '교정기' 라기보다는, 임베딩 유사도만으로는 잘 드러나지 않는 차이를 비교해 주는 보완…
안녕하세요 승현님, 좋은 리뷰 감사합니다! compatibility를 구할때 db 기반 점수와 llm 기반 점수의 곱을 사용한 이유가 llm이 가진 편향의 영향을…
포기하지 않는 강한 집념 만이 작은 차이를 만든다.