안녕하세요, 몇달 전에 작성한 논문이라 가물가물하지만.. 다시 읽어보니 CA 모듈에서 쿼리와 키를 내적으로 계산해 query-to-feature 유사도를 구하면(내적은 유사도를 구하는 연산이므로)…
attention, spatial, contacting 카테고리의 예측이라 함은, 3가지 다른 특성을 가진 별도의 relation embedding을 병렬로 예측해서 활용한다고 생각하시면 됩니다. Figure 2에서…
안녕하세요 재연님 읽어주셔서 감사합니다. Depth pro의 중요한 컨트리뷰션 중 하나로 depth boundaries 를 평가하기 위한 새로운 지표(metric) 세트를 제안하는데 이를…
안녕하세요 영규님 읽어주셔서 감사합니다. 물론 Patch Encoder도 전체 이미지를 1x1로 다운샘플리해서 하나의 patch로 입력받기 때문에 전역적인 정보를 어느 정도 포착할…
포기하지 않는 강한 집념 만이 작은 차이를 만든다.
기존에는 image 기반 scene graph가 활발하게 연구됐는데, 최근에는 video, 3d, depth와 같은 다른 모달리티에도 확장하려는 시도가 활발합니다. 아직 성능이 제한적이기는…