PARTICULAR OBJECT RETRIEVAL WITH INTEGRAL MAX-POOLING OF CNN ACTIVATIONS (R-MAX)

논문 요약 : CNN을 통해 search와 re-ranking을 했다. (Oxford5k와 Paris6K datasets으로 검증)

Main idea

CNN을 통해서 multiple image region을 추론할때 re-feed 없이 encode한다.
Max-pooling을 사용한다.
localization할때 re-ranking 과 leads 할때 simple yet effective query expansion방법을 사용한다.

Maximum activations of convolutions (MAC)

R-MAC: regional maximum activation of convolutions

Region feature vector : 앞에서 설명한 feature vector에서 rectangular region의 정보를 얻기위해 Region feature vector를 정의한다.

Region feature vector

해당 방법으로 original image로부터 region에대한 정보를 linear하게 고려 한다.

R-mac

scale 조정

OBJECT LOCALIZATION

Approximate integral max-pooling

Figure3에서 Approximation error이며 이를 통해 유사한이미지의 region을 예측한다.

AML: approximate max-pooling localization

안녕하세요, 석준님. 좋은 리뷰 감사합니다. 제가 이해한 바로는 본 논문이 LiDAR와 카메라 뷰 간의 정렬(FOV 및 viewpoint alignment)을 맞춰가는 방법론을…

리뷰 잘 읽었습니다. TR²는 기본적으로 t-1과 t 사이의 relation feature difference에 집중하는 것 같습니다. 여기서 궁금한 점이 생기는데, relation 변화가…

안녕하세요, 우진님. 좋은 논문 리뷰 감사합니다. 제가 결과적으로 이 논문을 이해했을 때는 그리퍼와 포즈 추정 오차에 대한 관계를 실험해보는 논문이라고…

리뷰 잘 읽었습니다. 20~40 layer가 핵심이라는 결과는 흥미로운데, 읽다 보면 이런 궁금함이 생기는데요, 왜 하필 중간 레이어에서 시각 정보가 언어로…

댓글 감사합니다. 사실 있어야 당연하다고 생각하는데,, VCTF 모듈 절제실험이 없습니다..허허 저자가 숨기고 싶었던걸까요 (생각보다 향상폭이 낮아서?) 그리고 풀링 기법들에 대한…

Conference Deadline