[arXiv]HDD-Net: Hybrid Detector Descriptor with Mutual Interactive Learning

위치 인식을 하기 [위해 영상의 local descriptor를 추출하는 것은 매우 중요한 부분이다. 따라서 R2D2[1], D2-Net[2[,DELF[3] 등 관련 논문들이 많이 나왔다. 이전 논문들을 통해 나온 가장 최근 work 를 가져 와봤다.

이 논문의 키포인트를 정리하면 밑과 같다.

Hard-mining Triplet Loss를 이용해 새로운 Detector를 위한 Loss를 설계했다.
다양한 크기와 Rotation를 고려하여 detector 와 descriptor를 학습 하는 새로운 방식을 제안한다.
Hand -crafted 방식과 CNN based 방식을 융합하여 Rotation과 scale 변환에 강인한 feature를 처음 제안했다.

1, 모델

]그림 2] Hand Crafted block, 이를 통해 rotation에 강인함을 얻는다.

1.model

[그림 3] Multi scale 을 위한 Decsitptor model

Descriptor 에 Scale 과 Rotation Robustness를 주기 위해 각 각 하나씩 방법을 고안 했다.

먼저 Rotation 에 Robustness를 주기 위해 [그림2] 와 같은 Handcrafted block 을 제안한다. 영상을 Rotation fitter를 통해 여러 영상을 만든 후 그것을 max pooling 하여 L2Net을 통해 Descriptor를 추출한다.

Scale에 Robustness를 주기 위해서 [그림 3] 과 같이 영상을 피라미드 형식으로 쌓운 후 각각을 Handcrafted block 과 L2-Net 을 적용해 Descriptor를 추출한다.

그리고 Detector는 현재 Repeatability에서 가장 좋은 성능을 나타내는 Key-Net[1]을 적용했다.

2. Triplet Loss

Triplet loss를 기존 영상끼리 사용하는 것과 달리 하나의 영상을 격자로 나눈후 격작끼리 Negative 와 Positive 로 나눠서 격자 속 Descriptor 끼리 metric learning을 진행한다.

Reference

[1]Key.Net: Keypoint Detection by Handcrafted and Learned CNN Filters
[2]HDD-Net: Hybrid Detector Descriptor with Mutual Interactive Learning

1 thought on “[arXiv]HDD-Net: Hybrid Detector Descriptor with Mutual Interactive Learning”

1. 회전에 강인함을 주기 위해 rotation filter로 이미지를 회전시키는 것이 핵심인것 같은데 어떤 것이 새로운 점인지 잘 모르겠습니다. 데이터 augmentation을 위해 다들 하고 있던게 아닌가요?
2. 이미지를 gird로 나눠 triplet loss를 하는 것은 알겠으나 그림 4에 나오는 s=1, s=2는 어떻게 적용되는건지 알고 싶습니다.

Leave a Reply Cancel reply

Jongmin Park says:

05/24/2020 at 21:17

1. 회전에 강인함을 주기 위해 rotation filter로 이미지를 회전시키는 것이 핵심인것 같은데 어떤 것이 새로운 점인지 잘 모르겠습니다. 데이터 augmentation을 위해 다들 하고 있던게 아닌가요?
2. 이미지를 gird로 나눠 triplet loss를 하는 것은 알겠으나 그림 4에 나오는 s=1, s=2는 어떻게 적용되는건지 알고 싶습니다.

안녕하세요 기현님, 좋은 리뷰 감사합니다! action chunking에서 매 타임스텝마다 k 스텝의 청크 단위의 액션을 예측하고, 지수 가중치 방식을 통해 하나의…

안녕하세요 정의철 연구원님 좋은 리뷰 감사합니다. 생각치 못한 관점에서의 접근이라 흥미롭게 읽었습니다. retrieval head가 활성화되면 모델이 입력에 근거한 답을 내는…

안녕하세요 이재윤 연구원님, 첫 리뷰 재밌게 읽었습니다. CLIP의 perception 능력만으로도 VSR을 잘 풀 수 있는 것을 두번째 논문이 보여주며 잘…

안녕하세요, 영규님 좋은 리뷰 감사합니다. 생성형 이미지를 통해 로봇 Learning에 강건성을 부여하고자 하는 느낌이 신기했습니다. 그렇다면 이와 같은 설정에서, 물체의…

안녕하세요 주영님 좋은 리뷰 감사합니다. Engram 메모리는 자주 등장하는 N-gram 패턴을 저장하는 구조라서, 본질적으로 학습 데이터의 빈도 분포에 많은 영향을…

[arXiv]HDD-Net: Hybrid Detector Descriptor with Mutual Interactive Learning

Author: 한 대찬

1 thought on “[arXiv]HDD-Net: Hybrid Detector Descriptor with Mutual Interactive Learning”

Leave a Reply Cancel reply

Conference Deadline

NEW POST

New Comment