[arXiv]HDD-Net: Hybrid Detector Descriptor with Mutual Interactive Learning

위치 인식을 하기 [위해 영상의 local descriptor를 추출하는 것은 매우 중요한 부분이다. 따라서 R2D2[1], D2-Net[2[,DELF[3] 등 관련 논문들이 많이 나왔다. 이전 논문들을 통해 나온 가장 최근 work 를 가져 와봤다.

이 논문의 키포인트를 정리하면 밑과 같다.

Hard-mining Triplet Loss를 이용해 새로운 Detector를 위한 Loss를 설계했다.
다양한 크기와 Rotation를 고려하여 detector 와 descriptor를 학습 하는 새로운 방식을 제안한다.
Hand -crafted 방식과 CNN based 방식을 융합하여 Rotation과 scale 변환에 강인한 feature를 처음 제안했다.

1, 모델

]그림 2] Hand Crafted block, 이를 통해 rotation에 강인함을 얻는다.

1.model

[그림 3] Multi scale 을 위한 Decsitptor model

Descriptor 에 Scale 과 Rotation Robustness를 주기 위해 각 각 하나씩 방법을 고안 했다.

먼저 Rotation 에 Robustness를 주기 위해 [그림2] 와 같은 Handcrafted block 을 제안한다. 영상을 Rotation fitter를 통해 여러 영상을 만든 후 그것을 max pooling 하여 L2Net을 통해 Descriptor를 추출한다.

Scale에 Robustness를 주기 위해서 [그림 3] 과 같이 영상을 피라미드 형식으로 쌓운 후 각각을 Handcrafted block 과 L2-Net 을 적용해 Descriptor를 추출한다.

그리고 Detector는 현재 Repeatability에서 가장 좋은 성능을 나타내는 Key-Net[1]을 적용했다.

2. Triplet Loss

Triplet loss를 기존 영상끼리 사용하는 것과 달리 하나의 영상을 격자로 나눈후 격작끼리 Negative 와 Positive 로 나눠서 격자 속 Descriptor 끼리 metric learning을 진행한다.

Reference

[1]Key.Net: Keypoint Detection by Handcrafted and Learned CNN Filters
[2]HDD-Net: Hybrid Detector Descriptor with Mutual Interactive Learning

1 thought on “[arXiv]HDD-Net: Hybrid Detector Descriptor with Mutual Interactive Learning”

1. 회전에 강인함을 주기 위해 rotation filter로 이미지를 회전시키는 것이 핵심인것 같은데 어떤 것이 새로운 점인지 잘 모르겠습니다. 데이터 augmentation을 위해 다들 하고 있던게 아닌가요?
2. 이미지를 gird로 나눠 triplet loss를 하는 것은 알겠으나 그림 4에 나오는 s=1, s=2는 어떻게 적용되는건지 알고 싶습니다.

Leave a Reply Cancel reply

Jongmin Park says:

05/24/2020 at 21:17

1. 회전에 강인함을 주기 위해 rotation filter로 이미지를 회전시키는 것이 핵심인것 같은데 어떤 것이 새로운 점인지 잘 모르겠습니다. 데이터 augmentation을 위해 다들 하고 있던게 아닌가요?
2. 이미지를 gird로 나눠 triplet loss를 하는 것은 알겠으나 그림 4에 나오는 s=1, s=2는 어떻게 적용되는건지 알고 싶습니다.

안녕하세요, 영규님 좋은 리뷰 감사합니다. 생성형 이미지를 통해 로봇 Learning에 강건성을 부여하고자 하는 느낌이 신기했습니다. 그렇다면 이와 같은 설정에서, 물체의…

안녕하세요 주영님 좋은 리뷰 감사합니다. Engram 메모리는 자주 등장하는 N-gram 패턴을 저장하는 구조라서, 본질적으로 학습 데이터의 빈도 분포에 많은 영향을…

안녕하세요, 의철님 좋은 리뷰 감사합니다. retrieval head에 대한 설명이 매우 인상적이었습니다. 그렇다면 retrieval head가 활성화될수록 모델의 생성은 입력 컨텍스트에 더…

제가 예전부터 자세히 보려고 정리했던 논문 찜 해놨는데 딱 리뷰 하셨네요. 감사합니다. 그럼 결국 retrieval head를 항상 활성화 시키기 위해서는…

안녕하세요 성준님 좋은 리뷰 감사합니다. Where와 How 단계에서 저비용 탐색을 수행한다고 설명해주셨는데 구체적으로 어떤 연산을 줄여서 비용을 줄이는지 궁금합니다. 또한…

[arXiv]HDD-Net: Hybrid Detector Descriptor with Mutual Interactive Learning

Author: 한 대찬

1 thought on “[arXiv]HDD-Net: Hybrid Detector Descriptor with Mutual Interactive Learning”

Leave a Reply Cancel reply

Conference Deadline

NEW POST

New Comment