Author: rcvlab
[ICCV 2023] SurroundOcc: Multi-camera 3D Occupancy Prediction for Autonomous Driving
안녕하세요. 오늘 review할 논문은 ICCV 2023에 게재된 SurroundOcc: Multi-camera 3D Occupancy Prediction for Autonomous Driving입니다. 리뷰를 시작하기 전에 본 논문이 하고자 하는 것을 간단히 소개드리자면,…
[arXiv 2024] Introducing HOT3D: An Egocentric Dataset for 3D Hand and Object Tracking
안녕하세요, 이번에는 새로운 BOP challenge 벤치마크 데이터셋이 나와 리뷰를 해보았습니다. 지금은 comming soon으로 표기가 되어있습니다. Meta에서 만든 데이터셋이고, 2024년부터 tracking 테스크에 대해서도 평가가 가능하도록 만들어진…
2024 상반기 회고@양희진
Intro 벌써 어느덧 2024년의 절반이 지나갔네요. 작년 이맘때의 저는 졸업을 앞두고 있었고 그때가 생각나는 무더운 더위가 다시 한 번 찾아왔습니다. 시간은 제가 생각했던 것 보다…
[arXiv 2024] Zero123-6D: Zero-shot Novel View Synthesis for RGB Category-level 6D Pose Estimation
안녕하세요, 이번에는 6D pose estimation 테스크 중 category-level object pose estimation 관련 논문을 읽어보았습니다. 이번 Zero123-6D는 제목이 좀 특이 하긴 하네요. 이름을 왜 저렇게 지었는지는…
[IROS 2023] HANDAL: A Dataset of Real-World Manipulable Object Categories with Pose Annotations, Affordances, and Reconstructions
안녕하세요, 이번에는 Bop Challenge에서 새롭게 추가된 HANDAL을 읽어보았습니다. NVIDIA는 데이터셋도 참 잘 만드네요.. 데이터를 취득하는 과정 중에 애플 제품으로 무언가를 하는 게 좀 특이하네요. 자세한 방법은…
[RAL 2022]TransDSSL: Transformer Based Depth Estimation via Self-Supervised Learning
안녕하세요! 조현석연구원 입니다. 오늘 소개시켜드릴 논문은 신입 교육기간 동안 다룬 Self-Supervised Monocular Depth Estimation Task의 마지막 일정인 TransDSSL입니다. 본 논문은 RAL 2022년에 게재된 것으로 저희…
[arXiv 2024] PS6D: Point Cloud Based Symmetry-Aware 6D Object Pose Estimation in Robot Bin-Picking
안녕하세요, 이번에는 instance-level에 속하는 6D pose estimation 관련 논문을 읽어보았습니다. 기존 리뷰 했던 내용들은 주로 RGB/RGB-D를 사용하는 방법론이었는데, PS6D 같은 경우는 포인트 클라우드만을 입력으로 사용하여…
[CVPR 2024] MRC-Net: 6-DoF Pose Estimation with MultiScale Residual Correlation
안녕하세요, 이번에는 Amazon에서 제안한 instance-level 6D pose estimation 논문을 읽어보았습니다. 최근 큰 기업들이 6D와 관련된 분야에 관심을 많이 보이는 것 같습니다. 이번 논문은 단일 RGB…
[IEEE]MonoViT: Self-Supervised Monocular Depth Estimation with a Vision Transformer
안녕하세요, 오늘 소개할 논문은 “MonoViT: Self-Supervised Monocular Depth Estimation with a Vision Transformer”입니다. 해당 논문은 처음으로 self-supervised monocular depth estimation이라는 테스크에 ‘Vision Transformer(ViT)의 Multihead self-attention(MHSA)을…
[CVPR 2024] HiPose: Hierarchical Binary Surface Encoding and Correspondence Pruning for RGB-D 6DoF Object Pose Estimation
안녕하세요, 이번에 리뷰할 논문은 오래간만에 instance-level에서의 6D pose estimation 방법론입니다. 선행 연구로 제안된 ZebraPose의 문제점들을 해결하기 위해 제안된 방법론으로, binary encoding을 통해 pose를 추정하는 신박한 방법론입니다….
최신 댓글