Computer Vision135 [2025-1] 전연주 - VoteNet: Deep Hough Voting for 3D Object Detection in Point Clouds 논문 링크: 1904.09664저자:Charles R. Qi (Facebook AI Research)Or Litany (Facebook AI Research)Kaiming He (Facebook AI Research)Leonidas J. Guibas (Facebook AI Research, Stanford University)발행일: 2019. 08. 221. Introduction3D 객체 탐지의 핵심 목표는 3D 장면에서 객체를 찾아(3D 바운딩 박스) 분류(semantic class)하는 것이다. 이미지를 통한 2D 객체 탐지와 달리, 포인트 클라우드(point cloud)는 객체의 정확한 기하학 정보를 직접 제공하므로 조명 변화 등에 강인한 장점이 있다. 하지만 포인트 클라우드는 불규칙(spars.. 2025. 2. 26. [2025-1] 박서형 - DemoFusion: Democratising High-Resolution Image Generation With No $$$ https://arxiv.org/abs/2311.16973 DemoFusion: Democratising High-Resolution Image Generation With No $$$High-resolution image generation with Generative Artificial Intelligence (GenAI) has immense potential but, due to the enormous capital investment required for training, it is increasingly centralised to a few large corporations, and hidden behind paywallsarxiv.org 1. Abstracthigh-resolution im.. 2025. 2. 22. [2025-1] 임수연 - Mask R-CNN https://arxiv.org/abs/1703.06870 Mask R-CNNWe present a conceptually simple, flexible, and general framework for object instance segmentation. Our approach efficiently detects objects in an image while simultaneously generating a high-quality segmentation mask for each instance. The method, calledarxiv.org안녕하세요, 이번 글에서는 Kaiming He의 Mask R-CNN(2017) 논문 리뷰를 해보도록 하겠습니다. 1. introductionObject Detect.. 2025. 2. 22. [2025-1] 전윤경- Multimodal Unsupervised Image-to-Image Translation Introduction비지도 image-to-image translation : 이미지 pairing 없이도 소스 이미지에서 타겟 스타일로 변환MUNIT: 입력 이미지가 있으면 여러 가지 스타일로 변환 가능 가정1. 이미지의 잠재 공간-> 콘텐츠 공간(content space), 스타일 공간(style space) 으로 분해2. 서로 다른 도메인의 이미지들은 공통된 콘텐츠 공간 을 공유하지만, 스타일 공간은 공유하지 않음3. 소스 이미지를 타겟 도메인으로 변환할 때, 콘텐츠 코드를 유지한 채, 타겟 스타일 공간에서 무작위로 샘플링한 스타일 코드와 결합 콘텐츠(content): 이미지의 기본적인 공간적 구조스타일(style): 콘텐츠의 렌더링 방식콘텐츠 코드(content code) : 변환 과정에서 보.. 2025. 2. 21. 이전 1 ··· 8 9 10 11 12 13 14 ··· 34 다음