Computer Vision37 [2024-1] 김경훈 - PointNet: Deep Learning on Point Sets for 3D Classification and Segmentation Link : https://arxiv.org/abs/1612.00593 PointNet: Deep Learning on Point Sets for 3D Classification and SegmentationPoint cloud is an important type of geometric data structure. Due to its irregular format, most researchers transform such data to regular 3D voxel grids or collections of images. This, however, renders data unnecessarily voluminous and causes issues. In tarxiv.org 0. 개요Point cloud.. 2024. 4. 30. [2024-1] 주서영 - Don't Decay the Learning Rate, Increase the Batch Size Abstract 모델은 generalizaion(일반화)를 시키는 것이 목표인데 이 논문은 그 방법 중 학습률(learning rate)와 배치 크기(batch size)에 대해 다룬다. 일반적으로 학습률을 감소시키는 대신 훈련 중에 배치 크기를 증가시키는 방법을 제안했다. 최적화(Optimization) 방법 중 SGD, SGD momentum, Nesterov momentum, Adam을 쓸 때에 동등한 테스트 정확도를 달성하면서 배치 크기를 증가시킴에 따라 parameter 업데이트 수를 줄이고, 훈련 시간을 단축했다. 1. Introduction 확률적 경사 하강법(SGD)은 딥러닝에서 가장 널리 사용되는 최적화 기법이지만 큰 배치 크기로 훈련할 때 테스트 세트의 정확도가 떨어지는 일반화 문제가 .. 2024. 4. 12. [2024-1] 백승우 - You Only Watch Once: A Unified CNN Architecturefor Real-Time Spatiotemporal Action Localization You Only Watch Once: A Unified CNN Architecture for Real-Time Spatiotemporal Action Localization Spatiotemporal action localization requires the incorporation of two sources of information into the designed architecture: (1) temporal information from the previous frames and (2) spatial information from the key frame. Current state-of-the-art approache arxiv.org 0. Abstract Spatiotemporal action .. 2024. 4. 4. [2024-1] 김경훈 - MUNIT(Multi-Modal Unsupervised Image-to-Image translation) 원본 논문 링크 : https://arxiv.org/abs/1804.04732 Multimodal Unsupervised Image-to-Image Translation Unsupervised image-to-image translation is an important and challenging problem in computer vision. Given an image in the source domain, the goal is to learn the conditional distribution of corresponding images in the target domain, without seeing any pair arxiv.org 깃허브 https://github.com/NVlabs/MUNIT .. 2024. 3. 26. 이전 1 2 3 4 5 6 7 8 ··· 10 다음