Computer Vision37 [2023-2] 정성윤 Very Deep Convolutional Networks For Large-Scale Image Recognition 개요 VGGNet은 2014년 옥스포드 대학 연구팀 VGG에 의해 개발된 CNN 모델이다. AlexNet이후 VGG에 의한 성능 향상으로 컴퓨터 비전 분야에서는 CNN을 활용한 모델들이 본격적으로 나오기 시작했다. 이후 2015년 ResNet을 통해 컴퓨터 비전은 인간의 능력을 뛰어넘게 된다. ResNet에 대해선 다음주에 리뷰하고 발표할 예정이다. 이 논문의 주요 골자는 매우 작은 convolution 필터(3x3)를 이용해 매우 깊은 Layer의 학습을 해내는 것이다. 본 논문에서는 16에서 19 Layer까지 파고들게 된다. 배경 CNN은 많은 이미지가 저장된 이미지 저장소(예를 들면 ImageNet)이 생긴 덕분에 2014년 당시부터 비전 분야에서 성공을 거두기 시작한다. 그 과정에서 기존 구조에.. 2023. 12. 1. [2023-2] 주서영 - Very Deep Convolutional Networks For Large-Scale Image Recognition Very Deep Convolutional Networks for Large-Scale Image Recognition In this work we investigate the effect of the convolutional network depth on its accuracy in the large-scale image recognition setting. Our main contribution is a thorough evaluation of networks of increasing depth using an architecture with very small (3x arxiv.org Astract large-scale의 이미지 및 영상 인식에서 Convolution networks(ConvNets.. 2023. 11. 28. [2023-2] 박태호 - You Only Look Once: Unified, Real-Time Object Detection https://arxiv.org/abs/1506.02640 You Only Look Once: Unified, Real-Time Object Detection We present YOLO, a new approach to object detection. Prior work on object detection repurposes classifiers to perform detection. Instead, we frame object detection as a regression problem to spatially separated bounding boxes and associated class probabili arxiv.org Abstract - 객체 탐지 및 분류를 하나의 신경망으로 진행하는 YOLO.. 2023. 11. 28. [2023-2] 김경훈 - High-Resolution Image Synthesis with Latent Diffusion Models 원본 논문 링크 : https://arxiv.org/abs/2112.10752 High-Resolution Image Synthesis with Latent Diffusion Models By decomposing the image formation process into a sequential application of denoising autoencoders, diffusion models (DMs) achieve state-of-the-art synthesis results on image data and beyond. Additionally, their formulation allows for a guiding mechanism t arxiv.org 0. Abstract 이미지 형성 과정을 순차적.. 2023. 11. 25. 이전 1 ··· 6 7 8 9 10 다음