전체 글301 [2025-1] 정성윤 - Very Deep Convolutional Networks for Large scale image recognition https://troubled-popcorn-a03.notion.site/Very-Deep-Convolutional-Networks-for-Large-scale-image-recognition-17e392d1016e80d09e3ee0b24d624822CNN신경 다발(Connection)을 잘 끊어낸다.위치별 특징을 추출함 : 위치의 정보는 유지한 채로 특정 패턴(특징)을 찾는다.모든 픽셀들의 연결 = Connection 3 X (3 X 100 X 100) ⇒ 총 9만개정해진 Weight Set으로 데이터 값들을 긁어낸다.가까이 있는 값들만 연결 → 위치 정보를 잃지 않음 → 담당 노드라는 “의미”가 생김Kernel(Filter) + bias : 스캔을 통해 필터와 비슷한 특징(패턴)을 찾는다(내적)CNN.. 2025. 1. 18. [2025-1] 임재열 - Swin Transformer Swin Transformer는 2021년 Ze Liu 등이 제안한 모델입니다. [Swin Transformer]https://arxiv.org/abs/2103.14030 Swin Transformer: Hierarchical Vision Transformer using Shifted WindowsThis paper presents a new vision Transformer, called Swin Transformer, that capably serves as a general-purpose backbone for computer vision. Challenges in adapting Transformer from language to vision arise from differences between.. 2025. 1. 18. [2025-1] 황징아이 - Scalable Diffusion Models with Transformers AbstractTransformer 아키텍쳐에 Diffusion을 접목 시킨 논문.기존 LDM (Latent Diffusion Model에서는 U-Net을 사용했다. 그러나 U-Net의 Inductive Bias가 Diffusion Model의 성능에 중요하지 않아서 Standard design인 Transformer를 사용.Diffusion Transformer (DiT)를 제시했다. 이는 기존의 Convolutional Network (e.g. ResNet)보다 시각적 인식에 더 효율적으로 확장할 수 있는 Vision Transformer(ViT)를 참고했다.또한, 저자는 Scaling behavior of transformers with respect to network complexity vs. .. 2025. 1. 18. [2025-1] 이루가 - A Study on the Impact of Noise on YOLO-based Object Detection in Autonomous Driving Environments 논문링크: https://www.dbpia.co.kr/journal/articleDetail?nodeId=NODE11954529 Abstract자율주행 환경에서 노이즈가 적용되는 비율에 따라 객체를 인식하는 것에 어느 정도의 영향을 미치는 지 수치화가공하지 않은 데이터셋으로 학습한 YOLO v5 모델 사용 I. Introduction자율주행 자동차의 카메라는 악천후 조건 등에서 오는 신호의 흡수 또는 반사 강한 태양광을 받는 환경의 경우 카메라에서 얻은 데이터의 왜곡이 일어남다양한 상황에서 발생할 수 있는 노이즈가 자율주행을 위한 객체 인식에 어느 정도의 영향을 미치는지 확인전처리 하지 않은 Train data를 사용하여 YOLO 모델을 학습하고 각각 0%(original), 20%, 40%, 60%, .. 2025. 1. 18. 이전 1 ··· 37 38 39 40 41 42 43 ··· 76 다음