Computer Vision133 [2025-2] 최민서 - 확산 모델의 수학 본 리뷰는 책 "확산 모델의 수학(오카노하라 다이스케)"의 리뷰이며 리뷰의 대부분의 내용은 책의 내용을 바탕으로 제작되었습니다. 보다 자세한 내용에 대해 알고 싶으시면 책을 직접 구입 후 읽어보시길 권장합니다. Chapter 1 생성 모델 에너지 기반 모델과 분배함수 책에서 메인으로 다루는 확산 모델은 생성 모델의 한 종류이다. 생성 모델이란 목표 도메인의 데이터를 생성하는 모델을 말한다. 책의 전반에서 원본 데이터 $\left\{ \mathbf{x}^{(1)}, \dots, \mathbf{x}^{(N)} \right\}$는 $p(\mathbf{x})$라는 미지의 확률분포로부터 서로 독립적으로 추출된 것이라고 하자. 또한 생성 모델은 $q_\theta (\mathbf{x})$라는 확률분포를 가진다. 확.. 2025. 8. 16. [2025-2] 전연주 - DiT: Scalable Diffusion Models with Transformers 논문 링크: 2212.09748깃허브 링크: facebookresearch/DiT: Official PyTorch Implementation of "Scalable Diffusion Models with Transformers" GitHub - facebookresearch/DiT: Official PyTorch Implementation of "Scalable Diffusion Models with Transformers"Official PyTorch Implementation of "Scalable Diffusion Models with Transformers" - facebookresearch/DiTgithub.comAbstract아이디어: 기존 Diffusion 모델은 U-Net을 backbone.. 2025. 8. 16. [2025-2] 황징아이 - One-Shot Free-View Neural Talking-Head Synthesis for Video Conferencing FaceVid2Vid 논문 : 2021년 CVPR Oral Paper (https://arxiv.org/pdf/2011.15126) Introduction코로나 때 줌과 같은 화상회의 플랫폼을 자주 사용하게 되었다. 하지만 인터넷 인프라가 부족하거나 Bandwidth가 부족한 환경에서는 영상이 뭉개지거나 지연되는 문제가 자주 발생했다. 이런 문제를 해결하기 위해, 본 논문은 단 한 장의 얼굴 이미지만으로 실제처럼 말하는 영상을 생성하는 방법을 제안한다. 기존의 얼굴 합성 (synthesizing) 방식은 크게 두 가지로 나눌 수 있다:3D 기반 모델 : 얼굴의 입체 구조를 잘 반영하지만 학습 비용이 높고 복잡하다2D 기반 모델 : 학습 효율은 좋지만 입체적인 정보를 보존하지 못해 대부분 정면 얼굴에만 국.. 2025. 7. 19. [2025-2] 전윤경 - Brain Tumor Segmentation with Deep Neural Networks DNN 기반 완전 자동 뇌 종양 분할 방법( MRI 이미지 교모세포종)지역적 특징과 global한 문맥적 특징을 동시에 활용최종 레이어: 완전 연결된 레이어의 합성곱 구현을 사용2단계 훈련 절차 CNN 합성곱 신경망 접근법 데이터셋각 2D 축 이미지(슬라이스)를 순차적으로 처리각 픽셀은 T1, T2, T1C, FLAIR과 같은 서로 다른 이미지 방식에 연결1. 커널(필터) 합성곱X: 입력 채널Ws: 하위 커널 2. 비선형 활성화 함수(Maxout 비선형성)공간 위치에 대해 특징 맵 O에서 최대값을 취함3. Max pooling: 각 특징 map 내의 서브 윈도우에서 최대 특징 값 마지막 합성곱 레이어를 합성곱 출력 레이어에 연결->소프트맥스 비선형성->레이블에 대한 다항 분포로 정규화 TwoPathC.. 2025. 7. 18. 이전 1 2 3 4 ··· 34 다음