Computer Vision134 [2025-2] 최민서 - Proximal Policy Optimization Algorithms [논문링크] https://arxiv.org/abs/1707.06347 Proximal Policy Optimization AlgorithmsWe propose a new family of policy gradient methods for reinforcement learning, which alternate between sampling data through interaction with the environment, and optimizing a "surrogate" objective function using stochastic gradient ascent. Whereas standararxiv.org 1. Introduction 최근에 강화학습과 인공신경망을 융합하려는 시도가 진행되고 있다. 여.. 2025. 9. 4. [2025-2] 최민서 - 확산 모델의 수학 본 리뷰는 책 "확산 모델의 수학(오카노하라 다이스케)"의 리뷰이며 리뷰의 대부분의 내용은 책의 내용을 바탕으로 제작되었습니다. 보다 자세한 내용에 대해 알고 싶으시면 책을 직접 구입 후 읽어보시길 권장합니다. Chapter 1 생성 모델 에너지 기반 모델과 분배함수 책에서 메인으로 다루는 확산 모델은 생성 모델의 한 종류이다. 생성 모델이란 목표 도메인의 데이터를 생성하는 모델을 말한다. 책의 전반에서 원본 데이터 $\left\{ \mathbf{x}^{(1)}, \dots, \mathbf{x}^{(N)} \right\}$는 $p(\mathbf{x})$라는 미지의 확률분포로부터 서로 독립적으로 추출된 것이라고 하자. 또한 생성 모델은 $q_\theta (\mathbf{x})$라는 확률분포를 가진다. 확.. 2025. 8. 16. [2025-2] 전연주 - DiT: Scalable Diffusion Models with Transformers 논문 링크: 2212.09748깃허브 링크: facebookresearch/DiT: Official PyTorch Implementation of "Scalable Diffusion Models with Transformers" GitHub - facebookresearch/DiT: Official PyTorch Implementation of "Scalable Diffusion Models with Transformers"Official PyTorch Implementation of "Scalable Diffusion Models with Transformers" - facebookresearch/DiTgithub.comAbstract아이디어: 기존 Diffusion 모델은 U-Net을 backbone.. 2025. 8. 16. [2025-2] 황징아이 - One-Shot Free-View Neural Talking-Head Synthesis for Video Conferencing FaceVid2Vid 논문 : 2021년 CVPR Oral Paper (https://arxiv.org/pdf/2011.15126) Introduction코로나 때 줌과 같은 화상회의 플랫폼을 자주 사용하게 되었다. 하지만 인터넷 인프라가 부족하거나 Bandwidth가 부족한 환경에서는 영상이 뭉개지거나 지연되는 문제가 자주 발생했다. 이런 문제를 해결하기 위해, 본 논문은 단 한 장의 얼굴 이미지만으로 실제처럼 말하는 영상을 생성하는 방법을 제안한다. 기존의 얼굴 합성 (synthesizing) 방식은 크게 두 가지로 나눌 수 있다:3D 기반 모델 : 얼굴의 입체 구조를 잘 반영하지만 학습 비용이 높고 복잡하다2D 기반 모델 : 학습 효율은 좋지만 입체적인 정보를 보존하지 못해 대부분 정면 얼굴에만 국.. 2025. 7. 19. 이전 1 2 3 4 ··· 34 다음