분류 전체보기264 [2025-1] 전윤경- Multimodal Unsupervised Image-to-Image Translation Introduction비지도 image-to-image translation : 이미지 pairing 없이도 소스 이미지에서 타겟 스타일로 변환MUNIT: 입력 이미지가 있으면 여러 가지 스타일로 변환 가능 가정1. 이미지의 잠재 공간-> 콘텐츠 공간(content space), 스타일 공간(style space) 으로 분해2. 서로 다른 도메인의 이미지들은 공통된 콘텐츠 공간 을 공유하지만, 스타일 공간은 공유하지 않음3. 소스 이미지를 타겟 도메인으로 변환할 때, 콘텐츠 코드를 유지한 채, 타겟 스타일 공간에서 무작위로 샘플링한 스타일 코드와 결합 콘텐츠(content): 이미지의 기본적인 공간적 구조스타일(style): 콘텐츠의 렌더링 방식콘텐츠 코드(content code) : 변환 과정에서 보.. 2025. 2. 21. [2025-1] 최민서 - Denoising Diffusion Implicit Models [DDIM] https://arxiv.org/abs/2010.02502 Denoising Diffusion Implicit ModelsDenoising diffusion probabilistic models (DDPMs) have achieved high quality image generation without adversarial training, yet they require simulating a Markov chain for many steps to produce a sample. To accelerate sampling, we present denoising diffusionarxiv.org 본 논문은 Denoising Diffusion Probabilistic Models(DDPM)와 깊은 .. 2025. 2. 21. [2025-1] 주서영 - Flow matching for generative modeling Flow MatchingICLR 2023850회 인용1. Introduction본 논문은 Continuous Normalizaing Flows(CNF)를 시뮬레이션 없이(simulation-free) 효율적으로 훈련할 수 있는 학습 방법인 Flow Matching (FM)을 제시한다.2. Preliminaries : Continuous Normalizing FlowsNormalizaing Flow : 데이터 분포인 $x$에서 $z$로의 역변환이 가능한 Flow를 학습하는 모델Continuous Normalizing Flows(CNF) : 시간에 따른 vector filed를 학습하여 ODE를 통해 확률 분포를 변환하는 생성 모델$\mathbb{R}^d$데이터 포인트 $x=(x^1,\cdots,x^d)\i.. 2025. 2. 20. [25-1] 박지원 - Deep-Emotion: Facial Expression RecognitionUsing Attentional Convolutional Network Original paper ) https://arxiv.org/abs/1902.01019 Deep-Emotion: Facial Expression Recognition Using Attentional Convolutional NetworkFacial expression recognition has been an active research area over the past few decades, and it is still challenging due to the high intra-class variation. Traditional approaches for this problem rely on hand-crafted features such as SIFT, HOG and LBP, foarxiv.or.. 2025. 2. 19. 이전 1 ··· 12 13 14 15 16 17 18 ··· 66 다음