CV160 [2025-1] 전연주 - LDM: High-Resolution Image Synthesis with Latent Diffusion Models 논문 링크: 2112.10752AbstractDiffusion Model은 고품질 이미지 생성에 탁월하지만, pixel space에서 직접 학습할 때 막대한 계산량과 시간이 소요된다본 논문에서는 먼저 사전 학습된 강력한 Autoencoder를 사용해 이미지를 latent space로 압축한 뒤, 해당 공간에서 Diffusion Model을 학습하는 방안(Latent Diffusion Model, LDM)을 제안한다.이 방식은 기존 pixel space 기반 Diffusion 대비 학습 비용과 inference(sampling) 비용을 크게 절감함과 동시에, 다양한 조건(예: 텍스트, 세그멘테이션 맵 등)을 유연하게 적용할 수 있다.또한 cross-attention layers를 모델 구조에 통합함으로써,.. 2025. 1. 17. [2025-1] 박경태 - Low-Resolution Object Recognition with Cross-Resolution Relational Contrastive Distillation https://arxiv.org/abs/2409.02555?utm_source=chatgpt.com Low-Resolution Object Recognition with Cross-Resolution Relational Contrastive DistillationRecognizing objects in low-resolution images is a challenging task due to the lack of informative details. Recent studies have shown that knowledge distillation approaches can effectively transfer knowledge from a high-resolution teacher model to a lo.. 2025. 1. 17. [2025-1] 최민서 - Generative Modeling by Estimating Gradients of the Data Distribution https://arxiv.org/abs/1907.05600 Generative Modeling by Estimating Gradients of the Data DistributionWe introduce a new generative model where samples are produced via Langevin dynamics using gradients of the data distribution estimated with score matching. Because gradients can be ill-defined and hard to estimate when the data resides on low-dimensionalarxiv.org 본 논문에서는 score 기반의 새로운 방식의 생성형 모델.. 2025. 1. 17. [2025-1] 유경석 - Road Extraction by Deep Residual U-Net https://arxiv.org/pdf/1711.10684AbstractRoad extraction은 원격 감지 이미지 분석 분야의 뜨거운 연구 주제Residual learning과 U-Net의 결합 구조를 통해 Road extraction 수행 1) Residual unit은 Deep network의 training이 더욱 쉽게 이루어지도록 함.2) Skip connection은 information propagation을 통해, 더 적은 parameter로 더 좋은 성능을 보임.Public road dataset을 분석하는 연구에서, 다른 network에 비해 ResUNet이 더 좋은 성능을 보였음. 1. IntorductionRoad extraction원격 감지 분야의 대표적인 기술로, 자동화 네비.. 2025. 1. 17. 이전 1 ··· 22 23 24 25 26 27 28 ··· 40 다음