본문 바로가기
  • 책상 밖 세상을 경험할 수 있는 Playground를 제공하고, 수동적 학습에서 창조의 삶으로의 전환을 위한 새로운 라이프 스타일을 제시합니다.

CV165

[2026-1] 김지원 - Denoising Diffusion Probabilistic Models 논문 소개 : Denoising Diffusion Probabilistic Models (DDPM)Jonathan Ho, Ajay Jain, Pieter Abbeel (UC Berkeley) · NeurIPS 2020arXiv: 2006.11239 · 공식 구현들어가며요즘 이미지 생성의 표준이 되어버린 디퓨전 모델, 그 출발점이 된 논문임. 사실 디퓨전 모델 자체는 2015년 Sohl-Dickstein et al.이 비평형 열역학(nonequilibrium thermodynamics)에서 아이디어를 빌려와 처음 제안했음. 다만 그때까진 "정의는 깔끔하고 학습도 잘 되는데, 정작 고품질 샘플을 만들어낸 적은 없는" 모델이었음.이 논문의 기여를 한 줄로 요약하면 이렇게 정리됨.디퓨전 모델이 실제로 GAN급,.. 2026. 6. 12.
[2026-1] 이루가 - What does CLIP know about a red circle? Visual prompt engineering for VLM 논문 링크: https://arxiv.org/abs/2304.06712 What does CLIP know about a red circle? Visual prompt engineering for VLMsLarge-scale Vision-Language Models, such as CLIP, learn powerful image-text representations that have found numerous applications, from zero-shot classification to text-to-image generation. Despite that, their capabilities for solving novel discriminativearxiv.org ABSTRACT이 논문은 CLIP .. 2026. 4. 25.
[2026-1] 정유림 - DataComp: In search of the next generation of multimodal datasets 논문 : https://arxiv.org/abs/2304.14108 DataComp: In search of the next generation of multimodal datasetsMultimodal datasets are a critical component in recent breakthroughs such as Stable Diffusion and GPT-4, yet their design does not receive the same research attention as model architectures or training algorithms. To address this shortcoming in the ML ecosarxiv.org 보통 머신러닝 benchmark는 데이터셋을 고정.. 2026. 4. 25.
[2026-1] 김지원 - Learning Transferable Visual Models From Natural Language Supervision 논문: Learning Transferable Visual Models From Natural Language Supervision (OpenAI, 2021)저자: Alec Radford, Jong Wook Kim, Chris Hallacy, et al.링크: arXiv | GitHub 들어가며 기존의 이미지 분류 모델(ResNet, EfficientNet 등)은 미리 정의된 클래스 집합 안에서만 예측이 가능함. ImageNet으로 학습된 모델은 1,000개의 클래스만 알며, 새로운 클래스를 추가하려면 또 다시 대규모의 라벨링 데이터가 요구됨. 이러한 제약된 형태의 지도 학습은 모델의 일반화 능력과 활용성을 크게 제한함. CLIP(Contrastive Language-Image Pre-training) .. 2026. 4. 18.