본문 바로가기
  • 책상 밖 세상을 경험할 수 있는 Playground를 제공하고, 수동적 학습에서 창조의 삶으로의 전환을 위한 새로운 라이프 스타일을 제시합니다.

Computer Vision108

[2025-1] 박지원 - InternVL Abstract (초록)InternVL은 60억 개의 파라미터를 가진 비전 인코더(이미지를 다루는 부분)와 80억 개의 파라미터를 가진 언어 미들웨어(언어를 다루는 부분)로 구성된 대규모 vision-language foundation 모델이다.이 모델은 웹에서 수집한 방대한 양의 이미지와 텍스트 데이터를 점진적으로 정렬하며 학습함으로써, 다양한 그림-글 관련 작업에서 성능과 효율을 극대화한 바 있으며 챗봇처럼 사람과 대화하는 기능에서도 뛰어난 성능을 보인다. 또 여러 그림-글 처리 작업에 유연하게 활용될 수 있는 구조를 가지고 있고 특히 다국어 언어 모델(LLaMA)을 언어 미들웨어 초기값으로 활용함으로써, 그림을 보는 능력과 말을 이해하는 능력 사이의 균형을 맞추고 표현 간 일관성을 확보했다는 장점이.. 2025. 4. 3.
[2025-1] 김유현 - Improved Training of Wasserstein GANs https://arxiv.org/abs/1704.00028 Improved Training of Wasserstein GANsGenerative Adversarial Networks (GANs) are powerful generative models, but suffer from training instability. The recently proposed Wasserstein GAN (WGAN) makes progress toward stable training of GANs, but sometimes can still generate only low-quality samplarxiv.org 0. AbstractGAN은 강력한 생성 모델이지만 학습 불안정성이 문제이다. WGAN은 학습 안정성을 개선했지.. 2025. 3. 22.
[2025-1] 유경석 - X-Recon: Learning-based Patient-specific High-Resolution CT Reconstruction from Orthogonal X-Ray Images https://arxiv.org/abs/2407.15356 X-Recon: Learning-based Patient-specific High-Resolution CT Reconstruction from Orthogonal X-Ray ImagesRapid and accurate diagnosis of pneumothorax, utilizing chest X-ray and computed tomography (CT), is crucial for assisted diagnosis. Chest X-ray is commonly used for initial localization of pneumothorax, while CT ensures accurate quantification. However, Carxiv... 2025. 3. 22.
[2025-1] 전연주 - NeuralRecon: Real-Time Coherent 3D Reconstruction from Monocular Video 논문 링크: 2104.006811. Introduction3D 장면 복원(3D Scene Reconstruction)은 3D Computer Vision 분야에서 매우 중요한 과제이다. 다양한 실내·실외 환경에서 3D 정보를 정확히 얻어내야 하는데, 특히 증강현실(AR)처럼 실시간 상호작용이 필요한 경우에는 정확성(Accuracy)과 일관성(Coherency), 그리고 실시간성이 모두 필수적이다.기존 문제점Depth-based 접근: 여러 Key frame에서 각각 Single-view Depth map을 추정하고, 이를 TSDF(Truncated Signed Distance Function)에 융합(Fuse)하는 방식이 주류였다.그러나 이 방식은 (1) 뷰별 단절된(single-view) 추정으로 인해.. 2025. 3. 22.