Computer Vision108 [2025-1] 임수연 - PIFuHD https://arxiv.org/pdf/2004.00452https://shunsukesaito.github.io/PIFuHD/https://youtu.be/8qnwbbDS8xk 안녕하세요, 이번 글에서는 PIFuHD: Multi-Level Pixel-Aligned Implicit Function for High-Resolution 3D Human Digitization∗ (2020) 논문 리뷰를 해보도록 하겠습니다. PIFuHD(Multi-Level Pixel-Aligned Implicit Function for High-Resolution 3D Human Digitization)는 단일 이미지에서 고해상도의 3D 인간 모델을 생성하는 기술을 제시한 논문입니다. 이 기술은 1K 해상도 입력 이미지를 활.. 2025. 3. 19. [2025-1] 정성윤 - Inception-Net 논문 리뷰 Inception Net V1 (2014)AbstractInception을 이용한 deep CNN네트워크 내의 컴퓨팅 자원을 효율적으로 사용하였다.수행 시간은 유지하면서 네트워크의 너비, 높이는 늘렸다.Hebbian, multi-scale processing을 이용해 구조적으로 최적화를 시도함총 22 layer의 딥러닝 네트워크IntroductionObject Detection에 있어서 큰 발전은 큰 모델을 쓰는 것이 아닌, 고전적인 기법과 deep 한 구조를 결합해 만들어진 것이다.객체 인식에 쓰이는 시간을 단축해 학문 분야만이 아닌 실제 세상에서 활용할 수 있는 알고리즘을 제작Inception(처음) = We need to go deeper 이라는 밈의 반대 의미로 사용, 반어법.“Deep”하다의 의.. 2025. 3. 15. [2025-1] 전연주 - Multi‑modal transformer architecture for medical image analysis and automated report generation 논문 링크: https://www.nature.com/articles/s41598-024-69981-5.pdf저자: Santhosh Raminedi, S. Shridevi & Daehan Won학회: Scientific Reports (Nature Publishing Group)발행일: 20 August 2024 Keywords: Vision transformer, Generative pre-trained transformer, Retrieval augmentationIntroduction1. 배경X-ray 및 MRI(Magnetic Resonance Imaging)와 같은 의료 영상 기술은 인체 내부를 시각화하여 질병을 진단하는 데 중요한 역할을 한다.그러나 방사선 영상(radiological ima.. 2025. 3. 15. [2025-1] 임수연 - MobileUNETR https://arxiv.org/abs/2409.03062 MobileUNETR: A Lightweight End-To-End Hybrid Vision Transformer For Efficient Medical Image SegmentationSkin cancer segmentation poses a significant challenge in medical image analysis. Numerous existing solutions, predominantly CNN-based, face issues related to a lack of global contextual understanding. Alternatively, some approaches resort to large-scale Tarxiv.. 2025. 3. 14. 이전 1 2 3 4 5 ··· 27 다음