전체 글281 [2025-1] 전윤경-A FOUNDATION MODEL FOR GENERALIZABLE DISEASEDIAGNOSIS IN CHEST X-RAY IMAGES CXRBase: 흉부 X선 이미지(CXR)에 대한 질병 진단의 일반화된 해결책을 제공이미지 기반 자기 지도 학습(SSL) 방법: 데이터를 masking하여 그 마스킹된 부분을 재구성하는 방식으로 학습하는 모델Masked Autoencoders (MAE): ViT와 결합 모델 아키텍처데이터 처리배경을 제외한 이미지의 흉부영역만 유지512*512 해상도( 큐빅 보간법)데이터 증강 기법: random cropping, random horizontal flipping 적용stage 1 (자가 지도 학습(SSL))인코더: ViT-large(24개 트랜스포머 블록)마스크 비율: 0.75멀티헤드 자기 주의(Multihead Self-Attention)와 Multi-layer Perceptron 계층을 포함하여 특성 .. 2025. 5. 9. [2025-1] 박지원-Encoder-Decoder with Atrous SeparableConvolution for Semantic Image Segmentation 1. Introduction : Semantic Segmentation의 발전과 DeepLabv3+의 등장방법론장점단점Spatial Pyramid Pooling다양한 스케일의 문맥 정보 인코딩객체 경계 세부 정보 부족Encoder-Decoder날카로운 객체 경계 포착다양한 스케일 정보 인코딩 부족 Semantic Segmentation이란 이미지의 모든 픽셀에 의미론적 레이블을 할당하는 방법론으로, FCN(Fully Convolutional Network)모델이 현저한 성능 향상을 보인 바 있다. 이 FCNs은 spatial pyramid pooling(다양한 비율과 유효 수용 영역을 가진 필터나 풀링 연산을 통해 들어오는 특징을 조사하여 멀티 스케일 문맥 정보를 인코딩하는 방식)과 encoder-de.. 2025. 5. 8. [2025-1] 박제우 - CLIP : Learning Transferable Visual Models From Natural Language Supervision https://arxiv.org/abs/2103.00020 Learning Transferable Visual Models From Natural Language SupervisionState-of-the-art computer vision systems are trained to predict a fixed set of predetermined object categories. This restricted form of supervision limits their generality and usability since additional labeled data is needed to specify any other visual concept. Learning directly from raw text .. 2025. 5. 6. [2025-1] 임재열 - Manifold Ordinal-Mixup for Ordered Classes in TW3-Based Bone Age Assessment Manifold Ordinal-Mixup for Ordered Classes in TW3-Based Bone Age Assessment는 2020년 MICCAI 학회에서 발표된 뼈 나이 평가에 대한 논문입니다. [DL 기반 TW3]https://link.springer.com/chapter/10.1007/978-3-030-59725-2_64 * Abstract- 뼈 나이 평가 (BAA)는 아동의 비정상적인 성장을 조기에 발견하고 그 원인을 조사하는 데 매우 중요- 이 과정을 자동화하면 판독자 간 편차를 줄이고 판독 시간을 단축시켜 방사선과 전문의에게 많은 도움이 될 수 있음- 손 엑스레이 이미지에서 13개의 주요 뼈 각각에 대한 ROI 패치를 추출하고 해당 뼈의 성숙 단계를 예측하기 위해 DNN을 훈련시.. 2025. 5. 3. 이전 1 2 3 4 ··· 71 다음