본문 바로가기
  • 책상 밖 세상을 경험할 수 있는 Playground를 제공하고, 수동적 학습에서 창조의 삶으로의 전환을 위한 새로운 라이프 스타일을 제시합니다.
Miscellaneous

[2025-1] 유경석 - nnDetection: A Self-configuring Method for Medical Object Detection

by Theta_ 2025. 5. 24.

https://arxiv.org/abs/2106.00817

 

nnDetection: A Self-configuring Method for Medical Object Detection

Simultaneous localisation and categorization of objects in medical images, also referred to as medical object detection, is of high clinical relevance because diagnostic decisions often depend on rating of objects rather than e.g. pixels. For this task, th

arxiv.org

https://github.com/MIC-DKFZ/nnDetection/tree/main

 

GitHub - MIC-DKFZ/nnDetection: nnDetection is a self-configuring framework for 3D (volumetric) medical object detection which ca

nnDetection is a self-configuring framework for 3D (volumetric) medical object detection which can be applied to new data sets without manual intervention. It includes guides for 12 data sets that ...

github.com

 


Abstract

  • Medical object detection은 임상적으로 매우 중요하나, Method configuration의 측면에서 어려움을 겪음
  • Segmentation 분야에서 구성 문제를 자동화한 nnU-Net의 전략을 사용하여, Medical Object detection에 자동 구성 프레임워크를 적용한 nnDetection 제안
  • ADAM, LUNA16 benchmark에서 우수한 성능, 11개의 medcial object detection task를 통해 광범위한 성능 평가

 

1. Introduction

  • 영상 기반 진단 의사 결정과정은 픽셀 단위보다는 객체 단위로 평가가 이루어지나, 전체 객체의 위치를 지정하고 평가하는 medical object detection보다는 픽셀 단위의 분류 작업인 semantic segmentation으로 대부분의 의료 영상 접근이 이루어짐.
  • Object detection은 Postprocessing에서 발생하는 성능 저하 문제를 해결할 수 있으나, 다음과 같은 복잡성의 문제 존재
    • 추가적인 Detection head에 따른 여러 가지 Multi-loss functions 및 hyperparameter
    • 전문가의 지식, 계산 자원, 검증 데이터, 반복 구성의 불편함
  • nnU-Net : Biomedical image segmentation에 대해 Automated method configuration (학습 방식 구성 자동화), 빠르고 데이터 효율적 적응력 특화 https://github.com/MIC-DKFZ/nnUNet?tab=readme-ov-file
  • nnDetection : nnU-Net의 레시피에 따라 체계화된 Automated method configuration
    • 10개 Dataset을 구성하는 다양한 개발 방안에 Fixed, Rule-based, Empirical design choices
    • Retina U-Net : 깔끔하고 간단한 architecture 채택
    • 표준 network training 수준의 resource만으로 Medical object detection task에 자동 적용
  • LUNA16 benchmark의 Nodule-candidate detection task에서 SOTA 달성, ADAM leaderboard에서도 경쟁력 있는 결과
  • 13개 Datase으로 구성된 대규모 benchmark 제안 : 기존 segmentation challenge에서부터 object detection 재정의, nnDetection을 표준화된 baseline으로 활용

 

2. Methods

 

nnDetection development

  • Automatic method configuration을 위해 nnU-Net의 방식을 따름: Fixed, rule-based, empirical parameters
  • 10개 dataset pool에서 개발 수행
  1. Fixed parameters
    • Dataset 사이에서 Adaptation이 필요없는 Design choice, Robust generalization을 위한 공통적인 configuration을 최적화
    • Retina U-Net을 architecture template으로 선택 : RetinaNet 기반, topology parameters는 Rule-based parameter를 통해 조정
    • Network configuration과 Object size의 다양성 반영 : Adaptive training sample selection 적용
    • Anchor center 및 Anchor 수에 의한 제한을 완화하여 크기가 작고 객체 수가 적은 Dataset에 대해 성능 향상
  2. Rule-based Parameters
    • Data Fingerprint와 Design 간의 종속 관계를 상호의존적 heuristic rule로 공식화
    • Object size에 대한 정보를 추가 추출, Network topology parameters는 nnU-Net과 동일한 process를 사용하여 결정, 훈련 안정성을 위해 batch size는 4로 고정
    • 고해상도 이미지나 큰 객체가 존재하는 경우, 저해상도 모델이 자동으로 트리거되어 부족한 컨텍스트 정보를 보완
    • 적절한 Anchor configuration : Anchor와 Ground-truth box 사이의 교차점 (IoU)를 반복적으로 최대화
    • Robust anchor configurations을 위해 Validation set 대신 Training set에서 최적화 수행
    • 각 축마다 3개의 Anchor size 설정, Detection head가 작동하는 고해상도 레벨 Anchor set 생성
  3. Empirical parameters
    • Postprocessing, 겹치는 Bounding box를 그룹화하는데 집중
    • Dense anchor의 overlapping은 NMS (Non-maximum Suppression) 으로 설명 : 제한된 GPU memory로 인해 겹치는 patch에 sliding window inference 사용, 인접한 patch 간의 overlapping은 NMS를 통해 그룹화, 패치 중앙의 prediction은 경계에 비해 높은 가중치 부여
    • Weighted box clustering : 여러 모델, 다양한 test time augmentation에서 예측을 그룹화하기 위해 사용, Test 도중 사용되는 경험적 매개변수는 Validation set에서 최적화, 상호 의존성으로 인해 매개변수의 사전 정의된 초기화를 사용, 순차적으로 최적화
    • Low-resolution model의 경우 Validation 기반 경험적인 최적의 모델이 선택

nnDetection application

  • 새로운 Dataset이 주어질 경우 nnDetection은 automatic configuration 수행 : 일부 Empirical choice를 제외하면 Network training에만 computational cost 사용하지 않음
  • Data Fingerprint 추출, Heuristic rule을 실행하여 Rule-based parameter 결정, 5-fold cross-validation을 통해 Full-resolution 및 low-resolution model training, 학습 후 empirical parameter 결정, 5개의 model ensembling을 통해 최종 예측 구성, 3개의 추가 dataset을 이용해 일반화 성능 점검

 

nnU-Net as an object detection baseline

  • nnU-Net Basic : pixel prediction의 일반 접근 방식을 반영하는 첫번째 nnU-Net baseline - Softmax, Argmax, Connected component analysis 등
  • nnU-Net Plus : 적절한 비교를 위해 postprocessing을 경험적으로 적용하여 baseline 향상 - Argmax를 Softmax 최소임계값, Object별 최소 pixel 임계값, Aggregation method 등으로 대체, LIDC에 대한 실험에서 nnU-Net 수렴 문제를 Dice loss 상수를 제거

 

3. Experiments and Results

Proposed benchmark for medical object detection

  • 다양한 Dataset 평가의 중요성 : Dataset의 크기 제한과 Label noise로 인해 발생하는 평가 지표의 불안정성, 보편적 방법론 제안을 위해 13개의 다양한 기존 dataset 기반 새로운 benchmark 제안
  • 기존 segmentation challenge dataset 5개에서 종양을 탐지하는 object detection task : Connected component analysis, 직경 3mm 미만 혹은 segmentation error에서 유래한 annotation 제거 등
  • IoU 임계값 0.1에서의 mAP 성능지표 채택

 

Data sets

  • 10개는 nnDetection 개발 및 검증에 사용 : Training pool (CADA, LIDC-IDRI, RibFrac, Kits19), Validation pool (ProstateX, ADAM, MSD Liver, Pancreas, Hepatic Vessel, Colon)
  • 3개는 Test pool로 일반화된 automated method configuration 성능을 평가 (LUNA16, TCIA Lymph-Node)

 

Compared methods

  • LUNA16과 ADAM을 제외한 11개 dataset에서는 표준화된 평가 프로토콜 없음
  • 표준화된 nnU-Net 기반 baseline과의 비교를 통해 새로운 benchmark 설립

 

Public leaderboard results

  • LUNA16은 Lung nodule 탐지의 대표적 benchmark
  • nnDetection은 automated method configuration을 통해 단순 적용만으로 dataset에 적합하게 적용
  • Competition Performance Metric(CPM) 0.930으로 기존 모든 방법을 능가
  • ADAM에서는 0.3 false positive에서 0.64 sensitivity로 리더보드 3위, 상위 2개 중 하나는 이전 버전의 nnDetection (성능 편차)

 

 

Large-scale Comparison against nnU-Net

  • Cross-validation protocol : 12개 중 9개 dataset에서 nnU-Net Plus 능가, 그 중 7개 dataset에서는 5% 이상의 성능 차이를 보임, fixed postprocessing strategy를 사용하는 nnU-Net Basic은 11개 dataset에서 열세를 보임
  • Hold-out test splits : 7개 중 5개에서 nnU-Net Plus보다 우수, 4개는 큰 성능 차이를 보이나, 일부가 nnU-Net 개발에 사용된 dataset이라 진정한 hold-out은 아님
  • 평가 지표의 변동성 : Liver, Colon dataset에서 두드러지는 현상 → 다양한 dataset을 통한 검증의 중요성

 

 

4. Discussion

  • Medical object detection 분야에서 새로운 관점 제시
    • 특정 dataset에 의존하지 않는 Design 설계로 자동으로 데이터셋에 맞춰 적응, 수동적이고 반복적인 구성 과정을 제거
    • 두 개의 공개 리더보드와 새롭게 제안된 11개의 벤치마크에서 기존 최신 기법에 비해 동등하거나 우수한 성능
  • 특정 작업에 맞춘 수동 최적화의 출발점
    • LUNA16에서 FP reduction module 추가 시 성능 향상
    • AutoML 등 데이터 기반 최적화 기법을 객체 탐지 파이프라인의 특정 구성 요소에 적용 시 계산량이 적절한 수준에서 성능 향상 가능성도 존재
  • nnDetection 및 모든 benchmark의 model과 object annotation 제공 : 관심 증대, 즉각 사용가능한 object prediction tool, method 개발을 위한 framework, 표준화된 비교 기준, 대규모 성능 평가를 위한 benchmark 제공