Notice
Recent Posts
Recent Comments
Link
«   2026/02   »
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
Tags
more
Archives
Today
Total
관리 메뉴

다녕님의 블로그

IOU, NMS 본문

Computer Vision

IOU, NMS

ddny226 2025. 2. 11. 11:24

IoU : Intersection over Union

모델이 예측한 결과와 실측(Ground Truth) Box가 얼마나 정확하게 겹치는가를 나타내는 지표

IoU는 개별 Box가 서로 겹치는 영역 / 전체 Box의 합집합 영역 

1에 가까울 수록 detect를 잘했다...!

 

대표적으로 Pascal VOC랑 MS COCO IoU 평가 메트릭 방법이 있음

파스칼은 IoU가 0.5보다 높냐 낮냐에 따라 잘하고 못하고를 구분함

MS COCO는 좀 더 복잡하게 0.5~0.95의 범위에서 0.05씩 올려가며 IoU를 측정함

또한 크기 (small, middle, big)에 대한 IoU 값도 있음 

 

NMS (Non Max Suppression)

- Object Detection 알고리즘은 Object가 있을 만한 위치에 많은 Detection을 수행하는 경향이 강함

- NMS는 Detected 된 Object의 Bounding box 중에 비슷한 위치에 있는 box를 제거하고 가장 확실한 box를 선택하는 기법

 

NMS 수행 로직

1. Detected 된 bounding box 별로 특정 Confidence threshold 이하 bounding box는 먼저 제거 (confidence score < 0.5)

2. 가장 높은 confidence score를 가진 box 순으로 내림차순 정렬하고 아래 로직을 모든 box에 순차적으로 적용

- 높은 confidence score를 가진 box와 겹치는 다른 box를 모두 조사하여 IOU가 특정 threshold 이상인 box를 모두 제거 (IOU Threshold > 0.4)

3. 남아 있는 box만 선택

 

즉 confidence score가 높을 수록,

IoU Threshold가 낮을 수록 많은 Box가 제거됨 

 

IoU와 Confidence Score의 차이

1. IoU (Intersection over Union, 교차비율)

IoU는 예측된 BBox와 실제 정답 BBox(ground truth)의 겹치는 정도를 나타내는 지표

즉, 예측된 바운딩 박스와 실제 바운딩 박스가 얼마나 겹치는지(교집합)와 전체 영역(합집합)의 비율을 계산

 

IoU 특징

  • 값 범위: 0 ~ 1
  • 값이 클수록 예측이 정확함을 의미
  • 일정 임계값(예: IoU > 0.5) 이상이면 TP(True Positive), 아니면 **FP(False Positive)**로 처리

2. Confidence Score (신뢰도 점수)

Confidence Score는 모델이 특정 BBox에 객체가 있을 확률을 얼마나 높게 예측했는지를 나타내는 점수

 

Confidence Score 특징

  • 값 범위: 0 ~ 1 (또는 0% ~ 100%)
  • 모델이 예측한 BBox가 실제로 객체일 확률을 의미
  • 일반적으로 신경망이 출력한 확률값이므로 Softmax 또는 Sigmoid를 통해 계산됨
  • 특정 임계값(예: 0.5 이상)을 기준으로 필터링 가능

NMS 과정 상세 설명

  1. Confidence Score 기준 필터링
    • 모든 예측된 BBox 중에서 Confidence Score < 0.5인 박스 제거.
  2. Confidence Score 내림차순 정렬
    • 남은 BBox들을 Confidence Score가 높은 순으로 정렬.
  3. IoU 비교 및 중복 BBox 제거
    • Confidence Score가 가장 높은 BBox를 선택.
    • 해당 BBox와 나머지 BBox들의 IoU를 비교하여 특정 Threshold(예: 0.4) 이상이면 제거.
    • 이후, 남아 있는 BBox들에서 다시 가장 Confidence Score가 높은 BBox를 선택하고 동일한 과정 반복.
  4. 남은 BBox들을 최종 예측으로 사용

mAP (mean Average Precision)

 

'Computer Vision' 카테고리의 다른 글

Object Detection Metric - mAP  (0) 2025.02.11
슬라이딩 윈도우, 영역추정  (0) 2025.02.11