민감도와 특이도는 환자의 질병을 진단하는 기기 또는 모델의 성능을 판단할 때 주로 사용됩니다.
우리가 어떤 질병을 진단하는 기기를 개발하였다고 합시다. 해당 질병을 가진 환자와 정상인을 모집하여 기기의 성능을 테스트한다면, 테스트 결과는 아래와 같은 표로 나타낼 수 있습니다.
열에 있는 Positive 는 검사 결과가 양성, Negative 는 검사 결과가 음성임을 의미합니다. 행에 있는 Disease 는 환자, Normal 은 정상인을 의미합니다. 환자인데 양성이 나온 경우를 True positive , 환자인데 음성이 나온 경우를 False negative 라고 부릅니다. 정상인인데 양성이 나온 경우를 False positive, 정상인인데 음성이 나온 경우를 True negative 라고 부릅니다. True 가 붙은 파란색 칸이 진단 결과가 옳은 경우이고, False 가 붙은 살색 칸이 진단 결과가 잘못된 경우입니다.
이제 기기 성능을 정의해봅시다.
환자를 양성으로 판별하는 비율이 높을 수록 진단 성능이 좋은 기기입니다. 정상인을 양성으로 판별하는 비율을 true positive rate(tpr) 라고 부릅니다. 참양성률인데요. 참 양성률 대신 민감도(sensitivity)라는 표현을 사용합니다.
tpr=sensitivity = $\frac{TP}{TP+FN}$
false negative rate(fnr) 와 sensitivity 을 더하면 1이 나옵니다. 따라서 아래 관계식이 성립합니다.
sensitivity=1-fnr
반대로 정상인을 음성으로 판별하는 비율이 높을 수록 좋은 기기입니다. 환자를 음성으로 판별하는 비율을 true negative rate(tnr) 라고 부릅니다. 참음성률인데요. 참 음성률 대신 특이도(specificity)라는 표현을 사용합니다.
tnr=specificity = $\frac{TN}{FP+TN}$
false positive rate(fpr) 와 specificity 을 더하면 1이 나옵니다. 따라서 아래 관계식이 성립합니다.
specificity=1-fpr
기억하는 방법
민감도와 특이도를 나중에 다시 접하면 어떤 의미인지 기억이 나지 않을 수 있습니다. 몇가지 연상 과정을 만들어서 장기 기억으로 남겨봅시다.
위 내용을 잊은 상태에서 민감도라는 용어를 접했다고 합시다. 먼저 민감도는 기기의 성능을 판단할때 사용하는 것임을 떠올립니다. 기기 성능 파악을 위해 환자와 정상인을 모집합니다. 환자를 대상으로 기기를 사용합니다. 이때 환자를 양성으로 판단할 비율이 나오는데, 이 비율이 민감도입니다. 정상인을 대상으로 기기를 사용하면 정상인을 음성으로 판단할 비율이 나옵니다. 이 비율이 특이도입니다.
'Tips' 카테고리의 다른 글
머신러닝과 딥러닝의 차이 (0) | 2023.09.26 |
---|---|
신경망 부르는 방법 (0) | 2023.09.26 |
[머신러닝] 릿지 회귀모델이란? (0) | 2023.09.04 |
[데이터분석] 정규화 방법들 (normalization) (0) | 2023.06.30 |
[데이터분석] 스무싱 방법 (데이터 평활법) (0) | 2023.06.30 |
댓글