일단 잘 정리된 글은 https://adnoctum.tistory.com/981 에 있다.
민감도(Sensitivity) | 질병이 있는 사람을 얼마나 잘 찾아 내는가 | 양성인 개체를 양성이라고 판단하는 비율 (True Positive) |
TP /전체환자(TP + FN) |
특이도(Specificity) | 정상을 얼마나 잘 찾아 내는가 | 음성인 개체에 대해 음성이라고 판단하는 비율(True Negative) | TN / 전체 정상인 (TN + FP) |
민감도와 특이도가 둘 다 높은 진단 방법을 찾아야 한다.
일단 진단에서는 Negative면 음성(질병이 없는 정상), Positive면 양성(질병이 있는 환자)이다.
Negative | Positive | |
Negative | TN. True Negative (특이도. Specificity) | FP. False Positive |
Positive | FN. False Negative | TP. True Positive (민감도. Sensitivity) |
항상 헷갈리는 Confusion matrix... 외우는 방법은 False가 들어가면 일단 틀린거고, True가 들어가면 일단 맞은거다 -_-
진단에서는 정확도가 낮아진다고 해도 질병이 있는 사람을 놓치지 않기 위해 민감도를 높이고 특이도를 낮추는 것이 낫다.
그러나 민감도와 특이도 값만으로는 진단법의 성능을 제대로 판단할 수 없다고 한다. 이때 필요한 방법이 AUC of ROC이다.
AUC ROC란 민감도와 특이도 간의 관계를 이차원 평면상에 표현한 것. 커브 아래의 면적이 넓을 수록 좋은 진단방법이다.
이것 역시 잘 정리된 것은 https://adnoctum.tistory.com/121 에 있다. ^-^b