딥러닝용어:평가
혼동행렬 confusion Matrix
정확도 accuracy
- 데이터가 불균형할 때 잘못된 지표로 사용될 가능성이 있음
정밀도 precision 재현율 recall
- 정밀도 precision : 모델이 True라고 예측한 것 중 실제로 True인 비율 → 혼동행렬의 가로축
- 재현율 recall: 실제 데이터가 True인 것 중에서 모델이 True라고 예측한 비율. 민감도Sensitivity라고도 한다. → 혼동행렬의 세로축
- 햄버거의 유통기한 경과 여부를 판별하는 기계가 있다고 할 때,
- 재고 관리 직원*은 정상 햄버거를 유통기한이 지난 햄버거로 판별하여 버리지 않도록 해야 한다.
→ 정밀도가 높은 기계 사용
제품 판매 직원은 유통기한이 지난 햄버거를 정상 햄버거로 판별하여 고객에게 주지 않도록 해야 한다.
→ 재현율이 높은 기계 사용
F1-스코어
-
재현율과 정밀도의 중요성이 같다고 가정하고, 두 지표의 조화평균으로 만들어진 지표.
특이도
-
모델이 False라고 예측한 정답 중에 실제로 False인 비율
ROC 곡선
- 진짜 양성 비율 True Positive Rate, TPR = 민감도
- 가짜 양성 비율 False Positive Rate, FPR = (1 - 특이도) : 실제로 False이지만 True로 잘못 예측한 비율
- 모델이 거의 모든 햄버거에 대해 유통기한이 지난 햄버거라고 판단한다면, 자연스럽게 민감도는 증가하고, 특이도는 감소하게 된다. 그 반대도 마찬가지이다. 이런 TradeOff 관계를 그래프로 나타낸 것이 ROC곡선이다.
- 곡선이 왼쪽 위를 향할수록 이상적인 모델이다.
'Python > Python 딥러닝' 카테고리의 다른 글
Tensorflow의 기본 개념 : Tensor, Rank, Flow, Graph, Node, Edge, Session (0) | 2020.07.10 |
---|---|
유용한 Datasets를 얻을수 있는 사이트들 (0) | 2020.07.10 |
[딥러닝용어-학습] 하이퍼파라미터, 배치, 에포크, 스텝, 지도학습, 비지도학습, 강화학습 (0) | 2020.07.10 |
[딥러닝용어-데이터준비] 회귀와 분류, 원핫인코딩, 교차검증, 클래스 불균형, 과소표집과 과대표집, 홀드아웃 검증기법,K-폴드검증 (0) | 2020.07.10 |
Python 딥러닝 3_ numpy 행렬의 내적 (0) | 2020.06.23 |