
[머신러닝/사이킷런] 분류 모델 평가(정확도, 오차행렬, 정밀도, 재현율, F1 Score, ROC AUC)
·
ML
학습 자료: 파이썬 머신러닝 완벽 가이드(개정2판), 위키북스 1. 정확도(Accuracy)개요실제 데이터에서 예측 데이터가 얼마나 같은지를 판단하는 지표 수식정확도(Accuracy) = (TN + TP) / (TN + FP + FN + TP)예측 결과가 동일한 데이터 건수 / 전체 예측 데이터 건수 주의할 점직관적으로 모델 예측 성능을 나타내는 지표이지만, 이진 분류의 경우 모델 구성에 따라 성능을 왜곡할 수 있음예시) 전체 데이터의 10%만 True, 90%는 False일 경우 모든 예측을 False로만 수행해도 정확도가 0.9가 나옴특히, 불균형한(imbalanced) 레이블 값 분포에서 성능을 판단할 경우 적합하지 않음 사이킷런accuracy_score(y_test, pred) 2. 오차 행렬(C..