模型评估指标

来自牛奶河Wiki
阿奔讨论 | 贡献2024年3月21日 (四) 15:16的版本
跳到导航 跳到搜索

混淆矩阵(Confusion matrix, error matrix)是一种具有两个维度的(实际与预测)列联表,矩阵的每一列代表一个类的实例预测,而每一行表示一个实际的类的实例。通过这个矩阵可以方便地看出模型是否将两个不同的类混淆了。

Predicted condition
Total population = P + N Positive (PP) Negative (PN)
Actual condition Positive (P) True positive (TP), 真阳性 False negative (FN), 假阴性
Negative (N) False positive (FP), 假阳性 True Negative (TN), 真阴性

评估指标

  • 精准率(precision):预测为阳性的数据中预测正确的数据个数
  • 招回率(recall):阳性的数据中预测正确的数据个数

Sample

Individual Number 1 2 3 4 5 6 7 8 9 10 11 12
Actual Classification 1 1 1 1 1 1 1 1 0 0 0 0
Predicted Classification 0 0 1 1 1 1 1 1 1 0 0 0
Predicted condition
Total population = 8 + 4 Positive (PP) Negative (PN)
Actual condition Cancer 8 6 2
Non-cancer 4 1 3