混淆矩阵(Confusion matrix, error matrix)是一种具有两个维度的(实际与预测)列联表,矩阵的每一列代表一个类的实例预测,而每一行表示一个实际的类的实例。通过这个矩阵可以方便地看出模型是否将两个不同的类混淆了。
|
|
Predicted condition
|
|
Total population = P + N
|
Positive (PP)
|
Negative (PN)
|
Actual condition
|
Positive (P)
|
True positive (TP), 真阳性
|
False negative (FN), 假阴性
|
Negative (N)
|
False positive (FP), 假阳性
|
True Negative (TN), 真阴性
|
评估指标
- 精准率(precision): TP/(TP+FP)。又称查准率,预测为阳性的数据中预测正确的数据个数
- 招回率(recall): TP/(TP+FN)。又称查全率,它是针对原样本而言,阳性的数据中预测正确的数据个数。召回率越高,代表实际想检测出来的阳性的概率越高(可以假阳性FP也会高)
- F1 score: 以 precision & recall 做正交直角坐标系,为 P-R 图。F1 = 2*P*R / (P + R),取一个平衡点,可以同时让查准率和查全率最高
- 准确率: (TP+TN)/ALL。预测正确的结果占比。在样本不平衡的情况下,不能作为很好的指标来衡量结果
Sample
Individual Number
|
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
9
|
10
|
11
|
12
|
Actual Classification
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
0
|
0
|
0
|
0
|
Predicted Classification
|
0
|
0
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
0
|
0
|
0
|
|
|
Predicted condition
|
|
Total population = 8 + 4
|
Positive (PP)
|
Negative (PN)
|
Actual condition
|
Cancer 8
|
6
|
2
|
Non-cancer 4
|
1
|
3
|
See Also
- 知乎 - 准确率,精准率,召回率,真正率,假正率,ROC/AUC