模型评估指标:修订间差异
跳到导航
跳到搜索
无编辑摘要 |
(→评估指标) |
||
第22行: | 第22行: | ||
==== 评估指标 ==== | ==== 评估指标 ==== | ||
* 精准率(precision): TP/(TP+FP)。又称查准率,预测为阳性的数据中预测正确的数据个数 | |||
* 精准率(precision) | * 招回率(recall): TP/(TP+FN)。又称查全率,它是针对原样本而言,阳性的数据中预测正确的数据个数。召回率越高,代表实际想检测出来的阳性的概率越高(可以假阳性FP也会高) | ||
* 招回率(recall) | * F1 score: 以 precision & recall 做正交直角坐标系,为 P-R 图。F1 = 2*P*R / (P + R),取一个平衡点,可以同时让查准率和查全率最高 | ||
* 准确率: (TP+TN)/ALL。预测正确的结果占比。在样本不平衡的情况下,不能作为很好的指标来衡量结果 | |||
====Sample==== | ====Sample==== |
2024年5月7日 (二) 14:38的版本
混淆矩阵(Confusion matrix, error matrix)是一种具有两个维度的(实际与预测)列联表,矩阵的每一列代表一个类的实例预测,而每一行表示一个实际的类的实例。通过这个矩阵可以方便地看出模型是否将两个不同的类混淆了。
Predicted condition | |||
---|---|---|---|
Total population = P + N | Positive (PP) | Negative (PN) | |
Actual condition | Positive (P) | True positive (TP), 真阳性 | False negative (FN), 假阴性 |
Negative (N) | False positive (FP), 假阳性 | True Negative (TN), 真阴性 |
评估指标
- 精准率(precision): TP/(TP+FP)。又称查准率,预测为阳性的数据中预测正确的数据个数
- 招回率(recall): TP/(TP+FN)。又称查全率,它是针对原样本而言,阳性的数据中预测正确的数据个数。召回率越高,代表实际想检测出来的阳性的概率越高(可以假阳性FP也会高)
- F1 score: 以 precision & recall 做正交直角坐标系,为 P-R 图。F1 = 2*P*R / (P + R),取一个平衡点,可以同时让查准率和查全率最高
- 准确率: (TP+TN)/ALL。预测正确的结果占比。在样本不平衡的情况下,不能作为很好的指标来衡量结果
Sample
Individual Number | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 |
---|---|---|---|---|---|---|---|---|---|---|---|---|
Actual Classification | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 0 | 0 | 0 | 0 |
Predicted Classification | 0 | 0 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 0 | 0 | 0 |
Predicted condition | |||
---|---|---|---|
Total population = 8 + 4 | Positive (PP) | Negative (PN) | |
Actual condition | Cancer 8 | 6 | 2 |
Non-cancer 4 | 1 | 3 |