模型评估指标:修订间差异

来自牛奶河Wiki
跳到导航 跳到搜索
无编辑摘要
第22行: 第22行:


==== 评估指标 ====
==== 评估指标 ====
 
* 精准率(precision): TP/(TP+FP)。又称查准率,预测为阳性的数据中预测正确的数据个数
* 精准率(precision):预测为阳性的数据中预测正确的数据个数
* 招回率(recall): TP/(TP+FN)。又称查全率,它是针对原样本而言,阳性的数据中预测正确的数据个数。召回率越高,代表实际想检测出来的阳性的概率越高(可以假阳性FP也会高)
* 招回率(recall):阳性的数据中预测正确的数据个数
* F1 score: 以 precision & recall 做正交直角坐标系,为 P-R 图。F1 = 2*P*R / (P + R),取一个平衡点,可以同时让查准率和查全率最高
* 准确率: (TP+TN)/ALL。预测正确的结果占比。在样本不平衡的情况下,不能作为很好的指标来衡量结果


====Sample====
====Sample====

2024年5月7日 (二) 14:38的版本

混淆矩阵(Confusion matrix, error matrix)是一种具有两个维度的(实际与预测)列联表,矩阵的每一列代表一个类的实例预测,而每一行表示一个实际的类的实例。通过这个矩阵可以方便地看出模型是否将两个不同的类混淆了。

Predicted condition
Total population = P + N Positive (PP) Negative (PN)
Actual condition Positive (P) True positive (TP), 真阳性 False negative (FN), 假阴性
Negative (N) False positive (FP), 假阳性 True Negative (TN), 真阴性

评估指标

  • 精准率(precision): TP/(TP+FP)。又称查准率,预测为阳性的数据中预测正确的数据个数
  • 招回率(recall): TP/(TP+FN)。又称查全率,它是针对原样本而言,阳性的数据中预测正确的数据个数。召回率越高,代表实际想检测出来的阳性的概率越高(可以假阳性FP也会高)
  • F1 score: 以 precision & recall 做正交直角坐标系,为 P-R 图。F1 = 2*P*R / (P + R),取一个平衡点,可以同时让查准率和查全率最高
  • 准确率: (TP+TN)/ALL。预测正确的结果占比。在样本不平衡的情况下,不能作为很好的指标来衡量结果

Sample

Individual Number 1 2 3 4 5 6 7 8 9 10 11 12
Actual Classification 1 1 1 1 1 1 1 1 0 0 0 0
Predicted Classification 0 0 1 1 1 1 1 1 1 0 0 0
Predicted condition
Total population = 8 + 4 Positive (PP) Negative (PN)
Actual condition Cancer 8 6 2
Non-cancer 4 1 3