了解一下：机器学习性能优化的6个指标

2019-12-03 16:27:29

机器学习性能优化的6个指标

根据要进行的机器学习的类型，有许多度量标准可以衡量机器学习模型的性能。在本文中，我们研究了分类和回归模型的性能指标，并讨论了优化效果更好的指标。有时，要看的指标会根据初要解决的问题而有所不同。

分类问题的优化分类表示例

分类图示例：

来源 1.真实肯定（召回）

真实肯定率（也称为召回率）是二进制/非二进制分类问题中的性能指标。在大多数时间（如果不是所有时间）中，我们只对正确预测一个类感兴趣。例如，如果您正在预测糖尿病，则比起预测此人没有糖尿病，您将更关心预测此人是否患有糖尿病。在这种情况下，积极的等级是“这个人患有糖尿病”，而消极的等级是“这个人没有糖尿病”。这只是预测肯定类别的准确性

这不是准确性性能指标。有关更多详细信息，请参见下面的数字4。

2.ROC曲线（接收机工作特性曲线）

ROC曲线显示分类模型在不同阈值（分类到特定类别的可能性）下的性能。它绘制了真假阳性率和假阳性率。降低阈值将增加您的真实肯定率，但会牺牲您的错误肯定率，反之亦然。

3.AUC（曲线下面积） AUC也称为“ ROC曲线下的面积”。

简而言之，AUC会告诉您正确分类的可能性。较高的AUC代表更好的模型。

4.准确性

默认情况下，精度是要注意的事情。但是，真正的数据科学家知道准确性太误导了。一种更好的称呼方法是预测所有类别的平均准确性。就像我在True True Rate中提到的那样，它是理想的指标。准确度将取“真正值”和“真负值”之和的平均值。大多数情况下，在不平衡的分类问题中，负类比正类的代表更多，因此您更有可能具有很高的真负率。然后，准确性将偏向于负面类别的准确预测，这可能不会引起任何人的兴趣。

机器学习中的回归优化回归图示例

回归图示例：