评价指标
Last updated
Last updated
图像分类的评价指标相对单一,常使用分类准确率作为评价模型好坏的指标。
由于机器学习模型通常对样本属于不同类别的概率进行建模,并取概率最高的类别为预测结果,因此上述评价指标也成为 top-1 accuracy 。
由于有些类别之间存在一定的重叠,尤其是在类别分的足够细的时候。例如,将 leopard 预测成 jaguar (两种不同的豹子)似乎也还可以认为是正确,毕竟差别很小。 为了将类别之间可能的相似性考虑进来,因此我们还会使用 top-5 accuracy。 对于样本 ,以及模型给出的类别预测 , 如果真值 y 所对应的概率 在所有类别的概率中排名前五,则认为该样本预测正确,否则预测错误。