
上QQ阅读APP看书,第一时间看更新
2.1 图像识别
计算机中,信息是以数字的形式输入的,图像的表示单元是像素。像素的描述形式有很多,常用的是RGB三通道描述方式。图2-1展示的是图像的表示单元。图像识别任务是指在给定的图像中精确找到某物体所在位置,并标注出物体的类别。如图2-2所示,通过图像识别算法找出游戏画面中人物和地板所在的位置。

图2-1 图像的表示单元

图2-2 图像识别的目标,蓝框表示类别“地板”,红框表示类别“人物”
常用的图像识别的衡量指标有查准率(Precision)、查全率(Recall)、F1-Score、mAP等。在图像识别中,被正确框选分类的目标物称为正例,反之称为反例。真实情况是正例,被正确预测为正例的样本称为真正例(True Positive,TP),被错误预测为反例的样本称为假反例(False Negative,FN);真实情况为反例,被预测为正例的样本称为假正例(False Positive,FP),被预测为反例的样本称为真反例(True Negative,TN),如表2-1所示。
表2-1 分类结果混淆矩阵

查准率(Precision)、查全率(Recall)、F1-Score的定义如下:

如果物体的类别有多个(图2-2中的类别为人物和地板),每一个类别都可以根据查准率和查全率绘制一条曲线,AP(Average Precision,AP)就是该曲线下的面积,mAP(mean Average Precision,mAP)是多个类别AP的平均值。mAP常作为衡量图像检测识别精度的指标。