上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人
2.2.2 图像表达
画面识别是从大量的(x,y)数据中寻找人类的视觉关联方式,并再次应用。其中,x是输入,y表示所识别到的物体种类。输入的图像x在计算机中是一堆按顺序排列的数字,数值为0~255,其中0表示最暗,255表示最亮,如图2.8所示。为保留该结构信息,通常选择矩阵的表示方式,如28×28的矩阵。
图2.8 灰度图的图像表达示意图
图2.8是只有黑白颜色的灰度图,而更普遍的图片表达方式是RGB颜色模型,即红(Red)、绿(Green)、蓝(Blue)三原色的色光以不同的比例相加,以产生多种多样的色光。这样,在RGB颜色模型中,单个矩阵就扩展成了有序排列的3个矩阵,也可以用三维张量去理解,其中的每一个矩阵又叫这个图片的一个通道(Channel)。在计算机中,一张图片是数字构成的“长方体”,可用宽(width)、高(height)、深(depth)来描述,如图2.9所示。
图2.9 RGB图片的图像表达示意图