2.2 图像的数字化
前文我们了解到模拟图像是不能直接用数字计算机来处理的。为了使计算机能够处理图像,必须将各类图像(如照片、图形、X光照片等)转化为数字图像。
将图像数字化,就是把图像分割成如图2.3所示的称为像素的小区域,每个像素的亮度或灰度值用一个整数来表示。图像的数字化过程主要分采样、量化与编码三个步骤,其中采样、量化分别确定图像的空间分辨率以及像素灰度分辨率。
图2.3 图像数字化
2.2.1 采样
将空间上连续的图像变换成离散点的操作称为采样。采样越细,像素越小,越能精细地表现图像;采样越粗,图像表现得越粗糙。采样的精度有许多不同的设定,例如,采用水平256像素×垂直256像素、水平512像素×垂直512像素、水平640像素×垂直480像素的图像等,目前智能手机相机6400万像素/4800万像素(水平4000像素×垂直3000像素)已经很普遍。可以预见,未来图像分辨率会越来越高,图像也会越来越清晰。
采样间隔和采样孔径的大小是两个很重要的参数。采样孔径的形状和大小与采样方式有关。采样孔径通常有如图2.4所示圆形、正方形、长方形、椭圆形四种,在实际使用时,由于受到光学系统特性的影响,采样孔径会在一定程度上产生畸变,使其边缘出现模糊,降低输入图像信噪比。
图2.4 采样孔径
采样间隔是指采样方式确定后,相邻像素间的位置关系,通常有有缝采样、无缝采样和重叠采样三种情况,如图2.5所示。一般来说,采样间隔越小,所得图像像素数越多,图像质量就越好,缺点是数据量也较大。采样间隔越大,所得图像像素数越少,图像质量差,严重时甚至会出现马赛克效应。
图2.5 采样方式
2.2.2 图像量化
经采样操作后,图像在空间上为离散的像素,但此时计算机还不能对其进行处理,因为其灰度仍然是连续的。将像素的灰度(亮度)变换成离散的整数值的操作称为量化。一幅数字图像中不同灰度值的个数称为灰度级数,用G表示。最简单的是用黑(0)和白(1)2个数值即1比特(bit)(2级)来量化,称为二值图像。若一幅数字图像的量化灰度级数G=256=28级,则像素灰度取值范围一般是0~255的整数。量化等级越多,所得图像层次越丰富,灰度分辨率越高,质量越好,但数据量大。量化等级越少,图像层次欠丰富,灰度分辨率低,质量变差,会出现假轮廓现象,但数据量小。由于用8bit就能表示灰度图像像素的灰度值,因此常称8bit量化。6bit(64级)以上的图像,人眼几乎看不出有什么区别。
数字化前需要决定影像大小(行数M、列数N)和灰度级数G的取值。一般数字图像灰度级数G为2的整数幂,即G=2g,那么一幅大小为M×N、灰度级数为G的图像所需的存储空间M×N×g(bit)称为图像的数据量。一般当限定数字图像的大小时,为了得到质量较好的图像,可以采用以下原则:
①对缓变的图像,应该粗采样、细量化,以避免出现假轮廓。
②对细节丰富的图像,应该细采样、粗量化,以避免模糊。
2.2.3 压缩编码
图像压缩编码是专门研究图像数据压缩的技术,通过用离散的数字表示模拟量,以此来减少表示数据图像所需要的数据量。1MB空间可以存放一部百万字的小说,却只能存放大约20张256×256大小的灰度BMP图片。因此必须按照一定的规则进行变换和组合,从而达到以尽可能少的数据来表示尽可能多的数据信息,压缩其信息量。大多数图像内相邻像素之间有较大的相关性,这称为空间冗余;序列图像前后帧内相邻之间有较大的相关性,这称为时间冗余。通过图像压缩技术消除这些冗余,除去人眼不敏感的信息,从而实现数据压缩。目前已有许多成熟的编码算法应用于图像压缩,常见的有图像的预测编码、变换编码、分形编码、小波变换图像压缩编码等。在图像编码压缩过程中,高比率压缩需要利用到比较复杂的技术。但是图像编码技术存在不同系统间不能兼容的问题,因此需要有一个共同的标准做基础。为了使图像压缩标准化,20世纪90年代后,国际电信联盟(ITU)、国际标准化组织(ISO)和国际电工委员会(IEC)已经制定并继续制定一系列静止和活动图像编码的国际标准,已批准的标准主要有JPEG标准、MPEG标准、H.261等。
2.2.4 数字图像的表示
为了表示像素之间的相对和绝对位置,通常要对像素的位置进行坐标约定。一幅m×n的数字图像可用矩阵表示为:
(2.1)
矩阵中的元素一一对应图像中的像素。把数字图像表示成矩阵可以便于应用矩阵理论对图像进行分析处理。灰度图像只是用一个量化的灰度来描述图像的每个像素,没有彩色信息。典型的数字图像表示如图2.6所示。
图2.6 典型数字图像表示
在这里,我们还可以按行或列的顺序进行像素排列,需要注意的是,选定一种顺序后,后面的处理都要与之保持一致。一幅图像按行排列表示成的列向量f。
f=[f0,f1,…,fm−1]T (2.2)
式中,f=[f(i,0),f(i,1),…,f(i,n−1)]T,i=0,1,…,m−1。这种表示方法的优点在于可以直接利用向量分析的有关理论和方法对图像进行处理。
2.2.5 采样、量化参数与数字化图像间的关系
数字化方式可分为均匀采样、量化和非均匀采样、量化。“均匀”就是指采样、量化为等间隔。均匀采样、量化是现在最常用的图像数字化方式,采用非均匀采样与量化,会使问题复杂化,因此很少采用。
图2.7(a)~(f)是采样间距递增获得的图像,像素数从256×256递减至8×8。很容易可以得出,随着图像像素的减少,图像质量也越来越差。
图2.7 随像素数减少产生的数字图像效果
图2.8(a)~(f)是在采样间距相等时灰度级数从256逐次减少为64、16、8、4、2所得到的图像,随着灰度级数的减少,图像层次感明显降低,质量变差。在极少数情况下,当图像大小固定时,减少灰度级能改善质量,产生这种情况的最可能原因是减少灰度级一般会提高图像的对比度,例如对细节比较丰富的复杂图像。
图2.8 随量化级数减少产生的数字图像效果