机器人视觉系统即机器视觉系统,是指用计算机来实现人的视觉功能,也就是用计算机来实现对客观三维世界的识别。按现在的理解,人类视觉系统的感受部分是视网膜,它是一个三维采样系统。三维物体的可见部分投影到视网膜上,人们按照投影到视网膜上的二维的像来对该物体进行三维理解。所谓三维理解是指对被观察对象的形状、尺寸、离开观察点的距离、质地和运动特征(方向和速度)等的理解。 机器视觉系统的输入装置可以是摄像机、转鼓等,它们都把三维的影像作为输入源。如果把三维客观世界到二维投影图像看做是一种正变换的话,则机器视觉系统所要做的是从这种二维投影图像到三维客观世界的逆变换,也就是根据这种二维投影图像去重建三维的客观世界。机器视觉系统主要由两部分组成:图像的获取及图像的处理。 一、图像的获取 图像的获取实际上是将被测物体的可视化图像和内在特征转换成能被计算机处理的一系列数据,它主要由三部分组成: 照明 图像聚焦形成 图像确定和形成摄像机输出信号 1.照明 照明是影响机器视觉系统输入的重要因素,因为它直接影响输入数据的质量和至少30%的应用效果。由于没有通用的机器视觉照明设备,所以针对每个特定的应用实例,要选择相应的照明装置,以达到最佳效果。过去,许多机器视觉系统用可见光作为光源,这主要是因为可见光容易获得,价格低,并且便于操作。常用的几种可见光源是白炽灯、日光灯、水银灯和钠光灯。但是,这些光源的一个最大缺点是光不能保持稳定。以日光灯为例,在使用的第一个100小时内,光能将下降15%,随着使用时间的增加,光能将不断下降。因此,如何使光能在一定的程度上保持稳定,是实用化过程中急需解决的问题。 另一个方面,环境光将改变这些光源照射到物体上的总光能,使输出的图像数据存在噪声。一般可采用加防护屏的方法,减少环境光的影响。照明系统按其照射方法可分为:背向照明、前向照明、结构光照明和频闪光照明等。其中,背向照明是被测物放在光源和摄像机之间,它的优点是能获得高对比度的图像。前向照明是光源和摄像机位于被测物的同侧,这种方式便于安装。结构光照明是将光栅或线光源等投射到被测物上,根据它们产生的畸变,解调出被测物的三维信息。频闪光照明是将高频率的光脉冲照射到物体上。 2.图像聚焦形成 即被测物的图像通过一个透镜聚焦在敏感元件上,如同照相机拍照一样。所不同的是,照相机使用胶卷,而机器视觉系统使用传感器来捕捉图像,传感器将可视图像转化为电信号,便于计算机处理。机器视觉系统中的摄像机应根据实际应用的要求来选取,其中摄像机的透镜参数是一项重要指标。透镜参数分为四个部分:放大倍率、焦距、景深和透镜安装。 3.图像确定和形成摄像机输出信号 机器视觉系统实际上是一个光电转换装置,即将传感器所接收到的透镜成像,转化为计算机能处理的电信号。摄像机可以是电子管的,也可是固体状态传感单元。 二、图像的处理 机器视觉系统中,视觉信息的处理技术主要依赖于图像处理方法,它包括图像增强、数据编码和传输、平滑、边缘锐化、分割、特征抽取、图像识别与理解等内容。经过这些处理后,既改善了图像的视觉效果,又便于计算机对图像进行分析、处理和识别。 1.图像的增强 图像的增强用于调整图像的对比度,突出图像中的重要细节,改善视觉质量。通常采用灰度直方图修改技术进行图像增强。通常,在计算机中显示的一幅二维数字图像可表示为一个矩阵,其矩阵中的元素是位于相应坐标位置的图像灰度值,是离散化的整数,一般取0,1,⋯⋯,255。这主要是因为计算机中的一个字节所表示的数值范围是0~255。另外,人眼也只能分辨32个左右的灰度级。所以,用一个字节表示灰度即可。但是,直方图仅能统计某级灰度像素出现的概率,反映不出该像素在图像中的二维坐标。因此,不同的图像有可能具有相同的直方图。通过灰度直方图的形状,能判断该图像的清晰度和黑白对比度。 2.图像的平滑 图像的平滑处理技术即图像的去噪声处理,主要是为了去除实际成像过程中,因成像设备和环境所造成的图像失真,提取有用信息。众所周知,实际获得的图像在形成、传输、接收和处理的过程中,不可避免地存在着外部干扰和内部干扰,如光电转换过程中敏感元件灵敏度的不均匀性、数字化过程的量化噪声、传输过程中的误差以及人为因素等,均会使图像变质。因此,去除噪声,恢复原始图像是图像处理中的一个重要内容。 3.图像的数据编码和传输 数字图像的数据量是相当庞大的,一幅512×512个像素的数字图像的数据量为256K字节,假设每秒传输25帧图像,则传输的信道速率为52.4兆比特/秒。高信道速率意味着高投资,也意味着普及难度的增加。因此,传输过程中,对图像数据进行压缩显得非常重要。数据的压缩主要通过图像数据的编码和变换压缩完成。图像数据编码一般采用预测编码,即将图像数据的空间变化规律和序列变化规律用一个预测公式表示,如果知道了某一像素前面各相邻像。素值之后,可以用公式预测该像素值。采用预测编码,一般只需传输图像数据的起始值和预测误差,因此可将8比特/像素压缩到2比特/像素。变换压缩是将整幅图像分成一个个小的数据块,再将这些数据块分类、变换和量化,从而构成自适应的变换压缩系统。 4.边缘锐化 图像边缘锐化处理主要是加强图像中的轮廓边缘和细节,形成完整的物体边界,达到将物体从图像中分离出来或将表示同一物体表面的区域检测出来的目的。它是早期视觉理论和算法中的基本问题,也是中期和后期视觉成败的重要因素之一。 5.图像的分割 图像分割是将图像分成若干部分,每一部分对应于某一物体表面,在进行分割时,每一部分的灰度或纹理符合某一种均匀测度度量,其本质是将像素进行分类。分类的依据是像素的灰度值、颜色、频谱特性、空间特性或纹理特性等。图像分割是图像处理技术的基本方法之一,应用于诸如染色体分类、景物理解系统和机器视觉等方面。 6.图像的识别 图像的识别过程实际上可以看做是一个标记过程,即利用识别算法来辨别景物中已分割好的各个物体,给这些物体赋予特定的标记,它是机器视觉系统必须完成的一个任务。视觉的应用将大幅推进机器人技术的发展。试想在以后的机器人比赛中,我们看到的是以视觉来判断球的方向,或者是靠视觉来找到火源的位置,那将是一件多么让人兴奋的事。 |