
1.1 机器人感知技术概述
在日常生活中,我们作为自然人每时每刻都在对环境进行着感知,只有在对环境有着充分认知的基础上,人才能做出各种行为。同样,机器人环境感知对机器人产生自主性、智能性、社会性具有重要意义。机器人经常需要面对日益复杂的、多变的、多样化的自然场景环境,需要进行多目标、多内涵感知,单一传感器难以完整描述环境,因此,机器人一般需要具有多种传感器。此外,在连续运动过程中,机器人需要同时进行多个任务处理和信息融合,这不仅要求机器人能获取丰富的环境感知信息,同时也对算法实时性、任务调度、多传感器融合等方面提出了新的挑战。首先,机器人利用传感器获取与环境和感知对象相关的底层数据信息。传感器获取的底层数据信息通常为一维、二维或高维距离信息或者其他量化数据信息,一般并不直接用于指导机器人底层运动规划及控制,特别是不能直接用于机器人高层认知任务或任务级规划,而是需要进一步分析、处理、提炼有用信息。然后,机器人对传感器信息进行滤波、变换、分析、提取特征等处理,进而从相关信息中提炼出语义信息、结构信息、任务对象等,才能执行下一步具体任务。在此过程中,机器人不仅需要对距离、尺寸、轮廓、结构等几何信息以及物理量等进行定量感知,而且需要对语义信息、描述信息、动作序列等进行定性感知。最后,在获得综合环境信息后,机器人系统进一步进行分析并完成相关任务。机器人环境感知所涉及的范围十分广泛,本书以视觉感知为主,同时兼顾其他感知。
机器人运行时,需要多种传感器实时、可靠、有效地捕获外界环境和自身工作状态信息,以便准确开展后续行动。我国发射的祝融号火星车可以看作是一种搭载多种传感器的典型机器人(见图1-1)。智能机器人装备的传感器种类繁多,目前比较成熟的机器人传感器类型包括机器人视觉、力觉、触觉、接近觉、姿态觉、位置觉传感器等。如图1-2所示,机器人常用的内部传感器有位置传感器、速度/加速度传感器、扭矩传感器、平衡觉传感器等;常用的外部传感器分为接触式传感器和非接触式传感器,接触式传感器有触觉传感器、滑觉传感器、压觉传感器等,非接触式传感器有视觉传感器、听觉传感器、嗅觉传感器等。这些传感器可能直接安装于机器人本体上,也可能部署在机器人所处智能空间中,与机器人具体应用相关,作为机器人感知基础的传感技术,充分利用光敏、热敏、力敏、电压敏、磁敏、气敏、温敏、声敏、射线敏、离子敏、生物敏等传感特性,以及各种传感器、变送器、二次仪表等多种类型传感装置,结合新材料、新工艺实现微型化、集成化;利用新原理、新方法获取极端环境中各种信息,辅以先进的信息处理技术提高传感器的各项技术指标,以适应极端环境机器人的应用需求。微型化、集成化、多功能化、智能化、系统化、网络化、低功耗、无线、便携式等将成为新型智能机器人感知部件的显著特点。

图1-1 搭载多种传感器的祝融号火星车[1]

图1-2 机器人感知传感器分类[2]
利用机器人感知技术中的立体视觉技术、三维激光扫描技术和3D成像技术可获取与环境有关的丰富度量和语义感知,所以它们受到广泛关注和深入研究。立体视觉技术模拟人的视觉系统直接获取环境信息,该方法由两个单目相机观察同一场景来得到图像对,通过稠密匹配或者稀疏匹配,获得对应像素点,再利用视差原理恢复三维信息。该方法具有精度高、获取信息直观、符合人的直觉等优点,但在某些非结构化环境下存在特征信息难以提取、匹配难度大、计算量大、光线变化适应性差等问题。三维激光扫描技术利用规则移动的激光射线(由三维激光扫描仪生成)来获取所测环境点到传感器的距离信息,进而恢复环境的三维信息。该方法具有环境适应性较强、测量精度高、受光线和环境影响小等优点,但在数据获取实时性、数据处理效率、能量消耗、体积方面存在不足。3D成像技术利用基于TOF(Time of Flight,飞行时间)原理的摄像机获得空间的彩色图像实时信息及每个对应像素的深度信息。该摄像机通常由近红外发光阵列发射调制光源,调制光到达场景后的反射光被摄像机捕获,相机算法分析出发射光与反射光之间的相位差,进而可得到空间点彩色图像的深度信息。近年来,3D成像技术在机器人领域得到广泛应用。典型产品包括微软Kinect摄像机、Swiss Ranger、Asus Xtion等,此类TOF摄像机有时也被称为3D摄像机。该方法具有实时性好、测量精度适中、体积小、重量轻、能耗小等的优点;其缺点也较为明显,如摄像机图像分辨率较低、视野误差分布不均匀等。
通过传感器得到与环境相关的基础数据只是第一步,机器人要根据这些数据形成对环境从局部到整体、从单一模态到多模态的全面认知。机器人的环境感知研究从早期对单一实例物体分割识别逐渐过渡到对多类、多实例物体的快速识别和场景的全局理解。在这一过程中特征提取技术与机器学习方法的发展起到了至关重要的作用,其中支持向量机、集成分类器、深度神经网络等人工智能技术广泛应用于该领域。下面从信息所在的系统层次角度梳理当前感知技术的脉络。