
1.1.2 拓扑层环境感知技术
拓扑层环境感知技术指机器人直接或间接获取某些环境要素(如布局、结构和物体等)的拓扑信息,并基于此类信息形成对环境“识别”的技术。
对环境布局的拓扑层感知主要依赖于拓扑地图创建技术。拓扑地图通常具有表达紧凑、所占计算资源少、适用于大范围环境建模、适用于人-机器人交互[23]等优点,并且其建图过程需要较少的精确度量级传感数据(Metric Sense Data)[24],因此,相关研究引起众多研究人员的持续关注。目前,常见的拓扑地图形式有无向图、有向图和二部图(Bipartite Graph)[25]等。拓扑地图以顶点(Vertex)描述环境中的地点(Place),以边(Edge)描述不同地点间的连通性(Connectivity),从而构成环境布局的图(Graph)模型。不同类型拓扑地图的顶点定义各不相同,拓扑地图中顶点和边的含义依赖于应用和建图算法[26],这造成了拓扑地图的多样性及相关研究的复杂性,并且难以对不同建图方法的性能制定统一的评价标准。
拓扑地图创建方法可以分为两类:一是从已有度量地图间接获取环境的拓扑表达;二是直接利用传感器获取环境的拓扑结构。前者主要目的在于为后续规划任务的开展提供便利[27],可以看作是在度量层感知结果的基础上,从拓扑角度对环境布局的再感知,目前大部分拓扑地图的创建过程采用了后者的建图模式。无论采用何种方法定义和建立拓扑地图,都需要充分考虑建图过程中的感知混淆(Perceptual Aliasing)问题。Ranganathan等人[28]提出一种概率拓扑地图(Probabilistic Topological Maps,PTMs)框架,提供了一种感知混淆问题的系统解决方案;2011年,Ranganathan等人[29]在实时性约束下对原PTMs进行了改进,提出在线概率拓扑建图(Online Probabilistic Topological Mapping,OPTM)算法;Werner等人[30]提出使用特定地点的邻域信息解决感知混淆问题。
除激光传感器、超声波传感器等传统传感器外,近年来,基于全景视觉[31](Omnidirectional Vision)的方法被用于解决拓扑SLAM问题,该方法使用全景摄像机作为传感器采集环境拓扑信息。全景视觉传感器的引入带来一些新问题,相关学者围绕这些问题已经开展了很多研究工作,如Liu等人[32]针对全景视觉提出一种轻量级描述子FACT(Fast Adaptive Color Tags),可实时生成拓扑建图的节点列表。
尽管有些拓扑建图方法得到的拓扑顶点对机器人具有重要意义(可用于定位及导航等任务),但是对人而言并无明确含义。然而,有些方法却能够获得对人同样有意义的拓扑顶点,使得机器人与人的概念空间在某种程度上相契合,含有此类顶点的拓扑地图不仅能用于机器人导航等基础任务,还能用于辅助人机交互等高层任务。这类具有语义属性的拓扑地图的构建方法受到了相关学者的关注。Mozos等人[33-34]对相关问题进行了深入研究,文献[33]利用AdaBoost算法对几何地图上每个点实现了语义分类,所得拓扑地图的顶点具有“房间”“门口”和“走廊”等显式场所语义。
面向局部空间环境或对象,一系列拓扑层感知技术也应运而生。Aleotti等人[35]受神经心理学领域知识(人基于部件分解实现对物体的感知)的启发,提出一种抓取规划方法:首先对物体模型进行拓扑分解,然后对物体进行分类并自动标注,这两步从拓扑层面完成了物体感知,在此之后进一步开展抓取规划。该方法不仅能够提高规划速度,而且能够在先前未知的相似物体上开展抓取规划。Rosman和Ramamoorthy[36]提出构造物体的联系点网络(Contact Point Network,CPN),从而在以点云描述的场景中捕捉单个物体和整个场景的拓扑结构,形成场景的分层表达。这种表达有助于机器人在不同层次上实现与物体有关的推理等行为,从而广泛地执行任务。
隶属于拓扑层环境感知技术的其他相关研究将不再赘述。总之,拓扑方法获得的环境模型通常具有表达紧凑、对变量干扰鲁棒性强等优点,其表达方式与人的认知行为存在某种相似之处,使模型本身有语义信息包含能力,可为人机交互等高层任务的执行提供便利。