当前位置:首页 期刊杂志

基于多维数据挖掘的智能机器人避障路径自适应选择

时间:2024-07-28

王苗, 李明倩, 刘芳

(1.武汉城市学院,实验实训中心,湖北,武汉 430083; 2.武汉大学,计算机学院,湖北,武汉 430072)

0 引言

智能机器人集合了环境感知、轨迹规划和行为决策等多种功能,一直是高新技术领域研究热点,已经广泛应用在航空、国防、工业生产和医疗服务等领域。机器人技术在国内外普遍得到重视,尤其在西方一些国家,机器人不仅能代替人们探索恶劣的外太空环境,还可以辅助人们进行深海作业,帮助人们完成更多艰巨的任务。无论机器人执行哪种任务都离不开传感器、导航、识别等技术,以解决明确身在何处、目的地点以及如何到达目标地点这三个问题。智能机器人需通过传感器获取环境信息找到最佳避障路径,因此路径选择问题成为机器人执行任务的重要前提。路径选择可描述为在具有障碍物的环境中,根据相关规范为机器人规划一条从起点到终点的不碰撞路径。

现阶段,机器人路径选择经常借助数学工具实现。例如韩顺杰等[1]基于改进粒子群算法规划机器人轨迹。将时间作为适应度函数优化轨迹,融合分段式差值函数与粒子群算法,减少函数构造的复杂度,同时避免陷入局部最优。熊俊涛等[2]利用深度强化学习算法获得机器人避障路径。结合机器人运动学模型和实际工作任务,设置环境观测集合,将其作为网络输入,使用人工势场法构建奖惩函数,将障碍物范围惩罚变换成单一惩罚,分析碰撞结果,优化路径长度,提高机器人工作效率的同时实现避障。

机器人路径选择属于一项复杂的问题,当障碍物静止不动时上述方法能够选择出最佳路径。但是如果障碍物处于运动状态,则会出现碰撞问题。为此,本文通过多维数据挖掘技术确保机器人能够自适应选择避障路径。数据挖掘[3]就是从海量数据中提取有用的信息。实现数据挖掘的方式多种多样,通常分为统计学习和机器学习两大类。本文选用机器学习[4]完成多维数据挖掘。路径选择在机器学习中属于最优化问题,需通过智能算法解决,蚁群算法针对此类问题有着突出的表现。通过机器人采集模块获取作业环境、运动模型、障碍物信息等多维数据,将其作为蚁群算法的参数信息,经过多次迭代,挖掘出有用的信息素,自适应输出最佳避障路径。

1 智能机器人多维数据采集

1.1 机器人运动数据

通过固连坐标系表示机器人在空间内的位置,同时考虑机器人位置矢量等相关概念[5]。

(1) 位置描述

(1)

(2) 位姿描述

(2)

1.2 作业环境数据

构建机器人工作环境模型,通过环境表示方法描述工作区域内的机器人位置,为路径规划提供依据。假设B代表一个智能机器人,在作业区间内存在多个障碍物O={O1,O2,…,On},将每个障碍物当作一个多边形。为便于描述机器人运行路线,将其看作一个点。

利用可视图建模方式建立作业环境模型[6],主要步骤如下。

步骤一:简化障碍物,假设PS和PG分别表示机器人起点与终点,作直线PSPG,保证PSPG可以穿过障碍物;分别在PS、PG两端选择距离PSPG最远的障碍物顶点Phigh和Plow;利用PS、PG、Phigh和Plow4个点作四边形,如果PS和PG的某一端存在多个满足要求的顶点,则将这些点分别和起点、终点相连;判断是否存在除穿越穿直线PSPG外的其他障碍物和四边形相交,即使位于四边形内部也算相交,如果有,则需要保存;保留穿过直线PSPG的障碍物和与四边形相交的障碍物,去除其他障碍物。

步骤二:视图最小化处理,最小化视图由2个障碍物的公共切线构成,按照相关要求能够分割为多个最小可视图。

步骤三:全局视图[7],将点PS和PG添加到工作区域中,构建完整视图。

1.3 障碍物感知数据

如果仅依靠单一传感器获取障碍物信息,难以保障信息的全面性。机器人自身设置了多种类型传感器,利用这些传感器采集障碍物形状、大小、状态等数据。

将视觉传感器作为障碍物形状信息采集的第一阶段,再通过超声波和红外传感器分别测试障碍物距离,通常情况下超声波适用于短距离测试,而红外传感器则多用于长距离,使用二者共同检测的方式弥补了各自不足,可获取障碍物精准信息。

(1) 图像采集

图像采集是机器人视觉系统的重要功能[8],此模块同时也负责图像处理、储存、结果判断等任务,将判断结果通过无线网络上传到上位机。机器人图像采集部分整体结构如图1所示。

图1 图像采集模块结构图

(2) 超声波测距

超声波[9]类型的传感器包括发送端和接收端。在测距过程中,碰到障碍物时,声波返回,接收端不再计时。如果V是超声波传播速度,t是发送和接收的时间差,则机器人到障碍物的距离S表示为

(3)

温度对超声波传输速度带来一定影响,若温度为T,超生波传输速度表达式如下:

V=221.45+0.607T

(4)

(3) 红外测距

红外传感器通过光学测距原理获取障碍物距离。假设在红外系统中,光源经过透镜L1后生成外发散光线,光线触碰到障碍物时反射,又经过透镜L2汇聚到光敏器件中,构成入射光斑D。如果L1与L2的间距是b,透镜与光敏器件的间距是f′,光斑D和光敏器件中心点C的间距是y′,则结合三角形相似理论,获得待测距离h:

(5)

只要获取光敏器件中入射光点的坐标,即可获取障碍物距离。

2 基于多维数据挖掘的机器人避障路径选择

2.1 避障路径自适应选择的约束条件

为获得最佳路径选择结果,基于上述获取的机器人运动参数、作业环境数据以及障碍物距离等多维数据,设计一种基于蚁群算法的数据挖掘方法,通过挖掘过程实现机器人避障路径的自适应选择。在算法执行前,还需设置路径选择的相关约束条件,确立目标函数。

(1) 时间约束

f1=min(maxt′) (1≤t′≤n)

(6)

式中,f1是机器人从起点PS到终点PG所用的最短时间,t′是时间节点。

(2) 路程最短

(7)

式中,f2是PS与PG间最短轨迹,(xi,yi)是路径坐标点。

(3) 转弯次数

(8)

式中,f3是机器人运行过程中的最少转弯次数。

结合上述3个约束条件,建立机器人路径选择目标函数:

F=a1f1+a2f2+a3f3

(9)

式中,a1、a2和a3都属于最优路径选择系数。

2.2 机器人避障路径自适应选择

将采集的所有多维数据作为蚁群算法的参数信息,通过蚂蚁觅食过程实现机器人避障路径自适应选择。蚁群算法在问题空间进行独立的解搜索不仅增加了算法的可靠性,也使得算法具有较强的全局搜索能力。不仅如此,蚁群算法具有较强的鲁棒性,且参数数目少,设置简单,因此具有较高的执行效率。

蚂蚁在寻找食物时会产生信息素,路径越短的蚂蚁产生的信息素越多,随时间增加,信息素会越来越多,而选择该路径的蚂蚁也会增加。利用此种反馈机制系确定最佳路径,该方法具有自适应性强、迭代过程简便等优势。具体实现过程如下。

(1) 信息素表示

信息素作为蚁群觅食过程的信息载体,影响着算法的全局收敛性能,决定求解速度。当利用蚁群算法计算三维空间路径选择问题时,通常使用栅格化建模方式,将空间做网格化处理,用离散点表示网格单元。

为减小空间复杂程度,将离散点直接作为信息素载体,任意一个离散点均有各自的信息素值,该值大小决定了对蚂蚁的吸引程度。

(2) 状态转移规则设置

算法执行过程中,蚁群会根据信息量选择目标点,将其称为转移概率[10],其中决策规则即为伪随机比规则。此规则就是在转移时,利用启发信息和信息素信息,对目标点做趋向性搜索。本文设置的概率转移规则如下。

假设蚂蚁数量为M,将所有蚂蚁放置在初始位置,在路径生成过程中,利用式(10)获取下一步蚁群将会移动到哪个位置:

(10)

式中,J属于随机变量,q和q0均为随机常数,取值范围分别为q∈[0,1]、q0∈[0,1]。τt′+1描述平面上某点的信息素含量,ηt′,t′+1属于启发函数[11],可启发未来信息。

针对平面∏t′+1上某点Pt′(it′,jt′,kt′)上的蚁群,选取∏t′+1上的Pt′+1(it′+1,jt′+1,kt′+1)的概率表示为

(11)

将两个邻近路径之间的距离当作路径选择的优化准则[12],则启发函数ηt′,t′+1表示为

(12)

式中,d′为两个相邻路径之间的最短距离。

(3) 信息素更新准则

在蚁群规划路径时,必须掌握环境的全局信息。为此,需更新全部路径上的信息素,计算信息素浓度差异[13],便于选择最佳路径。

信息素更新通常包括全局和局部更新两种。其中,前者表示蚂蚁完成某次循环后对整个空间的信息素更新,更新公式如下:

(13)

(14)

(15)

式中,ρ是信息素挥发因子,取值为0<ρ<1,Δτit′jt′kt′是经过一次循环后,信息素增量。

局部更新。当蚂蚁转移到新路径点上时,需使用局部更新方式更新信息素:

(16)

式中,μ代表常数,取值为0<μ<1。

重复状态转移和信息素更新过程,当满足迭代次数要求时,输出所选的避障路径。

3 仿真实验数据分析与研究

仿真实验中,选择轮式智能机器人作为仿真目标。该产品由飞凌公司生产,在市场上应用较为成熟。其内部资源丰富,Samsung S3C6410是它的核心,可支持多类型接口,开发人员可根据自身需求调试。除安装超声波传感器外,还设置了红外传感器,可采集多维度环境信息。机器人其他性能参数如表1所示。

表1 机器人性能参数表

在机器人参数不变条件下,分别设置静态和动态障碍物场景,分析本文方法、改进粒子群算法和深度强化学习方法自适应选择路径,测试结果如下。

(1) 静态障碍物环境

当障碍物为静止不动时,假设不同方法下的机器人起点和终点的位置相同,则路径选择情况分别如图2~图4所示。

图2 本文方法自适应路径选择结果图

图3 改进粒子群算法自适应路径选择结果图

图4 深度强化学习方法自适应路径选择结果图

分析图2~图4可知:当障碍物为静态时,本文方法能够选择最短路径;改进粒子群算法虽然能够成功躲避障碍物,但是路径较长;深度强化学习算法当躲避障碍物转弯时出现碰撞现象。这是因为本文选择的目标函数较为合理,在时间、路程和转弯次数最少的约束下完成避障路径自适应选择。

(2) 动态障碍物环境

假设机器人运动的起点坐标为(1,19),动态障碍物的起点坐标为(2,5),两者分别以各自设定的速度运动。假设在不躲避障碍物情况下,在坐标为(16,5)处相遇。在此种状况下,分别利用不同算法完成避障路径自适应选择,选择结果如图5~图7所示。

图5 本文方法路径选择结果图

图6 改进粒子群算法路径选择结果

图7 深度强化学习方法路径选择结果

由图5~图7能够看出,在障碍物不断运动的情况下,本文方法可以准确判断出障碍物的位置,及时躲避障碍物,未发生碰撞现象。此外,避障结束后本文所提方法的机器人依然能够快速回到指定运行轨迹上继续前进,直到到达终点位置。这是因为基于蚁群算法的多维数据挖掘可以有效获取各方面信息,综合这些信息为路径选择提供更多依据。

(3) 算法收敛性比较

算法收敛性是验证算法收敛性能最为重要的指标之一,所以比较了本文算法、改进粒子群算法、深度强化学习算法在智能机器人避障路径自适应选择中的收敛性,比较结果如图8所示。

图8 算法收敛性比较

分析图8可知,改进粒子群算法在130次左右实现了收敛,损失值保持在较低水平,说明这一算法的收敛速度慢。而与改进粒子群算法相比,深度强化学习算法的一直未收敛,且损失值保持在一个较高的水平,说明该算法的收敛性能差。本文算法在30次左右就实现了收敛,且损失值一直保持在一个较低水平,说明该算法的收敛速度快,收敛性能更优。

4 总结

为进一步扩大智能机器人的应用领域,完善路径选择等功能,本文利用多维数据挖掘方法选择避障路径。融合环境、机器人自身动力学参数、障碍物信息等多维数据,通过蚁群算法的迭代过程不断挖掘数据的有用信息,为路径选择提供数据支持。仿真实验表明,本文所提方法在障碍物为静态和动态时都能表现出很强的避障能力。还有更多问题需要解决。例如,建立的机器人工作环境较为简单,应提高环境复杂度。此外,基于蚁群算法的数据挖掘还要解决算法搜索速度问题,提高搜索效率。

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!