无人机避障航路规划方法研究综述

时间：2024-07-28

吴健发，王宏伦，刘一恒，姚鹏

（1. 北京航空航天大学自动化科学与电气工程学院，北京100191；2. 北京航空航天大学飞行器控制一体化技术重点实验室，北京100191；3. 北京航空航天大学高等理工学院，北京100191；4. 中国海洋大学工程学院，青岛266100）

1 引言

无人机（Unmanned Aerial Vehicle，UAV）因其具有性价比高、使用灵活、不受飞行员生理条件限制等优势，在军用和民用领域得到广泛应用，受到世界各国的认可。最近30 多年来，随着航空、控制和电子信息等技术的发展，世界各国对无人机领域持续关注并加大投入，无人机技术取得了长足的进步与发展，代表了当今高新技术的发展方向。

随着无人机的作业空域从中、高空不断向低空甚至超低空拓展，所面临的障碍环境的复杂性逐渐上升，具体表现为低空障碍环境具有密集性、非凸性、动态性（存在突发威胁、移动障碍等）和不确定性（存在部分未知或完全未知的障碍信息等）的特点［1］。复杂的障碍环境给无人机的飞行安全带来极大的挑战，例如，2016年2月4日，一架小型无人机在拍摄电影过程中失误撞击纽约帝国大厦［2］；2019年11月16日，俄罗斯猎户座军用无人机在低空试飞时与树木发生碰撞，导致飞机坠毁［3］。这些事故的发生对无人机的自主控制能力提出了更高的要求。

作为反映无人机自主控制能力的关键技术之一——避障航路规划技术受到了广泛的关注［4］。无人机避障航路规划是指在特定的任务背景下，寻找使无人机由起始点按照一条较优的飞行路径，最终到达目标点的飞行航路，这种飞行航路应满足无人机自身的物理约束条件，同时应能够安全躲避障碍和威胁。目前，国内外学者针对该问题从不同角度开展了大量研究，并提出各种不同的理论与方法，本文将对当前主要的规划方法进行综述，重点介绍方法组成、基本原理、代表性研究以及优缺点。在此基础上，对其未来可能的发展方向进行展望。

2 避障航路规划方法

避障航路规划是无人机任务规划的基础与重要组成部分。依据航路规划所建立优化模型的不同，可将其大致分为基于数学规划的方法、基于路标图的方法、基于空间分解的方法、基于势场的方法、基于随机规划的方法和基于机器学习的方法六大类。但需注意的是，航路规划方法的分类并无统一界定，且许多学者在使用时将两种或多种方法结合，可发挥各自方法的优势。本文仅提供一种分类思路。

2.1 基于数学规划的方法

数学规划是指在满足一系列约束条件下，寻找目标函数最优解的过程。航路规划问题，从本质上可看作是一种非线性的、包含状态约束与控制约束的最优控制问题，因此较为直观的思路是采用数学规划方法来解决该问题。在面向避障任务的航路规划研究中，无人机需躲避规划空间中的静态障碍或动态威胁，因此数学规划法需将障碍物或威胁源等效为相应的不等式约束；航路可飞性是航路规划的基本要求，因此必须考虑无人机的动力学约束条件；然后，将各项指标（如飞行时间、路径长度、能量消耗、威胁程度等）建模为目标函数，通过优化计算求解最终使目标函数取极值。数学规划方法［5］主要包括动态规划法、混合整数线性规划（Mixed Integer Linear Programming，MILP）、模型预测控制法（Model Predictive Control，MPC）/滚动时域控制法（Receding Horizon Control，RHC）、基于Markov决策过程的方法等。

传统的动态规划法是应用较为广泛的一种方法，通过将规划问题等效为多级决策问题，依据Bellman 最优性原理，确定每步决策与状态转移，最终生成一个决策序列。Denton R V 等［6］采用了动态规划技术，并与树形搜索相结合，通过将三维航路分解为水平与垂直两个方向进行计算，求得三维最优地形跟随/地形回避航路。Bousson K［7］提出了一种单网格点动态规划方法来解决一些典型的在线最优控制问题，如飞行器碰撞规避问题。动态规划方法原理较为简单，一般具有全局最优解，易于工程实现。但该方法最大的不足在于需要大存储空间，对于大规模的航路规划问题，会出现组合爆炸现象，因此比较适合小规模航路搜索。

MILP方法将无人机的控制指令（如航向角、速度等）建模为整数或二值约束，然后通过线性规划计算最优航路［8］。Radmanesh M等［9］提出一种基于有限视野的动态MILP航路规划算法，从而有效地克服了传统MILP在规划航路时计算量较大的缺点。Turnbull O等［10］将MILP与MPC相结合，作为参考避障航路规划器，用于离线训练改进的语言决策树（Linguistic Decision Trees，LDTs），然后再利用训练好的具有高实时性的LDTs进行在线航路规划。Sarim M等［11］将航路规划分为两个阶段，首先用A*算法在仅考虑静态障碍的前提下实施粗略航路规划生成初始规划航路，在此基础上，利用MILP进行精细化航路规划，从而生成可规避动态障碍的最终航路。MILP算法的计算量较大，难以满足航路规划实时性要求。

MPC/RHC 算法提供了一种适于复杂动态环境下实时优化决策的理论方法，通过模型预测与实时校正，在滚动时域内进行局部优化来实现全局优化。该类方法的最大优势在于可应对动态环境中的各种不确定性因素，保证算法的实时性。Grancharova A等［12］采用分布式线性MPC 算法解决多无人机协同航路规划问题，将通信航路损失、动态威胁程度等约束用线性函数表示，并利用凸二次规划方法进行求解。Wu J 等［13］将城市环境下无人机持续跟踪目标航路规划问题建模为一个分布式MPC问题，并利用自适应草蜢优化算法在线解算无人机的最优控制输入，从而使规划出的航路能够兼顾避障和目标跟踪。Luo G 等［14］将RHC 与人工势场法相结合，利用RHC优化人工势场中的附加控制力，从而实现无人机的在线避障。

此外，其它数学规划方法也被应用于无人机避障任务过程。宁芊等［15-16］将Markov生存模型引入航路规划算法中，得到一个可用来评估路径点生存概率的航路规划问题模型，从而实现对最优航路的动态搜索。Ragi S等［17］提出一种基于部分可观Markov决策过程（Partially Observable Markov Decision Processes，POMDPs）的航路规划框架，在该框架下，通过适当地构造POMDP的动作空间、过渡律和目标函数，可使无人机在复杂动态障碍环境下执行目标跟踪任务。

通过分析上述文献可知，数学规划算法是一种较为直观的方法，但由于数学优化本身的特性，该类方法仍存在如下缺陷：当动力学或环境约束较为复杂时（特别对于存在多个非凸约束的情况），求解难度和计算量较大，难以保证算法的实时性。

2.2 基于路标图的方法

基于路标图的方法最初应用于机器人运动规划中，由于问题相似性，该类方法也可应用到二维环境下的无人机航路规划问题中。其基本思路是，首先根据一定的规则将规划空间表示成由一维线段构成的路标图，并对路线图上的每条边赋予一定的代价值（路径长度、威胁度等），然后采用某一种搜索算法在该图上寻找使搜索代价最小的联通路径，这样二维路径规划问题被转化为一维图搜索问题。典型的路标图方法包括可视图法（Visibility Graph）和Voronoi图法等。

图1 可视图法（左）和Voronoi图法（右）示意图Fig.1 Visibility graph(left)and Voronoi graph(right)

可视图法的基本思路为［18］：在二维空间中，构建连接各障碍物多边形顶点的可视图，其中需保证任意两顶点的连线不经过障碍物区域，然后从中寻找最短的路径作为规划航路。虽然可保证算法的完备性与最优性，但该方法不能表达无人机的方向性约束，即无法保证航路是可飞的，难以将其应用于实际航路规划中。

Voronoi图法的基本思路为［19］：根据障碍物布置情况，依次画出相邻两个障碍物的中垂线，从而形成围绕各障碍物的多边形，所有边界即构成Voronoi图，可保证路径与威胁的距离最大；然后，对每条路径赋权值（如路径长度、威胁度等）；最后，采取某种搜索算法寻找代价和最小的最优航路。由于该方法考虑了航路最优性与障碍物距离约束，因此广泛应用于无人机航路规划中。Bhattacharya P 等［20］在指定区域内构建Voronoi图，并采取迭代平滑处理策略优化航路，最终实现动态航路的在线规划。朱杰等［21］提出了一种改进型的Voronoi图构造模型，该模型通过引入威胁源的不可穿越区域边界，利用折中原理，在Delaunay 三角网的基础上构建航迹拓扑空间，在此基础上，采用D*算法进行航路重规划。此外，由于三维空间内Voronoi 图将变得非常复杂，因此部分学者采用平面分割方法将三维空间航路规划问题转换为二维平面的搜索问题［22］。

路标图法原理简单，但必须表示出规划空间内的所有可能路径，否则可能丢失最优解。此外，该类方法本质上属于二维航路规划算法，在三维环境下的路标图将变得非常复杂，其在线规划能力较差，并且规划的航路不平滑甚至不满足飞行器运动学约束。

2.3 基于空间分解的方法

空间分解法的基本思路为：首先，采用栅格法等将任务空间分解成一些具有规则形状的单元（通常为正方形），并判断这些单元是否被障碍物覆盖或与障碍物相交；然后，找到包含起始点与目标点的单元，并采用某一搜索算法（如A*、D*等启发式算法，遗传算法、粒子群算法等智能优化算法等）寻找一系列连通的单元将起始单元和目标单元连接起来。

启发式搜索算法是一种决策性搜索算法，以A*算法为代表，它根据问题求解的目标信息引入启发式信息，使搜索过程具有导向性，极大地提高了搜索效率［23］。A*搜索算法的代价函数可表示为f（n）=g（n）+h（n），其中g（n）为初始节点到当前节点n的航路代价，h（n）为当前节点n到目标节点的预测代价。在路径搜索过程中，以代价函数f（n）作为启发信息，选择代价值最小的节点并插入到路径链表中。经证明，只要启发式因子满足单调性条件时，A*算法一定能找到最优路径。Szczerba R J 等［24］利用稀疏A*算法将无人机约束条件进行简化并将其引入到代价函数中，减小了搜索空间，因此航路规划时间得到有效缩短。占伟伟等［25］将二维A*算法扩展到三维空间中，分别在二维平面内和垂直方向上规划航路，并通过Monte Carlo方法进行了仿真。

由于传统A*仅能用于静态环境规划，因此许多学者对其进行了改进，其中最为典型的为D*算法［21］或D*Lite 算法［26］。D*算法与A*算法的区别在于，当环境改变时，或无人机探测到的周围环境信息变化时，对路径代价值进行相应更新。当探测到环境变化时，由于该类算法只对直接受到影响的节点的代价值进行更新，且在启发式信息中保证该节点的优先级，因此该方法能够快速规划出最优路径，保证了动态航路规划的实时性与高效性。

智能算法属于随机型智能搜索算法范畴，通过在求解空间内基于随机的方式搜寻最优值。智能算法是近年来兴起的模拟生物进化或种群行为等自然现象的一类优化方法，具有全局优化能力强、并行机制、灵活性高、易与具体应用问题相结合等优势，因此近年来越来越多地应用于无人机二维或三维航路规划问题中，例如遗传算法（Genetic Algorithm，GA）［27］、粒子群算法（Particle Swarm Optimization，PSO）［28］、鲸鱼优化算法（Whale Optimization Algorithm，WOA）［29］、蚁狮算法（Ant Lion Optimizer，ALO）［30］、鸽群算法（Pigeon-Inspired Optimization，PIO）［31］等。

空间分解法中网格地图的构建需要耗费大量的计算时间，因此当网格数较多、分辨率较高、地形信息动态变化时，该类算法难以保证路径规划的实时性。此外，在复杂情景下，用于航路搜索的启发式算法或智能算法的计算量较大，因此实际中大多应用于处理环境不确定性低、地形简单的静态航路规划问题。同时该类算法所规划航路的平滑性也不够理想。

2.4 基于势场的方法

基于势场的方法通过将规划空间建模为一种具有高低不同势场的区域来进行规划，通常起始点的势场最低而目标点势场最高，然后在该势场区域内进行路径搜索。该类方法将物体的运动看成是作用力的结果，从而进行路径规划研究，典型算法包括人工势场法（Artificial Potential Field，APF），流函数法（Stream Function，SF），扰动流体动态系统法（Interfered Fluid Dynamical System，IFDS）等。

APF 算法最早由美国学者Khatib O 提出［32］，其基本思想是将运动体在周围环境中的运动设计成在一种抽象的人造力场中的运动，其中目标点对运动体产生吸引力场，障碍物对运动体产生排斥力场，根据可加性原理，多障碍物存在时的总排斥力为各障碍物排斥力的累加，这样将合力引入底层控制，可以得到有效的局部防撞路径。APF 算法计算量较小，适用于在线路径规划，但存在着局部极小点和目标不可达等问题。针对这种状况，许多研究者对该算法进行了分析与改进，其中最有代表性的是新加坡国立大学的葛树志，其团队改进了APF中排斥势场函数，初步解决了APF 中局部极小点、目标不可达以及规避移动威胁的问题［33-34］，同时还将APF 的应用拓展至多机器人编队协同路径规划中［35-37］。受上述文献启发，部分研究者开始探索各种新构型APF，并尝试APF 与其他航路规划方法相结合。Cao L 等［38］提出一种基于Gaussian 斥力函数的APF用于飞行器避障三维航路规划，从而实现更优的抗局部最优特性和可达性。文献［14，39-41］为APF引入了附加吸引场的概念，通过适当调节附加吸引场的大小和方向，在一定条件下可有效避免局部最小情况的发生。

APF 可迅速规划出光滑的避障路径，因此其经常被用于在线避障规划。但该类方法存在如下问题：（1）在APF 中，没有障碍形状（包络）的概念，完全依靠调整力场生成航路，因此当力场参数调整不恰当时，无人机有可能进入障碍内部，导致避障失败；（2）APF的力场容易陷入局部极小。

针对APF 存在的问题，立足于势场的基本思想，文献［42-43］提出了流函数法，该方法具有规划速度快、路径平滑等优点，其基本思路如下：在规划空间内引入某种初始流场，可根据流体力学知识求得其速度势；当流场中存在障碍物时，可建立障碍物势场与原初始流场叠加得到总势场，对其速度势求导获得流场流速；对流速积分得到流体流线即规划航路。该方法是APF的一种变形，具有APF函数的一般特性，但能在一定程度上避免局部极小问题。一些研究工作对该算法进行了改进。梁宵等［44］提出一种基于行为伸缩功能的滚动窗口启发方向计算方法，使其跟踪目标，并在滚动窗口内采取流函数法规划局部避障航路，经验证该方法可有效减少计算时间与空间复杂度，实现动态航路规划。Daily R 等［45］在采用流函数法解决躲避单障碍物问题的基础上，采用加权求和法解决了两个甚至多个障碍物存在时的航路规划问题。

图2 流体扰动示意图Fig.2 Schematic diagram of IFDS original fluid flows and interfered fluid flows

然而，当规划空间由二维扩展到三维时，流函数的概念将不复存在，因此该方法主要用于二维环境下的路径规划。针对这一情况，本课题组在参考流函数法中相应流体概念的基础上，进一步提出了基于流水避石思想的三维航路规划方法［46］。该方法借鉴了自然界水流流动的宏观特征：当无障碍物时，水流沿直线流动；当遇到障碍物时，水流会平滑地绕过该障碍并最终流向终点。同时，引入三维障碍外包络的概念，将航路规划与流体计算有机结合，通过流体力学方法对三维地形进行流场模拟，并综合考虑无人机性能约束、飞行安全性、航路代价等指标进行航路优选，最终得到满足任务要求的三维光滑可飞航路。其计算方法分为解析计算和数值计算两种，解析法适合障碍分布简单的情况，计算量小，航路分布于起点至终点的航路带间；数值法适合复杂的地形情况，航路能够充满规划区域。

遗憾的是，传统流水避石方法仍存在一定的局限性：其中的解析法仅能处理球体障碍，对于其他立体障碍（例如柱形、锥形等）难以获得其解析解；而数值法由于需要采用CFD 进行模拟，计算量过大，仅能用于离线航路规划。另外，传统流水避石方法由于自身的复杂性，难以与其他任务背景相结合，仅能做单纯的避障机动，极大的限制了其应用。

从航路规划的角度来讲，对于更为复杂的障碍物，可以放宽对流体物理性质的限制，重点关注流体的避障特性，从而降低方程求解的难度。因此，针对传统流水避石方法存在的问题，本课题组首次提出了扰动流体动态系统（Interfered Fluid Dynamical System，IFDS）避障算法［47］，该算法以解析法为基础，但避免了求解带有复杂边界条件的流体方程，便于处理复杂的地形和不同形状的障碍物。规划航路不仅具有仿流水避石的自然特性，而且环境建模简单，计算量小，大大拓展了流水避石方法的适用范围。

IFDS 提取了自然界流水避石现象与避障航路规划问题的相似之处：河流中的石头可看作无人机需躲避的障碍物；笔直的流水可看作初始流场，初始流场流线即为无障碍环境下的初始航路；绕过石头的流水可等效为扰动流场，扰动流场流线即为障碍环境下的规划航路。IFDS 算法的关键在于求解扰动流场的流速，算法的基本步骤为：首先建立初始流场即汇流，然后将障碍物对初始流场的扰动影响用扰动矩阵量化表示，接着通过修正初始流场流速获得扰动流场流速，最后对其迭代积分即可得到扰动流场流线，即无人机的规划航路。在静态IFDS的基础上，文献［48-49］进一步引入相对初始流场的概念，从而使IFDS 能够同时应对静态障碍与动态威胁。为解决规划过程中存在的驻点和陷阱区问题，虚拟障碍［47］、虚拟目标点［50］、切向矩阵［51-54］等策略被引入IFDS中。为解决规划航路的可飞性问题，文献［50］、文献［53-54］和文献［29，55］分别将轨迹延拓方法、RHC 方法和无人机运动学模型与IFDS 相结合，从而使规划航路更加符合无人机的运动学特性。

相较于其他避障航路规划方法，基于势场的方法的计算量小、实时性高，便于执行在线航路规划任务，且规划的航路相对平滑，但在设计使用时仍需要着重考虑规避局部极小问题。

2.5 基于随机规划的方法

基于随机规划的方法最初用来解决基于APF的路径规划算法中存在的局部极小问题，其基本思路是在状态空间中以随机采样的方式扩展构建可行路径集合，然后在以图结构或树结构表达的路径集合中寻找完整可行路径。随机规划法主要包括随机路标图法（Probabilistic Roadmaps，PRM）和快速扩展随机树（Rapid Exploring Random Trees，RRT）。

PRM法以图的方式表示路径集合，其主要包括两个阶段：学习阶段，在状态空间内进行随机采样并进行碰撞检测，若采样点在自由空间内，则将该采样点加入路线图中，否则丢弃该采样点，从而构建起包含若干连通单元的路径图；查询阶段，从上述路径图中寻找从起始点到目标点的连通路径。Lien J M等［56］采用中轴线采样方法，解决了PRM算法中随机采样点难以覆盖狭窄通道的问题。Sanchez-Lopez J L 等［57］利用PRM 对规划空间进行采样，然后利用人工场图作为代价函数的离散搜索算法对生成的PRM进行搜索，得到原始的最优无碰撞路径，再将其缩短。由于PRM 算法规划航路的优越性很大程度上取决于采样阶段的分配时间，且该算法不能通过局部更新航路应对动态情况，因此PRM算法主要应用于离线航路规划。此外由于PRM 算法在规划过程中不考虑无人机动力学约束，故该算法难以保证规划航路的可飞性。

与PRM算法相比，RRT算法采用树表示路径集合，且将系统状态模型引入路径规划过程中，因此可处理无人机复杂动力学与运动学约束问题［58］。其计算速度快，实时性好，可用于动态不确定性环境，得到了广泛的应用。但随机思想的引入也导致了规划结果优化的不足，且其避障特性不甚理想，许多学者对此进行了改进。尹高扬等［59］通过引入航迹距离约束，使搜索树沿路径距离最短的近似最优航迹方向进行扩展，克服了RRT方法随机性强的缺陷。温乃峰等［60］通过引入代价模型，提出约减域逐步构造方法，引导规划树快速有效扩展，改善了RRT算法中存在的采样空间过度约减问题。

图3 RRT节点扩展示意图Fig.3 Expansion of nodes in RRT

基于随机规划的方法尤其是RRT 算法能处理无人机的复杂动力学与运动学约束，且具有概率意义上的完备性。但节点的随机采样过程使得该算法规划的航路难以保证最优性。此外，由于该方法在随机采样过程中需判断某一节点是否属于自由空间，属于被动的避障策略，因此不适用于复杂地形或动态环境。

2.6 基于机器学习的方法

近年来，以强化学习（Reinforcement Learning，RL）和深度学习（Deep Learning，DL）为代表的机器学习方法蓬勃发展，在无人机自主飞行控制与决策领域发挥着越来越大的作用［61］。

强化学习采用了人类和动物学习中的“尝试与失败”机制，强调在与环境的交互中学习，利用评价性的反馈信号实现决策的优化。其过程是一个试探与评价的过程，基本原理为：智能体在环境s下选择并执行一个动作a，环境接受动作后变为s′，并把一个奖赏信号r 反馈给智能体，智能体再根据奖赏信号选择后续动作。由于强化学习在学习过程中不需要给定各种状态下的教师信号，因此其在求解复杂的优化决策问题方面有着广泛的应用前景。强化学习可分为基于值函数的强化学习和基于策略的强化学习。在基于值函数的强化学习中，最常用的学习算法为Q 学习算法，大量研究将其应用于无人机或机器人的路径规划中，例如，Low E S 等［62］提出一种部分引导的Q 学习算法，该算法在实施Q学习前利用花授粉算法初始化Q 表，从而提高了算法的收敛速度；Konar A等［63］提出一种确定性Q学习方法，它具有从当前状态到下一个状态以及目标的距离的假定知识，因此不必像传统Q 学习算法重复更新知识，从而使移动机器人在迷宫中进行路径规划时具有更小的时间复杂度。然而，由于Q 学习算法的状态空间和动作空间均为离散的，因此其规划航路的可飞性较差，且难以应付动态威胁。针对此缺陷，研究者提出将深度学习和强化学习相结合，组成深度强化学习算法（Deep Reinforcement Learning，DRL），以满足状态空间或动作空间连续化的需求。DRL 的开端是深度Q 网络（Deep Q Network，DQN），由DeepMind公司于2013年提出［64］。文献［65-66］在路径规划中引入了不同改进型的DQN，取得了较好的效果，但由于DQN 的动作空间仍然是离散形式的，因此规划的路径质量仍有进一步提升的空间。

为了实现连续的状态空间和动作空间，研究者进一步将强化学习的另一个分支：基于策略的强化学习与深度学习相结合，提出了基于策略的DRL算法，包括深度确定性策略梯度算法（Deep Deterministic Policy Gradient，DDPG）［67］和分布式近似策略优化算法（Distributed Proximal Policy Optimization，DPPO）［68］等。尽管一些学者已尝试将其应用于无人机和无人车的路径规划中［69-71］，但这些研究所涉及的场景相对于无人机的复杂作业环境来说仍相距甚远。此外，由于复杂环境中约束较多，因此相较于Q学习和DQN等基于离散空间的方法，基于策略的DRL算法可能存在不易收敛的问题，该问题的解决方法还有待进一步的探索。

图4 DDPG深度强化学习系统结构图Fig.4 DDPG deep reinforcement learning system

除了上述基于强化学习和深度强化学习的方法外，还有一些其他的机器学习方法被应用于无人机或其他运动体的路径规划中，例如，Zhang B 等［72］提出一种合作和几何学习算法用于多无人机协同避障；Rodríguez-Fdez I 等［73］提出一种迭代量化模糊规则学习方法用于机器人执行沿墙跟随任务的路径规划中。

尽管还处于探索和发展阶段，但基于机器学习的方法已经展现出了广阔的应用前景。相较于其他传统方法，其优点和缺点目前都比较明显。优点是规划的实时性较好、不易陷入局部极小且不依赖于环境先验信息；缺点是当状态空间和动作空间均为连续时，模型的训练不易收敛，导致其离线学习时间较长，甚至可能导致训练失败。

3 未来可能的发展方向

目前有关无人机避障航路规划理论与方法的研究成果不断涌现，其未来的发展趋势也受到学术界和工业界的广泛关注。根据对相关文献的调研情况并结合作者自身在研究过程中发现的问题，下面简要介绍其未来可能的发展方向：

（1）对于复杂环境下的三维航路规划方法的研究仍有进一步提升的空间，特别是对于复杂凹型障碍环境（例如U 形障碍、洞穴等）和密集动态障碍环境（常见于集群系统中）的探索仍相对较少。

（2）在未来应考虑将传统规划方法（例如基于数学规划的方法、基于势场的方法）与以DRL 为代表的新一代人工智能技术相结合，优势互补，从而进一步解决传统规划方法中依然存在的问题，例如局部极小问题等；同时也应积极攻克现有人工智能方法在航路规划应用中存在的一些问题，例如收敛速度较低等。

（3）在未来的航路规划方法研究中应充分考虑机载传感器的实际性能和工作特性。目前有相当比例的研究在设计航路规划方法时仅将无人机的机载传感器归结为一个统一而理想化的模型，障碍物信息（速度、尺寸、位置等）可以通过这个理想化模型被直接获取进行障碍预建模，进而应用于规划当中。而在实际中，不同机载传感器（毫米波雷达、激光雷达、摄像头等）的工作原理和所获取的障碍信息形式差别较大，而且还存在时间延迟、测量误差等问题。因此在未来应进一步对机载传感器的建模进行细化处理，针对不同特性的传感器设计相应的障碍信息处理策略及其对应的航路规划方法，从而实现无人机感知环节到决策规划环节的无缝衔接。

（4）规划航路的可跟踪性问题亟待解决。目前的航路规划方法大多仅考虑了无人机的运动学特性（例如最大转弯角速率、最大爬升角、最大可用过载等），对于所规划的航路是否切实能被无人机所精确跟踪，尚无过多考虑。因此，有必要进一步将无人机控制器（轨迹、姿态、动力、执行机构）的特性考虑到规划算法中，从而实现规划-控制一体化。

4 结束语

本文阐述了无人机避障航路规划方法的研究现状，并对未来可能的研究方向进行了分析。目前航路规划理论已日趋成熟，但相应的工程化研究却相对滞后，因此在未来应着力推动这方面的工作，使规划方法由理论向实践迈进。

上一篇：俄罗斯《2030年前国家人工智能发展战略》浅析
下一篇：面向目标对峙跟踪的四旋翼协同编队控制方法

免责声明

我们致力于保护作者版权，注重分享，被刊用文章因无法核实真实出处，未能及时与作者取得联系，或有版权异议的，请联系管理员，我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!

无人机避障航路规划方法研究综述

1 引言