复杂地形上的四足机器人实时最优路径规划

未命名 07-20 阅读：129 评论：0

复杂地形上的四足机器人实时最优路径规划

背景技术：

1.在复杂地形上导航的主要挑战是有效地处理高维感知输入并理解复杂的拓扑。许多方法侧重于通过模仿或强化学习来直接训练导航策略。然而，模仿的方法需要大量的手动演示，或依赖其他现有的规划器；由于在复杂地形上导航时观察维度相当大，因此强化学习过程的效率低下。此外，模仿和强化学习通常无法保证在训练环境之外的良好性能。
2.另一个研究方向侧重于从环境信息中预测运动特性。基于学习的方法有助于预测在新环境中更好地泛化。然而，使用深度神经网络连续预测大量采样运动以获得平滑可行的路径需要较长的规划时间，本发明提供的复杂地形上的四足机器人实时最优路径规划旨在克服上述问题和其它问题。

技术实现要素：

3.一方面，本发明提供一种机器人路径规划方法，包括：
4.对机器人周围的高度图进行预处理，并采用具有自学习注意机制的基于学习的方法来估计机器人的运动性能和通行成功率；
5.基于估计的运动性能和通行成功率，执行并行路线图构建，并使用图搜索算法确定初始路径。
6.在本发明的实施例中，所述方法还包括：基于迭代梯度下降方法，改进所述初始路径，以得到平滑且成本最优的路径。
7.在本发明的实施例中，采用具有自学习注意机制的基于学习的方法来估计机器人的运动性能和通行成功率包括：
8.预测所述机器人完成预定的局部运动的运动性能和通性成功率，所述运动性能包括：完成该局部运动的能量消耗和持续时间。
9.在本发明的实施例中，所述局部运动由状态变换向量描述，所述状态变换向量包括世界坐标系下所述机器人期望的平移量、旋转量和初始方向。
10.在本发明的实施例中，采用具有自学习注意机制的基于监督学习的方法来估计机器人的运动性能和通行成功率。
11.在本发明的实施例中，对机器人周围的高度图进行预处理，并采用具有自学习注意机制的基于学习的方法来估计机器人的运动性能和通行成功率包括：
12.利用全卷积的特征提取器从所述高度图中提取地形特征；
13.将状态变换向量连接到地形特征，并对连接的特征应用1
×
1卷积来计算注意力分数；
14.基于注意力得分计算特征的加权和；
15.利用全连接价值网络基于所述加权和返回运动性能和通行成功率。
16.在本发明的实施例中，基于估计的运动性能和通行成功率，执行并行路线图构建，并使用图搜索算法确定初始路径包括：
17.在初始化阶段，从覆盖整个规划空间、并保证相邻状态之间预定距离的网格图中，
采样一组均匀分布的网格图状态，来离散化规划空间；
18.基于估计的运动性能和通行成功率，使用图搜索算法，在离散化的规划空间中找到一条最优路径作为所述初始路径。
19.在本发明的实施例中，通过去除小于预测分辨率的微小运动，并在局部运动距离大于最大预测距离时引入额外的惩罚的方式来优化路径。
20.另一方面，本发明还提供一种机器人路径规划系统，包括：
21.预测模块，所述预测模块被配置为：对机器人周围的高度图进行预处理，并采用具有自学习注意机制的基于学习的方法来估计机器人的运动性能和通行成功率；
22.路径规划模块，所述路径规划模块被配置为：基于估计的运动性能和通行成功率，执行并行路线图构建，并使用图搜索算法确定初始路径。
23.在本发明的实施例中，所述系统还包括：
24.路径优化模块，所述路径优化模块被配置为：基于迭代梯度下降方法，改进所述初始路径，以反馈平滑且成本最优的路径。
25.在本发明的实施例中，所述预测模块被配置为预测所述机器人完成预定的局部运动的运动性能和通行成功率，所述运动性能包括：完成该局部运动的能量消耗和持续时间。
26.在本发明的实施例中，所述局部运动由状态变换向量描述，所述状态变换向量包括世界坐标系下所述机器人期望的平移量、旋转量和初始方向。
27.在本发明的实施例中，所述预测模块包括特征提取器、注意力机制和价值网络，
28.所述特征提取器被配置为从所述高度图中提取地形特征；
29.所述注意力机制被配置为将状态变换向量连接到地形特征，并对连接的特征应用卷积来计算注意力分数；
30.所述价值网络基于所述注意力得分返回运动性能和通行成功率。
31.在本发明的实施例中，所述路径规划模块被配置为：
32.在初始化阶段，从覆盖整个规划空间、并保证相邻状态之间预定距离的网格图中，采样一组均匀分布的网格图状态，来离散化规划空间；
33.基于估计的运动性能和通行成功率，使用图搜索算法，在离散化的规划空间中找到一条最优路径作为所述初始路径。
34.在本发明的实施例中，所述路径优化模块被配置为通过去除小于预测分辨率的微小运动，并在局部运动距离大于最大预测距离时引入额外的惩罚的方式来优化路径。
35.另一方面，本发明还提供一种计算机可读介质，其上存储有计算机程序，其中，所述程序被处理器执行时实现根据本发明的机器人路径规划方法中的步骤。
36.本领域普通技术人员将在阅读和理解以下具体实施方式后进一步理解本发明的其它进步之处。
附图说明
37.附图用来提供对本发明技术方案的理解，并且构成说明书的一部分，与本发明的实施例一起用于解释本发明的技术方案，并不构成对本公开技术方案的限制。
38.图1示出了根据本发明的机器人路径规划框架的结构图；
39.图2示出了根据本发明的机器人路径规划框架的预测网络的结构图；
40.图3示出了根据本发明的机器人路径规划框架的预测模块得到的预测结果与实际情况的对比图；
41.图4示出了利用根据本发明的路径规划方法在各种复杂地形上的规划结果。
具体实施方式
42.为使本领域技术人员更好地理解本公开的技术方案，下面结合附图和具体实施方式对本公开作进一步详细描述。
43.在下文中将参考附图更充分地描述示例实施例，但是所述示例实施例可以以不同形式来体现且不应当被解释为限于本文阐述的实施例。反之，提供这些实施例的目的在于使本公开透彻和完整，并将使本领域技术人员充分理解本公开的范围。
44.除非另外定义，本公开使用的技术术语或者科学术语应当为本公开所属领域内具有一般技能的人士所理解的通常意义。还将理解，诸如那些在常用字典中限定的那些术语应当被解释为具有与其在相关技术以及本公开的背景下的含义一致的含义，且将不解释为具有理想化或过度形式上的含义，除非本文明确如此限定。本公开中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性，而只是用来区分不同的组成部分。同样，“一个”、“一”或者“该”等类似词语也不表示数量限制，而是表示存在至少一个。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同，而不排除其他元件或者物件。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接，而是可以包括电性的连接，不管是直接的还是间接的。
45.为了至少解决现有技术问题之一，本发明提供了四足机器人在复杂地形上的实时路径规划和优化的集成框架，包括相应的方法、系统、介质，下面将结合附图及具体实施方式，对本发明提供的四足机器人在复杂地形上的实时路径规划和优化的方法、系统、介质进行进一步的详细描述。
46.一方面，本发明提供了一种机器人路径规划方法，包括：
47.对机器人周围的高度图进行预处理，并采用具有自学习注意机制的基于学习的方法来估计机器人的运动性能和通行成功率；以及
48.基于估计的运动性能和通行成功率，执行并行路线图构建，并使用图搜索算法确定初始路径。
49.在一些实施例中，该路径规划方法还包括：基于迭代梯度下降方法，改进所述初始路径，以反馈平滑且成本最优的路径。
50.根据本发明实施例的路径规划框架主要包括三个部分：预测模块、路径规划模块和路径优化模块。参见图1，预测模块对机器人周围的高度图进行预处理，并采用具有自学习注意力机制的基于学习的方法，估计有腿机器人在高度图的局部区块上的运动性能和通行成功率。接着，路径规划模块进行并行道路图构建，并通过图搜索找到初始路径。最后，路径优化模块基于梯度改进初始路径以返回平滑且成本最优的路径。
51.预测模块
52.预测模块将以机器人的身体坐标系为中心的高度图作为局部区块，局部区块的大小与机器人的碰撞体相当，并且扫描方向可以与世界坐标系对齐。机器人的状态变换向量包括世界坐标系体平移量δx和δy、旋转量δψ和初始方向ψ。
53.预测模块将预测任务建模为多输出回归问题。对于给定的局部区块和所需的状态变换向量，预测模块预测机器人完成由状态变换向量描述的局部运动的运动成本。前述运动成本可以包括一般能量消耗ce、持续时间c
t
和失败概率(风险)cr。
54.然而，在实施时发现一些地形上的运动性能(包括完成局部运动的能量消耗和持续时间)会具有较大的方差，因而是高度不可预测的。针对该问题，预测模块包括的预测网络还额外地预测对数方差u作为回归的不确定性。可以使用在物理模拟中收集的局部区块和运动成本以监督学习的方式——具体来说是使用mse(mean-squared loss)损失法——来训练预测网络，而训练的结果是使得mse达到最小值的最优网络参数：
[0055][0056]
其中c＝[ce,c
t
,cr]
t
，θ*是期望获得的最优网络参数，c是作为训练基础事实的模拟中的平均性能，而c'是预测网络的预测输出。
[0057]
预测网络的结构参见图2。预测网络包括特征提取器、注意力机制、softmax和价值网络。
[0058]
特征提取器根据机器人周围的高度扫描生成地形特征。特征提取器包括多个卷积层和池化层，配置为从高度图中提取特征。该特征提取器是全卷积的，因此在部署过程中，它可以直接应用于全局高度图并生成全局特征图，可以有效地重复用于多个局部运动查询。
[0059]
在本发明中，自学习注意力机制取代了价值网络之前的压平层(flatten layer)。注意力机制使网络能够更好地关注重要的地形特征，并提供更准确的预测。作为附加通道，将状态变换向量连接到地形特征，并对连接的特征应用1
×
1卷积来计算注意力分数。
[0060]
接下来，对注意力分数应用softmax以计算特征的加权和，作为价值网络的输入。
[0061]
全连接价值网络最后返回运动指标估计(即，运动性能)和不确定性分数(即，通行成功率)，该运动指标估计可以进一步表述为路径规划模块中的规划成本。
[0062]
路径规划模块
[0063]
路径规划模块首先在初始化阶段从覆盖整个规划空间、并保证相邻状态之间适当距离的网格图(grid map)中，采样一组均匀分布的网格图状态，来离散化规划空间。在这种情况下，所有的变换向量都是预先定义好的以便于在网络上并行查询。在每次更新全局地图后，路径规划模块通过在gpu上运行预测模块来执行并行路线图构建，gpu中设置有一批预定义坐标来定位局部特征和相应的变换向量。在本发明的实施例中，并行路线图构建包括：收集所有预定义好的变换向量对应的局部区块，放到一个批次中，在gpu上以批处理的形式用神经网络处理所有局部区块及变换向量，得到所有变换向量对应的运动成本预测，以便路径规划算法使用。
[0064]
然后，预测模块返回沿预定义边缘集中的边缘的每个局部运动e的运动成本和不确定性分数ce(e)，c
t
(e)，cr(e)，u(e)。将r
max
和u
max
作为可遍历边缘的最大允许风险和不确定性，将we，w
t
，wr，wu作为不同元素的相关权重，可以得到路线图连通性l(e)和局部成本c(e)：
[0065]
l(e)＝true where cr(e)＜r
max and u(e)＜u
max
，
[0066]
c(e)＝w
ece
(e)+w
tct
(e)+w
rcr
(e)+wuu(e).
[0067]
然后，路径规划模块使用a*作为图搜索算法，根据l(e)和c(e)定义的路线图，在离散化空间中找到一条最优路径作为路径初始猜测。可接受的启发式成本与查询位置到目标的欧几里得距离成正比，其中单位局部成本等于在零风险和不确定性的平坦地面上行走的预测成本。
[0068]
路径优化模块
[0069]
路径优化模块通过迭代梯度下降来进一步优化路径初始猜测。在每次迭代之前，路径优化模块会调节路径p以去除小于预测分辨率的微小运动，并在局部运动d距离过长时引入额外的惩罚pd：如果d＞d
max
则pd＝w
p
d2，其中w
p
是惩罚因子，d
max
是最大预测距离。路径p的局部成本c(e和全局规划成本f(p)为：
[0070][0071][0072]
其中t是路径中局部运动的数量，而we，w
t
，wr，wu是不同运动指标的权重，路径优化模块将路径上所有运动中的最高风险值视为路径的整体风险，路径优化模块的目标是将所有中间状态作为参数并降低总体规划成本，这是通过基于迭代梯度的优化来执行的：
[0073][0074]
其中p*是使f(p)最小化时取到的最优路径。
[0075]
基于上述构思，本发明还提供一种机器人路径规划系统，包括：
[0076]
预测模块，所述预测模块被配置为：对机器人周围的高度图进行预处理，并采用具有自学习注意机制的基于学习的方法来估计机器人的运动性能和通行成功率；
[0077]
路径规划模块，所述路径规划模块被配置为：基于估计的运动性能和通行成功率，执行并行路线图构建，并使用图搜索算法确定初始路径。
[0078]
在一些实施例中，系统还包括：路径优化模块，所述路径优化模块被配置为：基于迭代梯度下降方法，改进所述初始路径，以反馈平滑且成本最优的路径。
[0079]
在一些实施例中，预测模块被配置为预测所述机器人完成预定的局部运动的运动性能和通行成功率，所述运动性能包括：完成该局部运动的能量消耗和持续时间。在实施例中，局部运动由状态变换向量描述，所述状态变换向量包括世界坐标系下所述机器人的平移、旋转和初始方向。
[0080]
在一些实施例中，预测模块包括特征提取器、注意力机制和价值网络。特征提取器被配置为从高度图中提取地形特征。注意力机制被配置为将状态变换向量连接到地形特征，并对连接的特征应用卷积来计算注意力分数。价值网络基于注意力得分返回运动性能和通行成功率。
[0081]
在一些实施例中，路径规划模块被配置为：在初始化阶段，从覆盖整个规划空间、并保证相邻状态之间预定距离的网格图中，采样一组均匀分布的网格图状态，来离散化规划空间；基于估计的运动性能和通行成功率，使用图搜索算法，在离散化的规划空间中找到一条最优路径作为所述初始路径。
[0082]
在一些实施例中，路径优化模块被配置为通过去除小于预测分辨率的微小运动，并在局部运动距离大于最大预测距离时引入额外的惩罚的方式来优化路径。
[0083]
又一方面，本发明提供一种非暂态机器可读介质，其上存储有计算机程序，其中，该程序被处理器执行时实现如上述实施例中的任一路径规划方法中的步骤。
[0084]
该路径规划系统可以为具有或连接到机器人的手机、平板电脑、电子手表、运动手环、笔记本电脑、车载电脑、导航仪、电子眼镜等使用路径规划方法或具有路径规划框架的电子设备；相应的非暂态机器可读介质可以是具有或连接到机器人的手机、平板电脑、电子手表、运动手环、笔记本电脑、车载电脑、导航仪、电子眼镜等电子设备中容纳的非暂态机器可读介质。该路径规划系统和非暂态机器可读介质的实现原理及其具有的技术效果可参考上述对路径规划方法的实现原理及技术效果的论述，在此不再赘述。
[0085]
与现有的机器人路径规划相比，本发明在多个复杂地形上提供了具有实时性能的最优导航路径；与现有的模仿学习或强化学习的规划相比，本发明在复杂的静态环境中提供了稳健且一致的性能；与现有的类似路径规划框架(估计运动成本然后使用传统基于模型的规划方法中的成本)相比，本发明使用注意机制来提高预测精度并考虑预测不确定性来提高规划的鲁棒性。此外，本发明采用并行路线图构建来加速实时性能的规划过程。为了验证以上优点，发明人在下述的两个实验场景证明根据本发明的规划框架的性能。
[0086]
第一个实验评估了所提出的预测方法的准确性。实验准备了一张崎岖地形的测试地图，让机器人在地图上沿着包含200个局部运动的生成路径移动。实验在raisim物理引擎中模拟了具有基于学习的运动控制器的四足机器人，机器人在具有完整运动的具有挑战性的地形上行驶。考虑机器人的碰撞空间，局部高度扫描为围绕机器人几何中心的2m
×
2m的区域，分辨率为4cm。每个局部运动具有在(0.0,0.5m内的随机平移距离，以及[-pi,pi]内的旋转δψ。实验记录了机器人沿路径移动20次重复的平均运动结果，并绘制了能量或时间消耗以及失败风险的曲线。实验使用本发明的预测模块来估计路径上所有局部运动的运动结果并绘制预测曲线。图3示出了完成对应的局部运动(左上)的能量消耗(左下)、持续时间(右下)和风险(右上)的曲线，两条曲线分别是模拟的真实情况和预测结果。从图3可以看出，预测模块返回的曲线与地面真实曲线具有类似的趋势，这说明预测结果可以成功识别危险运动。就平均而言，预测曲线与模拟曲线的相关系数为0.7，预测均方误差为0.06。
[0087]
第二个实验直观地评估了所提出的框架在各种地形上的规划结果。参见图4，提供的高度图为12m
×
12m，分辨率为4cm。经过卷积层之后，有效规划空间q为10m
×
10m。模拟智能体直接接收静态地图，没有来自传感器的感知噪声。本发明的框架在具有结构化拓扑和不规则拓扑的多种地形类型上规划了路径(路径在图4中以坐标的连续轨迹来表示)，成功地完成了诸如在狭窄的旋转楼梯上行走、或在崎岖地形上避开陡峭部分等规划任务，并为移动智能体提供了可行且平滑的路径。总体而言，该框架需要大约1.50秒返回最佳解决方案，1.50秒包括在nvidia jetson agx xavier上进行预测、路径规划和优化的时间。
[0088]
综上，本发明提出了一种新颖的集成导航框架，用于四足机器人在复杂地形上的路径规划与优化。本发明使用高度图来理解地形，并依据机器人的通行能力提供快速且最优的路径规划方案。本发明采用基于深度学习的方法，结合自学习的注意力机制来预测四足机器人在不同复杂地形上的运动表现。为实现更加安全的导航行为，本发明额外将预测的不确定性结合到路径规划算法中。本发明使用gpu并行预测并构建路连接图来获取初始
路径，并使用基于梯度的迭代算法进一步优化路径，以提供实时的最优导航方案。
[0089]
本发明的导航框架将为四足机器人在多种类型的复杂地形上移动时提供实时和最佳的导航解决方案，可以部署在结构化的城市地形或复杂的不规则拓扑中，并有利于机器人应用，包括野外勘探、搜索和救援、交付和工业检查。
[0090]
本领域普通技术人员可以理解，上文中所公开方法中的全部或某些步骤、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施方式中，在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分；例如，一个物理组件可以具有多个功能，或者一个功能或步骤可以由若干物理组件合作执行。某些物理组件或所有物理组件可以被实施为由处理器，如中央处理器、数字信号处理器或微处理器执行的软件，或者被实施为硬件，或者被实施为集成电路，如专用集成电路。这样的软件可以分布在计算机可读介质上，计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的，术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于ram、rom、eeprom、闪存或其他存储器技术、cd-rom、数字多功能盘(dvd)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外，本领域普通技术人员公知的是，通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据，并且可包括任何信息递送介质。
[0091]
本文已经公开了示例实施例，并且虽然采用了具体术语，但它们仅用于并仅应当被解释为一般说明性含义，并且不用于限制的目的。在一些实例中，对本领域技术人员显而易见的是，除非另外明确指出，否则可单独使用与特定实施例相结合描述的特征、特性和/或元素，或可与其他实施例相结合描述的特征、特性和/或元件组合使用。因此，本领域技术人员将理解，在不脱离由所附的权利要求阐明的本公开的范围的情况下，可进行各种形式和细节上的改变。

技术特征：
1.一种机器人路径规划方法，包括：对机器人周围的高度图进行预处理，并采用具有自学习注意机制的基于学习的方法来估计机器人的运动性能和通行成功率；基于估计的运动性能和通行成功率，执行并行路线图构建，并使用图搜索算法确定初始路径。2.根据权利要求1所述的方法，还包括：基于迭代梯度下降方法，改进所述初始路径，以得到平滑且成本最优的路径。3.根据权利要求2所述的方法，其中，采用具有自学习注意机制的基于学习的方法来估计机器人的运动性能和通行成功率包括：预测所述机器人完成预定的局部运动的运动性能和通行成功率，所述运动性能包括：完成该局部运动的能量消耗和持续时间。4.根据权利要求3所述的方法，其中，所述局部运动由状态变换向量描述，所述状态变换向量包括世界坐标系下所述机器人期望的平移量、旋转量和初始方向。5.根据权利要求1所述的方法，其中，采用具有自学习注意机制的基于监督学习的方法来估计机器人的运动性能和通行成功率。6.根据权利要求4所述的方法，其中，对机器人周围的高度图进行预处理，并采用具有自学习注意机制的基于学习的方法来估计机器人的运动性能和通行成功率包括：利用全卷积的特征提取器从所述高度图中提取地形特征；将状态变换向量连接到地形特征，并对连接的特征应用1
×
1卷积来计算注意力分数；基于注意力得分计算特征的加权和；利用全连接价值网络基于所述加权和返回运动性能和通行成功率。7.根据权利要求1至6中任一项所述的方法，其中，基于估计的运动性能和通行成功率，执行并行路线图构建，并使用图搜索算法确定初始路径包括：在初始化阶段，从覆盖整个规划空间、并保证相邻状态之间预定距离的网格图中，采样一组均匀分布的网格图状态，来离散化规划空间；基于估计的运动性能和通行成功率，使用图搜索算法，在离散化的规划空间中找到一条最优路径作为所述初始路径。8.根据权利要求1至6中任一项所述的方法，其中，通过去除小于预测分辨率的微小运动，并在局部运动距离大于最大预测距离时引入额外的惩罚的方式来优化路径。9.一种机器人路径规划系统，包括：预测模块，所述预测模块被配置为：对机器人周围的高度图进行预处理，并采用具有自学习注意机制的基于学习的方法来估计机器人的运动性能和通行成功率；路径规划模块，所述路径规划模块被配置为：基于估计的运动性能和通行成功率，执行并行路线图构建，并使用图搜索算法确定初始路径。10.根据权利要求9所述的系统，还包括：路径优化模块，所述路径优化模块被配置为：基于迭代梯度下降方法，改进所述初始路径，以反馈平滑且成本最优的路径。11.根据权利要求10所述的系统，其中，所述预测模块被配置为预测所述机器人完成预定的局部运动的运动性能和通行成功率，所述运动性能包括：完成该局部运动的能量消耗
和持续时间。12.根据权利要求11所述的系统，其中，所述局部运动由状态变换向量描述，所述状态变换向量包括世界坐标系下所述机器人期望的平移量、旋转量和初始方向。13.根据权利要求12所述的系统，其中，所述预测模块包括特征提取器、注意力机制和价值网络，所述特征提取器被配置为从所述高度图中提取地形特征；所述注意力机制被配置为将状态变换向量连接到地形特征，并对连接的特征应用卷积来计算注意力分数；所述价值网络基于所述注意力得分返回运动性能和通行成功率。14.根据权利要求13所述的系统，其中，所述路径规划模块被配置为：在初始化阶段，从覆盖整个规划空间、并保证相邻状态之间预定距离的网格图中，采样一组均匀分布的网格图状态，来离散化规划空间；基于估计的运动性能和通行成功率，使用图搜索算法，在离散化的规划空间中找到一条最优路径作为所述初始路径。15.根据权利要求14所述的系统，其中，所述路径优化模块被配置为通过去除小于预测分辨率的微小运动，并在局部运动距离大于最大预测距离时引入额外的惩罚的方式来优化路径。16.一种计算机可读介质，其上存储有计算机程序，其中，所述程序被处理器执行时实现如权利要求1至8中任一项所述的机器人路径规划方法中的步骤。

技术总结
本发明为四足机器人在复杂地形上的实时路径规划和优化提出了集成性的解决方案。本发明将各种拓扑理解为高度图，并执行基于机器人运动能力的快速路径规划和优化。本发明的基于深度学习的方法采用自学习注意力机制来估计四足机器人在各种复杂地形上的局部运动结果。本发明在路径规划过程中还额外预测和考虑预测不确定性以实现更安全的行为。本发明采用GPU加速的路线图构建和基于梯度的路径优化以在移动计算硬件上提供具有实时性能的最优路径。径。径。

技术研发人员：杨博文刘明
受保护的技术使用者：香港科技大学
技术研发日：2022.11.09
技术公布日：2023/7/18

版权声明

本文仅代表作者观点，不代表航空之家立场。
本文系作者授权航家号发表，未经原创作者书面授权，任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时，须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的，航空之家将依法追究其法律责任。（航空之家官方QQ：2926969996）

飞行汽车 https://www.autovtol.com/

上一篇：一种吸尘嘴及其吸尘风机的制作方法 下一篇：一种长期运行复合绝缘子性能评估方法与流程

复杂地形上的四足机器人实时最优路径规划

版权声明

航空之家

相关推荐

文章排行

最近发表

标签列表

复杂地形上的四足机器人实时最优路径规划

版权声明

相关文章

航空之家

相关推荐

文章排行

最近发表

标签列表