基于关节树和图神经网络的机器人形态生成和搜索方法

未命名 10-09 阅读:85 评论:0


1.本发明属于机器人形态设计领域,涉及一种基于关节树和图神经网络的机器人形态生成和搜索方法。


背景技术:

2.在机器人形态设计中,高效地对机器人形态进行搜索和评价是一个技术难点,自动搜索机器人形态可以帮助设计人员更快地对机器人产品进行迭代和升级。其中主要包括形态生成方法和形态搜索优化方法两个技术难点。
3.形态生成方法主要指如何描述和生成一个机器人的外形。传统的图形生成研究主要针对平面单元或者空间单元的静态布局,对于机器人这种具有运动属性的对象则研究较少。多数易于进行形态变换的自重构模块化机器人的缺点在于整个机器人由相同模块构成,并且模块大小、形状等无法再次改变。
4.形态搜索和优化方法则是要对机器人这种复杂对象进行高效地搜索。机器人整体结构指的是每个关节的类型,以及关节和连杆之间的连接方式。结构的微小差异可能会导致相似形态机器人之间的性能差异巨大,由此导致其搜索空间极度不平稳。


技术实现要素:

5.为了解决现有技术中存在的上述技术问题,本发明提出了一种基于关节树和图神经网络的机器人形成生成和搜索方法,采用关节树来描述机器人的形态,然后使用图神经网络来对形态进行搜索和优化,其具体技术方案如下:
6.一种基于关节树和图神经网络的机器人形态生成和搜索方法,首先基于关节树来描述和生成机器人的形态,然后基于图神经网络进行机器人形态搜索,所述基于图神经网络进行机器人形态搜索,具体包括如下步骤:
7.步骤1,采用图神经网络和两阶段贪心筛选机制生成机器人,并对机器人的步态生成器进行优化处理;
8.步骤2,基于机器人形态距离指标和地形穿越能力指标得到机器人的综合评价指标;
9.步骤3,循环上述步骤直至达到指定的次数。
10.进一步的,所述基于关节树来描述和生成机器人的形态结构,具体为:使用起始节点nsn、躯干节点nbn、腿部节点nln、旋转节点nre、回转节点nro、躯干连杆节点lib、腿部连杆节点lil、固定关节节点fij、水平旋转关节节点rhj、垂直旋转关节节点rvj、前向回转关节节点rfj、后向回转关节节点rbj、连接件节点con来描述构成的机器人,机器人的关节树节点生成和替换的规则产生式包括:
11.1)规则r1:nsn

[nbn]fij[nbn];
[0012]
2)规则r2:nsn

[nbn]nre[nbn];
[0013]
3)规则r3:nbn

[nbn]fij[nbn];
[0014]
4)规则r4:nbn

[nbn]nre[nbn];
[0015]
5)规则r5:nbn

[lib]con[nln];
[0016]
6)规则r6:nbn

lib;
[0017]
7)规则r7:nln

[nln]fij[nln];
[0018]
8)规则r8:nln

[nln]nre[nln];
[0019]
9)规则r9:nln

[nln]nro[nln];
[0020]
10)规则r10:nln

lil;
[0021]
11)规则r11:nre

rhj;
[0022]
12)规则r12:nre

rvj;
[0023]
13)规则r13:nro

rfj;
[0024]
14)规则r14:nro

rbj;
[0025]
其中,包含3个节点的产生式为原节点的生成规则,中间节点替换原节点,左边节点为替换后节点的左节点,右边节点为替换后节点的右节点;包含1个节点的产生式为原节点的替换规则,新节点直接替换原节点;所有节点均包含相关的节点属性,包括长度l,半径r,连接位置p,边长a,初始转角θ,缩小比例ξ;通过遍历关节树,结合节点类型和节点属性确定机器人的形态结构。
[0026]
进一步的,所述两阶段贪心筛选机制是引入贪心思想的两阶段筛选机制,具体为:首先使用规则产生式r1、r2、r3、r4、r11、r12生成k1个仅有nbn,nre,fij三类节点的躯干,并且所有躯干节点nbn数目相同,记作q,从其中随机挑选出b个,后将剩下的q-b个直接应用规则r6;
[0027]
在第一阶段逐步完善每个机器人躯干,得到完整的机器人,具体为:选择每个机器人躯干上的b个躯干节点nbn后依次生成腿,每次都随机生成k2条不同的腿,将k2条不同的腿与躯干组合后生成不同的k2个临时机器人输入筛选机制得到s2个备选最优机器人此时以概率ε从中随机选择,概率1-ε从中选最优的;按照生成顺序重复上述过程,直至重复b次生成一个完整的机器人;
[0028]
在第二阶段综合比较每个完整的机器人,利用图神经网络预测每个完整机器人的性能,得到最终选择的机器人,具体为:在重复k1次第一阶段得到k1个完整的机器人后,将k1个完整机器人组成一批,输入筛选机制得到s2个最优的,各分配概率ε和1-ε进行随机选择并输出最终选择的机器人。
[0029]
进一步的,所述的筛选机制具体为:在筛选时,将机器人转换成无向关节树图和无向直接映射图两种数据结构,分别输入到两个结构相同的图神经网络中对机器人性能进行预测;设一批输入的机器人数量为b,经过预测后得到b个无向关节树图的预测结果和b个无向直接映射图的结果;从两批结果中各挑选出最优的前s1个结果,s1<b,再将这两批s1个结果对应的机器人序号做并集,再从并集中挑选最优的前s2个结果,s1≤s2≤2s1,这s2个结果就是经过筛选后所得的可信度高的优秀机器人,该过程可用下式表示:
[0030][0031]
其中,符号{r}s表示有s个机器人的集合;tree和direct分别表示将输入的集合中的机器人转换成一批无向关节树图和无向直接映射图;tops表示取结果中最优的s个机器人;tdg({r}b,s1,s2)表示筛选机制。
[0032]
进一步的,所述图神经网络具体是由3层gnn模块+diffpool图池化模块构成,每个gnn模块中包含3个sageconv图卷积模块;其中sageconv图卷积模块的表达式为:
[0033][0034][0035][0036]
其中表示第l层输入图的第i个节点的特征向量;aggregate表示聚集算子,采用均值聚集算子,并将聚集结果保存在sageconv图卷积模块的输出结果中,表示图的第i个节点的相邻节点集合;w是待学习的权重矩阵,σ表示激活函数,采用relu;norm表示归一化操作;
[0037]
所述diffpool图池化模块的表达式为:
[0038]z(l)
=gnn
l,embed
(a
(l)
,x
(l)
)
[0039]s(l)
=softmax(gnn
l,pool
(a
(l)
,x
(l)
))
[0040]
x
(l+1)
=(s
(l)
)
tz(l)
[0041]a(l+1)
=(s
(l)
)
ta(l)s(l)
[0042]
式中gnn
l,embed
和gnn
l,pool
分别表示用于节点嵌入和图池化的gnn模块;表示节点嵌入矩阵;表示分配矩阵,通过softmax函数来聚合不同节点的信息从减少节点数,n
l
是超参数。
[0043]
进一步的,所述对机器人的步态生成器进行优化处理,具体为:使用正弦发生器和径向基函数网络构成机器人步态生成器,并基于协方差矩阵自适应进化策略对该步态生成器进行优化;
[0044]
其中,所述的正弦发生器如下式:
[0045][0046]
其中a表示幅度,ω表示频率,该部分作为径向基函数网络的输入;径向基函数如下式:
[0047]
[0048][0049][0050]
其中σi是高斯函数的方差;h是高斯核基函数所在的隐藏层神经元数目,
[0051]
μ
i,1
和μ
i,2
是对应第一层两个正弦发生器输入的rbf核函数中心;t
sg
是正弦发生器的周期;表示机器人躯干运动关节数加上一半的腿部运动关节数;θi(t)则是每个运动关节的在时间t下的角度值。
[0052]
进一步的,所述步骤2中的基于机器人形态距离指标,具体包含外形距离和编码距离;其中外形距离基于机器人直观的外形来度量两个机器人之间的距离远近;编码距离是将机器人编码成字符串,然后通过字符串核函数计算的字符串相似度作为机器人之间的距离度量。
[0053]
进一步的,所述步骤2中的地形穿越能力指标,具体包含机器人运动指标和能耗指标;其中运动指标用于评价机器人在不同地形下运动时的速度,能耗指标采用机器人的移动能耗率。
[0054]
本发明的有益效果为:
[0055]
本发明采用关节树来描述和生成机器人,并且使用图神经网络来实现机器人形态的高效搜索和优化。
附图说明
[0056]
图1是本发明的根据关节树来拓展生成机器人的示意图;
[0057]
图2是本发明使用的图神经网络架构示意图;
[0058]
图3是本发明使用的两阶段贪心筛选机制的模拟过程示意图;
[0059]
图4是本发明使用的两阶段贪心筛选机制的流程图;
[0060]
图5是本发明的对步态生成器进行优化的架构图;
[0061]
图6是基于综合指标最大值的搜索曲线图和部分搜索到的优秀机器人的示意图;
[0062]
图7是基于地形穿越能力指标最大值的搜索曲线图和部分搜索到的优秀机器人的示意图;
[0063]
图8是基于形态距离指标最大值的搜索曲线图和部分搜索到的优秀机器人的示意图。
具体实施方式
[0064]
为了使本发明的目的、技术方案和技术效果更加清楚明白,以下结合说明书附图和实施例,对本发明作进一步详细说明。
[0065]
本发明公开了一种基于关节树和图神经网络的机器人形成生成和搜索方法:首先基于关节树来描述和生成机器人的形态,然后基于图神经网络进行机器人形态搜索。
[0066]
如图1所示,所述基于关节树来描述和生成机器人形态,具体是使用起始节点nsn、
躯干节点nbn、腿部节点nln、旋转节点nre、回转节点nro、躯干连杆节点lib、腿部连杆节点lil、固定关节节点fij、水平旋转关节节点rhj、垂直旋转关节节点rvj、前向回转关节节点rfj、后向回转关节节点rbj、连接件节点con构成一套机器人形态生成方法,包括如下关节树节点生成和替换规则产生式:
[0067]
1)规则r1:nsn

[nbn]fij[nbn];
[0068]
2)规则r2:nsn

[nbn]nre[nbn];
[0069]
3)规则r3:nbn

[nbn]fij[nbn];
[0070]
4)规则r4:nbn

[nbn]nre[nbn];
[0071]
5)规则r5:nbn

[lib]con[nln];
[0072]
6)规则r6:nbn

lib;
[0073]
7)规则r7:nln

[nln]fij[nln];
[0074]
8)规则r8:nln

[nln]nre[nln];
[0075]
9)规则r9:nln

[nln]nro[nln];
[0076]
10)规则r10:nln

lil;
[0077]
11)规则r11:nre

rhj;
[0078]
12)规则r12:nre

rvj;
[0079]
13)规则r13:nro

rfj;
[0080]
14)规则r14:nro

rbj;
[0081]
其中,包含3个节点的产生式为原节点的生成规则,中间节点替换原节点,左边节点为替换后节点的左节点,右边节点为替换后节点的右节点;包含1个节点的产生式为原节点的替换规则,新节点直接替换原节点;所有节点均包含相关的节点属性,包括长度l,半径r,连接位置p,边长a,初始转角θ,缩小比例ξ;通过遍历关节树,结合节点类型和节点属性确定机器人的形态。
[0082]
所述基于图神经网络进行机器人形态搜索,具体包括如下步骤:
[0083]
步骤1,采用图神经网络和两阶段贪心筛选机制生成机器人,并对机器人的步态生成器进行优化处理。
[0084]
如图2所示,其中图神经网络具体是由3层gnn模块+diffpool图池化模块构成,每个gnn模块中包含3个sageconv图卷积模块;其中sageconv图卷积模块如下式所示:
[0085][0086][0087][0088]
其中表示第l层输入图的第i个节点的特征向量;aggregate表示聚集算子,这里采用均值(mean)聚集算子,并将聚集结果保存在sageconv图卷积模块的输出结果中,表示图的第i个节点的相邻节点集合;w是待学习的权重矩阵,σ表示激活函数,这里采用relu;norm表示归一化操作;
[0089]
所述diffpool图池化模块如下式所示:
[0090]z(l)
=gnn
l,embed
(a
(l)
,x
(l)
)
[0091]s(l)
=softmax(gnn
l,p
oo
l
(a
(l)
,x
(l)
))
[0092]
x
(l+1)
=(s
(l)
)
tz(l)
[0093]a(l+1)
=(s
(l)
)
ta(l)s(l)
[0094]
其中gnn表示堆叠若干层模块的图算子,这里采用堆叠3层sageconv来构成;式中gnn
l,embed
和gnn
l,pool
分别表示用于节点嵌入和图池化的gnn模块;表示节点嵌入矩阵;表示分配矩阵,通过softmax函数来聚合不同节点的信息从而实现节点数的减少,n
l
是超参数,其中和分别表示图池化前后的邻接矩阵和和节点特征矩阵;
[0095]
如图3和图4所示,其中两阶段贪心筛选机制具体为:在第一阶段逐步完善每个机器人躯干,得到完整的机器人;在第二阶段则综合比较每个完整的机器人,利用图神经网络预测每个完整机器人的性能,得到最终选择的机器人。
[0096]
利用筛选机制筛选时会将机器人转换成无向关节树图和无向直接映射图两种数据结构,分别输入到两个结构相同的图神经网络中对机器人性能进行预测;设一批输入的机器人数量为b,经过图神经网络预测后得到b个无向关节树图的预测结果和b个无向直接映射图的结果;从两批结果中各挑选出最优的前s1个结果,s1<b。为了防止重复将这两批s1个结果对应的机器人序号做并集,再从并集中挑选最优的前s2个结果,s1≤s2≤2s1,这s2个结果就是经过筛选后所得的可信度较高的优秀机器人,该过程可用下式表示:
[0097][0098]
其中,符号{r}s表示有s个机器人的集合;tree和direct分别表示将输入的集合中的机器人转换成一批无向关节树图和无向直接映射图;tops表示取结果中最优的s个机器人;为方便表示,使用tdg({r}b,s1,s2)来表示筛选机制。
[0099]
引入贪心思想的两阶段筛选具体为:首先使用规则产生式r1、r2、r3、r4、r11、r12生成k1个仅有nbn,nre,fij三类节点的躯干,并且保证所有躯干节点nbn数目相同,记作q,从其中随机挑选出个用于后续阶段,剩下的q-b个直接应用规则r6;
[0100]
所述的在第一阶段逐步完善每个机器人躯干:在每个机器人躯干上剩下的b个nbn节点后依次生成腿;每次都随机生成k2条不同的腿,将这k2条不同的腿与躯干组合后生成不同的k2个临时机器人输入筛选机制得到s2个备选最优机器人;此时以概率ε从中随机选择,概率1-ε从最优的;按照生成顺序重复上述过程,直至生成b条腿后生成一个完整的机器人。
[0101]
所述的在第二阶段综合比较每个完整的机器人:在重复k1次第一阶段得到k1个完
整的机器人后,将这k1个完整机器人组成一批,输入筛选机制得到s2个最优的,各分配概率ε和1-ε进行随机选择并输出最终选择的机器人;设置ε初始值为1,随搜索轮数增加线性减少,并在达到最大搜索轮数一半的时候减少到0.05,此后保持不变。
[0102]
同时使用正弦发生器和径向基函数网络构成机器人步态生成器,并基于协方差矩阵自适应进化策略(cmaes)对该步态生成器进行优化,如图5所示;
[0103]
所述的正弦发生器如下式:
[0104][0105]
其中a表示幅度,ω表示频率,该部分作为径向基函数网络的输入;径向基函数如下式:
[0106][0107][0108][0109]
其中σi是高斯函数的方差;h是高斯核基函数所在的隐藏层神经元数目,默认情况下,μ
i,1
和μ
i,2
是对应第一层两个正弦发生器输入的rbf核函数中心(均值);t
sg
是正弦发生器的周期;表示机器人躯干运动关节数加上一半的腿部运动关节数;θi(t)则是每个运动关节的在时间t下的角度值,包含躯干的θ
body
(t)和腿部的θ
leg
(t)。
[0110]
步骤2,基于机器人形态距离指标和地形穿越能力指标得到生成的机器人的综合评价指标;
[0111]
所述步骤2中的基于机器人形态距离指标,具体包含外形距离和编码距离;其中外形距离基于机器人直观的外形来度量两个机器人之间的距离远近;编码距离是将机器人编码成字符串,然后通过字符串核函数计算的字符串相似度作为机器人之间的距离度量。
[0112]
外形距离可用下式表示:
[0113][0114]
其中下标a表示外形(appearance);外形距离包括14个元素,分别是机器人初始状态下的长度、宽度、高度(单位为毫米),躯干上腿的对数(也等于连接件节点数),连杆数最少的腿的连杆数,连杆数最多的腿的连杆数,躯干上固定、水平旋转、垂直旋转关节节点数,所有腿上固定、水平旋转、垂直旋转、前向回转、后向回转关节节点总数,a(r)i表示从机器人关节树r中提取得到的上述14个信息中的第i个,并转化为外形笛卡尔空间中的向量;wi是每一维度的权重;
[0115]
编码距离的字符串核函数可用下式表示:
[0116][0117]
其中,||s||是字符串s的长度,n
ψ
(si)(i=1,2)是子字符串ψ出现于si的次数,w
ψ
是对应的权重系数,定义为
[0118][0119]
其表示子字符串ψ的长度和所有公共子字符串c中最长字符串长度的比值;
[0120]
综上,结合外形距离与编码距离,将综合距离指标定义为q3:
[0121][0122]
其中b表示机器人关节树的集合;k表示核函数,用于计算两个机器人对应字符串的编码距离;
[0123]
所述步骤2中的地形穿越能力指标,具体包含机器人运动指标和能耗指标;其中运动指标用于评价机器人在不同地形下运动时的速度;能耗指标采用机器人的移动能耗率。
[0124]
运动指标可用下式表示:
[0125]rmotion
(t)=[0 w
y wz][x
t-x
t-1 y
t-y
t-1 z
t-z
t-1
]
t
[0126]
其中r表示奖励(reward),这里表示在t时刻获得的奖励;x
t
,yy,z
t
表示t时刻机器人的质心在世界坐标系中的位置,wy和wz分别表示鼓励往y和z方向运动的权重。
[0127]
能耗指标可用下式表示:
[0128][0129]
其中m表示总的运动关节数;τ
i,t
表示关节i在t时刻的力矩,单位为(n
˙
m);表示每个关节在t时刻的速度,单位为(m/s);m是机器人的质量,单位为(kg)。
[0130]
结合运动指标函数对机器人穿越地形的奖励和能耗指标对机器人过大关节运动速度的惩罚,定义机器人地形穿越能力指标如下式:
[0131][0132]
其中w
motion
是运动指标系数,值取1;w
energy
是能耗指标系数,值取0.1;κ(t)是与t相关的时间累计系数,可以是随时间衰减的函数,置为常数1;下标gr表示使用某关节树对应
的步态生成器进行仿真;p
x
(t)=|x
t-x0|,表示对于机器人在运动过程在在x方向走偏的惩罚,t表示共运动t个时间步,x
t
表示终点x方向位置,x0表示起点x方向位置;
[0133]
综上,使用下式来定义机器人的综合评价指标:
[0134][0135]
其中两个权重参数w1=1,w2=0.1。
[0136]
步骤3,循环上述步骤直至达到指定的次数。
[0137]
为了说明本方法的有效性,对比本发明方法,将蒙特卡洛树搜索方法(最大深度设置为45)和循环神经网络(recurrent neural network,rnn)作为对照组(rnn网络包含两层的rnn模块,输入基于中序遍历编码的关节树特征向量,输出对应预测性能),每组实验各在3个随机种子下进行,实验结果按照历史过程中最优秀的综合指标f(r,b,t)、地形穿越能力指标综合距离指标q3(r,b)进行记录;三组实验分别得到图6~图8的搜索过程和部分优秀机器人。
[0138]
以上所述,仅为本发明的优选实施案例,并非对本发明做任何形式上的限制。虽然前文对本发明的实施过程进行了详细说明,对于熟悉本领域的人员来说,其依然可以对前述各实例记载的技术方案进行修改,或者对其中部分技术特征进行同等替换。凡在本发明精神和原则之内所做修改、同等替换等,均应包含在本发明的保护范围之内。

技术特征:
1.一种基于关节树和图神经网络的机器人形态生成和搜索方法,首先基于关节树来描述和生成机器人的形态,然后基于图神经网络进行机器人形态搜索,其特征在于,所述基于图神经网络进行机器人形态搜索,具体包括如下步骤:步骤1,采用图神经网络和两阶段贪心筛选机制生成机器人,并对机器人的步态生成器进行优化处理;步骤2,基于机器人形态距离指标和地形穿越能力指标得到机器人的综合评价指标;步骤3,循环上述步骤直至达到指定的次数。2.如权利要求1所述的一种基于关节树和图神经网络的机器人形态生成和搜索方法,其特征在于,所述基于关节树来描述和生成机器人的形态结构,具体为:使用起始节点nsn、躯干节点nbn、腿部节点nln、旋转节点nre、回转节点nro、躯干连杆节点lib、腿部连杆节点lil、固定关节节点fij、水平旋转关节节点rhj、垂直旋转关节节点rvj、前向回转关节节点rfj、后向回转关节节点rbj、连接件节点con来描述构成的机器人,机器人的关节树节点生成和替换的规则产生式包括:1)规则r1:nsn

[nbn]fij[nbn];2)规则r2:nsn

[nbn]nre[nbn];3)规则r3:nbn

[nbn]fij[nbn];4)规则r4:nbn

[nbn]nre[nbn];5)规则r5:nbn

[lib]con[nln];6)规则r6:nbn

lib;7)规则r7:nln

[nln]fij[nln];8)规则r8:nln

[nln]nre[nln];9)规则r9:nln

[nln]nro[nln];10)规则r10:nln

lil;11)规则r11:nre

rhj;12)规则r12:nre

rvj;13)规则r13:nro

rfj;14)规则r14:nro

rbj;其中,包含3个节点的产生式为原节点的生成规则,中间节点替换原节点,左边节点为替换后节点的左节点,右边节点为替换后节点的右节点;包含1个节点的产生式为原节点的替换规则,新节点直接替换原节点;所有节点均包含相关的节点属性,包括长度l,半径r,连接位置p,边长a,初始转角θ,缩小比例ξ;通过遍历关节树,结合节点类型和节点属性确定机器人的形态结构。3.如权利要求2所述的一种基于关节树和图神经网络的机器人形态生成和搜索方法,其特征在于,所述两阶段贪心筛选机制是引入贪心思想的两阶段筛选机制,具体为:首先使用规则产生式r1、r2、r3、r4、r11、r12生成k1个仅有nbn,nre,fij三类节点的躯干,并且所有躯干节点nbn数目相同,记作q,从其中随机挑选出b个,后将剩下的q-b个直接应用规则r6;在第一阶段逐步完善每个机器人躯干,得到完整的机器人,具体为:选择每个机器人躯
干上的b个躯干节点nbn后依次生成腿,每次都随机生成k2条不同的腿,将k2条不同的腿与躯干组合后生成不同的k2个临时机器人输入筛选机制得到s2个备选最优机器人此时以概率ε从中随机选择,概率1-ε从中选最优的;按照生成顺序重复上述过程,直至重复b次生成一个完整的机器人;在第二阶段综合比较每个完整的机器人,利用图神经网络预测每个完整机器人的性能,得到最终选择的机器人,具体为:在重复k1次第一阶段得到k1个完整的机器人后,将k1个完整机器人组成一批,输入筛选机制得到s2个最优的,各分配概率ε和1-ε进行随机选择并输出最终选择的机器人。4.如权利要求3所述的一种基于关节树和图神经网络的机器人形态生成和搜索方法,其特征在于,所述的筛选机制具体为:在筛选时,将机器人转换成无向关节树图和无向直接映射图两种数据结构,分别输入到两个结构相同的图神经网络中对机器人性能进行预测;设一批输入的机器人数量为b,经过预测后得到b个无向关节树图的预测结果和b个无向直接映射图的结果;从两批结果中各挑选出最优的前s1个结果,s1<b,再将这两批s1个结果对应的机器人序号做并集,再从并集中挑选最优的前s2个结果,s1≤s2≤2s1,这s2个结果就是经过筛选后所得的可信度高的优秀机器人,该过程可用下式表示:其中,符号{r}
s
表示有s个机器人的集合;tree和direct分别表示将输入的集合中的机器人转换成一批无向关节树图和无向直接映射图;top
s
表示取结果中最优的s个机器人;tdg({r}
b
,s1,s2)表示筛选机制。5.如权利要求3所述的一种基于关节树和图神经网络的机器人形态生成和搜索方法,其特征在于,所述图神经网络具体是由3层gnn模块+diffpool图池化模块构成,每个gnn模块中包含3个sageconv图卷积模块;其中sageconv图卷积模块的表达式为:其中sageconv图卷积模块的表达式为:其中sageconv图卷积模块的表达式为:其中表示第l层输入图的第i个节点的特征向量;aggregate表示聚集算子,采用均值聚集算子,并将聚集结果保存在sageconv图卷积模块的输出结果中,表示图的第i个节点的相邻节点集合;w是待学习的权重矩阵,σ表示激活函数,采用relu;norm表示归一化操作;所述diffpool图池化模块的表达式为:z
(l)
=gnn
l,embed
(a
(l)
,x
(l)
)s
(l)
=softmax(gnn
l,pool
(a
(l)
,x
(l)
))
式中gnn
l,embed
和gnn
l,pool
分别表示用于节点嵌入和图池化的gnn模块;表示节点嵌入矩阵;表示分配矩阵,通过softmax函数来聚合不同节点的信息从减少节点数,n
l
是超参数;其中其中和分别表示图池化前后的邻接矩阵和和节点特征矩阵。6.如权利要求2所述的一种基于关节树和图神经网络的机器人形态生成和搜索方法,其特征在于,所述对机器人的步态生成器进行优化处理,具体为:使用正弦发生器和径向基函数网络构成机器人步态生成器,并基于协方差矩阵自适应进化策略对该步态生成器进行优化;其中,所述的正弦发生器如下式:其中a表示幅度,ω表示频率,该部分作为径向基函数网络的输入;径向基函数如下式:径向基函数如下式:径向基函数如下式:其中σ
i
是高斯函数的方差;h是高斯核基函数所在的隐藏层神经元数目,μ
i,1
和μ
i,2
是对应第一层两个正弦发生器输入的rbf核函数中心;t
sg
是正弦发生器的周期;表示机器人躯干运动关节数加上一半的腿部运动关节数;θ
i
(t)则是每个运动关节的在时间t下的角度值。7.如权利要求3所述的一种基于关节树和图神经网络的机器人形态生成和搜索方法,其特征在于,所述步骤2中的基于机器人形态距离指标,具体包含外形距离和编码距离;其中外形距离基于机器人直观的外形来度量两个机器人之间的距离远近;编码距离是将机器人编码成字符串,然后通过字符串核函数计算的字符串相似度作为机器人之间的距离度量。8.如权利要求3所述的一种基于关节树和图神经网络的机器人形态生成和搜索方法,其特征在于,所述步骤2中的地形穿越能力指标,具体包含机器人运动指标和能耗指标;其中运动指标用于评价机器人在不同地形下运动时的速度,能耗指标采用机器人的移动能耗率。

技术总结
本发明属于机器人形态设计领域,涉及一种基于关节树和图神经网络的机器人形态生成和搜索方法,首先基于关节树来描述和生成机器人的形态,然后基于图神经网络进行机器人形态搜索,所述基于图神经网络进行机器人形态搜索,具体包括如下步骤:步骤1,采用图神经网络和两阶段贪心筛选机制生成机器人,并对机器人的步态生成器进行优化处理;步骤2,基于机器人形态距离指标和地形穿越能力指标得到机器人的综合评价指标;步骤3,循环上述步骤直至达到指定的次数。本发明采用关节树来描述和生成机器人,并且使用图神经网络来实现机器人形态的高效搜索和优化。效搜索和优化。效搜索和优化。


技术研发人员:王进 赵涛楠 陆国栋
受保护的技术使用者:浙江大学
技术研发日:2023.06.02
技术公布日:2023/10/8
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐