一种改善机器人运动平衡性的自适应控制策略

未命名 07-19 阅读：76 评论：0

1.本发明涉及一种自适应控制策略，具体涉及一种改善机器人运动平衡性的自适应控制策略。

背景技术：

2.作为一个衡量国家科技创新创造能力的重要标志，机器人的发展水平一直受到国家政府和社会各界的密切关注。首先要保证机器人运动具有较高的平衡性，因此，本发明基于改善机器人运动的平衡性来设计自适应控制策略。
3.机器人的运动模型是一个典型的多变量非线性系统，对其稳定性的研究是控制理论的经典问题。从系统状态的角度出发，在机器人运动时，为保持平衡，需要对其空间角度进行约束，尤其是在特殊情况下更是如此，也正因为这样，已有的研究大多是保证机器人输出的角度信息处于预定义的范围内，然而，在实际的应用中，机器人运动的角速度、角加速度甚至更多的状态变量也会或多或少影响机器人运动的平衡性，特别是在机器人受到外部干扰时更容易引起平衡失调，因此，需要对机器人运动时的所有状态进行约束。从系统稳定性的角度出发，现有的机器人相关控制策略已经能够降低机器人运动的稳定时间，但是能够实现系统有限时间收敛和让设计者自行设计跟踪误差稳定时间的控制策略还比较少，尤其是在系统具有外部干扰和约束条件的相关研究几乎没有。
4.基于此，亟需设计一种改善机器人运动平衡性的控制策略。

技术实现要素：

5.发明目的：为了克服已有技术上的不足，本发明提出一种改善机器人运动平衡性的自适应控制策略，在利用非线性干扰观测器抑制干扰、自适应控制处理未知参数、反步法推导控制器的基础上，使用基于有限时间性能函数和障碍李亚普诺夫函数的方法确保机器人运动中角度、角速度等状态约束条件以及跟踪误差规定时间预定性能收敛的实现，从而增强机器人的抗干扰能力和快速稳定能力，提升机器人的控制精度，改善机器人运动的平衡性。
6.技术方案：本发明公开了一种改善机器人运动平衡性的自适应控制策略，该控制策略是基于非线性干扰观测器和全状态约束的非线性系统有限时间预定性能自适应神经网络动态面控制策略，所述控制策略设计过程包括以下步骤：
7.步骤1：将机器人运动模型的状态方程进行转化，得到具有非匹配干扰和全状态约束的严格反馈非线性系统状态方程；
8.步骤2：设计有限时间性能函数，结合障碍李亚普诺夫函数构建合适的受约束误差变量，保证所有状态变量不违反约束条件的同时实现系统跟踪误差在规定时间内满足预定性能的控制目标；
9.设计的有限时间性能函数为：
[0010][0011]
其中，p0是正参数，该函数的初始值是函数的收敛时间用td来表示且
[0012]
障碍李亚普诺夫函数l
blf
是保证系统在约束条件里常用的方法，l
blf
是一个标量正函数，对于一个定义在包含原点开区域d上的系统来说，l
blf
的一阶偏导是光滑的，当s趋近于d的边界时，l
blf
趋近于无穷大，另外，沿着系统的解有：当t＞0，l
blf
≤b，其中b＞0；
[0013]
结合障碍李亚普诺夫函数的以上特性和有限时间性能函数，设计出如下格式的时变障碍李亚普诺夫函数：
[0014][0015]
其中，ei是误差变量并且会在后续步骤中进行定义，这样包含跟踪误差e1在内的所有误差变量会被限制在以有限时间性能函数为界的区域内，即|ei|＜pi；
[0016]
步骤3：结合神经网络逼近技术，利用动态面控制反推方法来设计虚拟控制、实际输入、自适应更新律和非线性干扰观测器以满足控制目标；
[0017]
步骤4：结合所使用的基于非线性干扰观测器和全状态约束的非线性系统有限时间预定性能自适应神经网络动态面控制策略设计出合适的正定李亚普诺夫函数l，计算l的时间导数并将设计的虚拟控制、实际输入、自适应更新律和非线性干扰观测器代入进行化简放缩得到的不等式；判断不等式是否满足半全局有限时间稳定判断依据若满足，证明该控制策略能够实现系统半全局有限时间稳定，若不满足，则重新设计虚拟控制、实际输入、自适应更新律和非线性干扰观测器来进行代入计算，直至满足
[0018]
步骤5：根据李亚普诺夫稳定性理论来进行分析，证明所述控制策略能够保证系统在有限时间内稳定，且能够在满足约束条件的情况下保证跟踪误差在规定时间收敛到预定义的范围内。
[0019]
进一步地，在步骤1中，具有非匹配干扰和全状态约束的严格反馈非线性系统的状态方程表示为：
[0020][0021]
其中，是系统的状态变量且需满足是系统的状态变量且需满足是状态变量的约束，u∈r,y∈r代表系统的控制输入与控制输出，表示系统的未知外部干扰，
和分别代表未知和已知的光滑函数且满足g
i,1
≤|gi|≤g
i,m
，g
i,1
和g
i,m
是已知常数，i＝1,2,...,n；
[0022]
进一步地，所述步骤3中控制目标具体为：
[0023]
目标1：保证闭环系统所有变量都是半全局有限时间稳定的，非匹配干扰得到良好的抑制；
[0024]
目标2：非线性系统所有的状态变量都确保在一定的约束条件内，不违反全状态约束；
[0025]
目标3：系统的输出能够遵循期望输出且跟踪误差在规定时间里收敛到预定范围内。
[0026]
进一步地，所述步骤3具体包括如下步骤：
[0027]
1)结合神经网络技术得到将具有非匹配干扰和全状态约束的严格反馈非线性系统的状态方程转化成如下形式：
[0028][0029]
其中，是复合干扰且满足|di(t)|≤d
i,1
，d
i,1
和d
i,m
是正的常数；ξi是神经网络基函数，w
i*
代表最优权值，表示神经网络的逼近误差，i＝1,2,...,n；这样，神经网络的逼近误差也会进入到非线性干扰观测器里，使得整个控制策略的误差更小；
[0030]
2)结合神经网络逼近技术，利用动态面控制反推方法来设计的一系列变量为：
[0031]
e1＝x
1-ys,
[0032]ei
＝x
i-ζi,
[0033]
vi＝ζ
i-x
i,c
,
[0034][0035][0036]
其中，e1,ei是误差变量，ys是期望轨迹且满足ε
l
＞0是常数，l＝0,1,2；x
i,c
和ζi分别为滤波器的输入和输出，该滤波器会在后续步骤中进行定义，vi是滤波器的误差变量，表示神经网络权值向量的估计值，是由非线性干扰观测器输出的复合干扰估计值，分别定义为两个估计值与实际值的误差；
[0037]
3)结合神经网络逼近技术，利用动态面控制反推方法来设计的虚拟控制、实际输入、自适应更新律为：
[0038]
[0039][0040][0041][0042][0043][0044]
其中，c
a,1
,c
i,1
是正的待设计参数，是辅助变量，0＜β＜1。
[0045]
进一步地，所述步骤4具体包括以下步骤：
[0046]
步骤(41)结合具有非匹配干扰和全状态约束的严格反馈非线性系统的状态方程和误差变量e1＝x
1-ys，对e1求其时间导数，得到：
[0047][0048]
为了解决未知干扰所造成的影响，设计一个如下形式的非线性干扰观测器：
[0049][0050]
根据式(2)，求复合干扰估计值的时间导数，得到：
[0051][0052]
由于所以复合干扰估计误差的时间导数为：
[0053][0054]
为了避免反推方法中对虚拟控制x
2,c
重复求导所导致的计算量“爆炸”的问题，根据所设计的虚拟控制x
2,c
和自适应更新律来构造一个如下形式的一阶滤波器：
[0055][0056]
其中，λ2是滤波器的时间常数，该滤波器的输入和输出分别是虚拟控制x
2,c
和变量ζ2；
[0057]
定义v2＝ζ
2-x
2,c
并求其时间导数，计算得到：
[0058][0059]
其中，虚拟控制的导数是一个连续函数且满足ρ
c,2
是一个正的常数，为了方便表示，定义如此，有：
[0060][0061]
设计如下所示的正定lyapunov函数：
[0062][0063]
对l1求其时间导数，得到：
[0064][0065]
其中，辅助变量
[0066]
基于young不等式，可以得到以下一系列不等式：
[0067][0068]
除此之外，有
[0069][0070]
将式(10)和(11)代入到式(9)中去来进行放缩，得到：
[0071][0072]
步骤(42)对li求其时间导数，经过等式计算和不等式放缩，得到：
[0073][0074]
步骤(43)对ln求其时间导数，经过等式计算和不等式放缩，得到：
[0075][0076]
进一步地，所述步骤5的验证过程包括：
[0077]
整合设计的所有lyapunov函数，得到：
[0078][0079]
需注意，结合得到如下不等式：
[0080][0081]
整合所有计算和式(16)，可得：
[0082][0083]
定义：
[0084][0085]
因此，式(17)变为：
[0086][0087]
结合以下不等式
[0088][0089]
除此之外，根据log函数的定义和性质，有：
[0090][0091]
将式(20)和式(21)代入到式(19)中，计算得到：
[0092][0093]
其中，
[0094]
显然，式(22)可以化简为：
[0095]
[0096]
计算并化简式(23)，得到计算并化简式(23)，得到成立，w是一个常数且满足0＜w≤1，得到的收敛时间tr表示为：
[0097][0098]
由上述所有的推导步骤可知，闭环系统的所有信号e1,...,en,v1,...,vn都是半全局有限时间稳定的，复合干扰误差有限时间稳定证明非线性干扰观测器能够很好地预测干扰，从而实现干扰抑制；由于x1＝e1+ys，因此，其中，也就是说，|x1|＜p1+ε0；类似的，di和w
i*
有界，根据和所以和有界，由于虚拟控制x
i,c
是关于p
i-1
,e
i-1
,的连续函数，p
i-1
,e
i-1
,均有界，所以，虚拟控制x
i,c
是有界的，与之对应的状态变量这样就确保了系统满足全状态约束条件；结合设计的有限时间性能函数p1来进行分析，系统输出y与参考轨迹ys之间的跟踪误差e1会在规定的时间内收敛到以为上下界的预定区域内；至此，针对具有非匹配干扰和全状态约束的严格反馈非线性系统的控制目标都能够实现。
[0099]
有益效果：
[0100]
1、本发明提出了一种基于非线性干扰观测器和全状态约束的非线性系统有限时间预定性能自适应神经网络动态面控制策略，该策略将有限时间性能函数和log型障碍李亚普诺夫函数相结合，设计出时变的log型障碍李亚普诺夫函数用以对状态误差进行约束，使得跟踪误差在规定的时间内收敛到预定义的范围里，同时，保证系统满足状态约束条件；使用动态面控制反推方法来设计出虚拟控制、实际控制器和自适应更新律，降低了常规反推方法的计算复杂度。该策略中的有限时间预定性能控制和约束控制能够使机器人运动中输出角度的跟踪误差在规定时间收敛到预定范围内，能够使机器人运动的角度、角速度等状态变量保持在约束条件范围内的情况下实现机器人运动系统的半全局有限时间稳定，提升机器人运动的性能指标，进而改善机器人运动的平衡性。
[0101]
2、针对机器人系统中广泛存在的由外部环境变化、运行负荷、未建模动力学等因素产生的干扰，本发明使用主动抗干扰技术——非线性干扰观测器来补偿由干扰产生的影响，将神经网络逼近未知函数的误差和外部干扰一同输入到非线性干扰观测器里面，抗干扰的同时降低未知函数对系统稳定的影响。本发明所提出的控制策略针对的是更一般的具有非匹配干扰的系统，在满足有限时间预定性能和全状态约束条件的基础上，补偿由未知函数和外部干扰对系统稳定性所产生的影响，提升闭环系统的鲁棒性，进一步改善机器人运动的平衡性。
附图说明
[0102]
图1为本发明实施的自适应控制策略流程图；
[0103]
图2为本发明有限时间性能函数及跟踪误差e1的曲线；
[0104]
图3为本发明控制输入u的曲线；
[0105]
图4为本发明复合干扰d1及其估计值的曲线；
[0106]
图5为本发明复合干扰d2及其估计值的曲线；
[0107]
图6为本发明输出y、期望输出ys以及约束的曲线；
[0108]
图7为本发明状态变量x2及其约束的曲线。
具体实施方式
[0109]
下面对本发明技术方案进行详细说明。
[0110]
本发明中以用于机器人运动模型的状态方程为例，对其进行控制策略设计，该运动模型的状态方程为：
[0111][0112]
其中，u为系统输入，y为系统输出，x1,x2分别表示机器人摆的角度和角速度，g,m,mc分别表示重力系数、杆子的质量和推车的质量，l代表杆子的一半长度。
[0113]
在机器人运动时，根据实际需要，其角度、角速度等状态若能限制在一定的范围内，同时跟踪误差若能在规定时间内保持在预定的范围内，那么，机器人在运动时就能避免由不合适的角度、角速度等产生的不平衡现象，机器人运动时的平衡性会得到极大的改善，除此之外，如果将系统(1)中未知干扰产生的影响进行补偿，这样一来，机器人运动时的平衡性会进一步提升。基于此，设计了基于非线性干扰观测器和全状态约束的非线性系统有限时间预定性能自适应神经网络控制策略来实现上述性能要求。
[0114]
本发明设计的改善机器人运动平衡性的自适应控制策略，能够适用于更一般化的严格反馈非线性系统，将状态方程(1)进行化简并扩展到n阶，得到具有非匹配干扰和全状态约束的严格反馈非线性系统的状态方程，表示如下：
[0115][0116]
其中，是系统的状态变量且需满足是系统的状态变量且需满足是状态变量的约束，u∈r,y∈r代表系统的控制输入与控制输出，表示系统的未知外部干扰，
和分别代表未知和已知的光滑函数且满足g
i,1
≤|gi|≤g
i,m
，g
i,1
和g
i,m
是已知常数，i＝1,2,...,n。
[0117]
显而易见，状态方程(1)是状态方程(2)i＝2时的特例，所有满足具有非匹配干扰和全状态约束的严格反馈非线性系统方程(2)形式的模型都能够使用本发明提出的基于非线性干扰观测器和全状态约束的非线性系统有限时间预定性能自适应神经网络动态面控制策略。
[0118]
实现本发明所述的控制策略，详细的步骤如下：
[0119]
步骤(1)设计有限时间性能函数，结合障碍李亚普诺夫函数构建合适的受约束误差变量。
[0120]
设计如下有限时间性能函数：
[0121][0122]
其中，p0是正参数，该函数的初始值是函数的收敛时间用td来表示且
[0123]
障碍李亚普诺夫函数l
blf
是保证系统在约束条件里常用的方法，l
blf
是一个标量正函数，对于一个定义在包含原点开区域d上的系统来说，l
blf
的一阶偏导是光滑的，当s趋近于d的边界时，l
blf
趋近于无穷大，另外，沿着系统的解有当t＞0，l
blf
≤b，其中b＞0。
[0124]
结合障碍李亚普诺夫函数的以上特性和有限时间性能函数，设计出如下格式的时变障碍李亚普诺夫函数：
[0125][0126]
其中，ei是误差变量并且会在后续步骤中进行定义，这样包含跟踪误差e1在内的所有误差变量会被限制在以有限时间性能函数为界的区域内，即|ei|＜pi。
[0127]
步骤(2)结合神经网络逼近技术，利用动态面控制反推方法来设计虚拟控制、实际输入、自适应更新律和非线性干扰观测器以满足控制目标。
[0128]
使用神经网络技术得到将式(2)中的具有非匹配干扰和全状态约束的严格反馈非线性系统的状态方程转化成如下形式：
[0129][0130]
其中，是复合干扰且满足|di(t)|≤d
i,1
，d
i,1
和d
i,m
是正的常数；ξi是神经网络基函数，w
i*
代表最优权值，表示神经网络的逼近误差，i＝1,2,...,n。这样，神经网络的逼近误差也会进入到非线性干扰观测器里，使得整个控制策略的误差
更小。
[0131]
结合神经网络逼近技术，利用动态面控制反推方法来设计的一系列变量为：
[0132][0133]
其中，e1,ei是误差变量，ys是期望轨迹且满足ε
l
＞0是常数，l＝0,1,2；x
i,c
和ζi分别为滤波器的输入和输出，该滤波器会在后续步骤中定义，vi是滤波器的误差变量，表示神经网络权值向量的估计值，是由非线性干扰观测器输出的复合干扰估计值，分别定义为两个估计值与实际值的误差，滤波器和非线性干扰观测器会在后续步骤中设计。
[0134]
结合神经网络逼近技术，利用动态面控制反推方法来设计的虚拟控制、实际输入和自适应更新律包括：
[0135][0136]
其中，c
a,1
,c
i,1
是正的待设计参数，是辅助变量，0＜β＜1。
[0137]
步骤(3)结合所使用的基于非线性干扰观测器和全状态约束的非线性系统有限时间预定性能自适应神经网络动态面控制策略设计出合适的正定李亚普诺夫函数l，计算l的时间导数并将设计的虚拟控制、实际输入、自适应更新律和非线性干扰观测器代入进行化简放缩得到的不等式。判断不等式是否满足半全局有限时间稳定判断依据若满足，证明该控制策略能够实现系统半全局有限时间稳定，若不满足，则重新设计虚拟控制、实际输入、自适应更新律和非线性干扰观测器来进行代入计算，直至满足
[0138]
本发明的主要控制目标如下：
[0139]
目标1：保证闭环系统所有变量都是半全局有限时间稳定的，非匹配干扰得到良好的抑制；
[0140]
目标2：非线性系统所有的状态变量都确保在一定的约束条件内，不违反全状态约束；
[0141]
目标3：系统的输出能够遵循期望输出且跟踪误差在规定时间里收敛到预定范围内。
[0142]
下面将给出基于非线性干扰观测器和全状态约束的非线性系统有限时间预定性能自适应神经网络动态面控制策略设计的具体步骤，设计步骤被分为n步：
[0143]
第1步：结合具有非匹配干扰和全状态约束的严格反馈非线性系统的状态方程和误差变量e1＝x
1-ys，对e1求时间导数，得到：
[0144][0145]
为了解决未知干扰所造成的影响，设计一个如下形式的非线性干扰观测器：
[0146][0147]
根据式(9)，求复合干扰估计值的时间导数，得到：
[0148][0149]
由于所以复合干扰估计误差的时间导数为：
[0150][0151]
设计如下形式的虚拟控制和自适应更新律：
[0152][0153][0154]
为了避免反推方法中对虚拟控制x
2,c
重复求导所导致的计算量“爆炸”的问题，设计一个如下形式的一阶滤波器：
[0155][0156]
其中，λ2是时间常数，该滤波器的输入和输出分别是虚拟控制x
2,c
和变量ζ2。
[0157]
定义v2＝ζ
2-x
2,c
并且求其时间导数，计算得到：
[0158][0159]
其中，虚拟控制的导数是一个连续函数且满足ρ
c,2
是一个正的常数，为了方便表示，定义表示为：
[0160][0161]
设计如下所示的正定lyapunov函数：
[0162][0163]
对l1求时间的导数，得到：
[0164][0165]
其中，辅助变量
[0166]
基于young不等式，可以得到以下一系列不等式：
[0167][0168]
除此之外，有
[0169][0170]
将式(19)和(20)代入至式(18)中去来进行放缩，得到：
[0171][0172]
第i步(2≤i≤n-1)：与第1步相似，结合非线性系统(5)和式(6)，计算误差ei的时间导数，得到：
[0173][0174]
定义辅助变量c
i,d
是增益参数，基于此，设计如下形式的非线性干扰观测器：
[0175][0176]
根据式(23)和式(6)，复合干扰估计误差的导数为：
[0177][0178]
随后，设计的第i个虚拟控制和自适应更新律为：
[0179][0180][0181]
其中，c
a,i
,c
i,1
是正的待设计参数，是辅助变量。
[0182]
为了解决重复求导的问题，让虚拟控制x
i+1,c
通过一个时间常数为λ
i+1
的一阶滤波器，该滤波器形式如下：
[0183][0184]
其中，x
i+1,c
和ζ
i+1
分别是该滤波器的输入和输出。
[0185]
定义变量v
i+1
＝ζ
i+1-x
i+1,c
，求得v
i+1
的时间导数为：
[0186][0187]
其中,定义函数h
i+1
(
·
)表示为：
[0188][0189]
设计第i个lyapunov函数为：
[0190][0191]
对li求时间的导数并将式(22)、(24)、(25)、(26)、(28)代入计算可得：
[0192][0193]
根据young不等式，有：
[0194]
[0195]
除此之外，结合有：
[0196][0197]
将式(32)和式(33)代入到式(31)中进行放缩计算，得到：
[0198][0199]
第n步：根据非线性系统状态方程(5)及式(6)，得到误差变量en的时间导数为：
[0200][0201]
与前面步骤所设计的非线性干扰观测器相似，此处设计的非线性干扰观测器如下：
[0202][0203]
其中，τn是辅助变量，c
n,d
是增益参数。
[0204]
结合式(6)、式(35)和式(36)，得到复合干扰估计误差的时间导数为：
[0205][0206]
该控制策略所设计的实际控制器u和自适应更新律表示为：
[0207][0208][0209]
其中，c
a,n
,c
n,1
是正的待设计参数，是方便推导所设计的辅助变量。
[0210]
设计第n个lyapunov函数为：
[0211][0212]
计算ln的时间导数并且将式(35)、(37)、(38)、(39)代入，得到：
[0213][0214]
根据young不等式，得到：
[0215][0216]
除此之外，有
[0217][0218]
将式(42)、式(43)代入到式(41)进行放缩，得到：
[0219][0220]
步骤(4)根据李亚普诺夫稳定性理论来进行分析，证明本发明提出的控制策略能够保证系统在有限时间内稳定，且能够在满足约束条件的情况下保证跟踪误差在规定时间收敛到预定义的范围内。
[0221]
考虑具有非匹配干扰和全状态约束的严格反馈非线性系统(2)，将虚拟控制、实际输入和自适应更新律设为式(7)，非线性干扰观测器设计为式(9)、式(23)、和式(36)，结合障碍李亚普诺夫函数、有限时间性能函数和神经网络逼近，可以保证以下特性：闭环系统所有变量都是半全局有限时间稳定的，非匹配干扰得到良好的抑制；非线性系统所有的状态变量都确保在一定的约束条件内，不违反全状态约束；系统的输出能够遵循期望输出且跟踪误差在规定时间里收敛到预定范围内。
[0222]
证明：
[0223]
基于上述步骤中所设计的所有lyapunov函数，得到：
[0224][0225]
需注意，结合得到如下不等式：
[0226][0227]
整合所有计算和式(46)，可得：
[0228][0229]
定义：
[0230][0231]
因而，式(47)变为：
[0232][0233]
结合以下不等式
[0234][0235]
除此之外，结合log函数的定义和性质，有：
[0236][0237]
将式(50)和式(51)代入到式(49)中，计算得到：
[0238][0239]
其中，
[0240]
显然，式(52)可以化简为：
[0241][0242]
计算并化简式(53)，得到计算并化简式(53)，得到成立，w是一个常数且满足0＜w≤1，得到的收敛时间tr表示为：
[0243][0244]
由上述所有的推导步骤可知，闭环系统的所有信号e1,...,en,v1,...,vn都是半全局有限时间稳定的，复合干扰误差有限时间稳定证明非线性干扰观测器能够很好地预测干扰，从而实现干扰抑制。由于x1＝e1+ys，因此，其中，也就是说，|x1|＜p1+ε0；类似的，di和w
i*
有界，根据和所以和有界，由于虚拟控制x
i,c
是关于p
i-1
,e
i-1
,的连续函数，p
i-1
,e
i-1
,均有界，所以，虚拟控制x
i,c
是有界的，与之对应的状态变量
这样就确保了系统满足全状态约束条件。结合本发明设计的有限时间性能函数p1来进行分析，系统输出y与参考轨迹ys之间的跟踪误差e1会在规定的时间内收敛到以为上下界的预定区域内。至此，针对具有非匹配干扰和全状态约束的严格反馈非线性系统的控制目标都能够实现。
[0245]
本发明提出了基于非线性干扰观测器和全状态约束的非线性系统有限时间预定性能自适应神经网络控制策略，使用神经网络去逼近未知函数，再将逼近误差和系统外部干扰相结合构造复合干扰，利用非线性干扰观测器去预测该复合干扰；通过构造有限时间性能函数和log型障碍李亚普诺夫函数相结合的时变障碍李亚普诺夫函数来满足系统全状态约束要求的同时使得该系统中的跟踪误差在规定时间收敛且收敛在预定义的范围内，最终使得具有外部干扰和全状态约束的非线性系统能够实现半全局有限时间稳定。
[0246]
上述从理论角度验证了本发明所提出控制策略的有效性，在针对机器人运动模型等实际应用时，该方法更易于运用，主要体现在：
[0247]
(1)调整时变障碍李亚普诺夫函数的相关参数，可以调整实际应用模型中所有状态变量的约束，使得应用的精确度与性能更优。
[0248]
(2)本发明策略针对的是n阶的一般系统，可以适时调整所需系统状态变量个数来获得更优秀的控制性能。
[0249]
(3)使用matlab工具将该控制策略应用于机器人运动模型上，仿真结果证明该控制策略的有效性。
[0250]
针对具有外部干扰和全状态约束的机器人运动模型，相关仿真结果如图2-图7所示。从仿真图2至图7中可以看出，
[0251]
上述实施方式只为说明本发明的技术构思及特点，其目的在于让熟悉此项技术的人能够了解本发明的内容并据以实施，并不能以此限制本发明的保护范围。凡根据本发明精神实质所做的等效变换或修饰，都应涵盖在本发明的保护范围之内。

技术特征：
1.一种改善机器人运动平衡性的自适应控制策略，其特征在于，所述控制策略基于非线性干扰观测器和全状态约束的非线性系统有限时间预定性能自适应神经网络动态面控制策略，所述控制策略设计过程包括以下步骤：步骤1：将机器人运动模型的状态方程进行转化，得到具有非匹配干扰和全状态约束的严格反馈非线性系统状态方程；步骤2：设计有限时间性能函数，结合障碍李亚普诺夫函数构建合适的受约束误差变量，保证所有状态变量不违反约束条件的同时实现系统跟踪误差在规定时间内满足预定性能的控制目标；设计的有限时间性能函数为：其中，p0是正参数，该函数的初始值是函数的收敛时间用t
d
来表示且障碍李亚普诺夫函数l
blf
是保证系统在约束条件里常用的方法，l
blf
是一个标量正函数，对于一个定义在包含原点开区域d上的系统来说，l
blf
的一阶偏导是光滑的，当s趋近于d的边界时，l
blf
趋近于无穷大，另外，沿着系统的解有：当t＞0，l
blf
≤b，其中b＞0；结合障碍李亚普诺夫函数的以上特性和有限时间性能函数，设计出如下格式的时变障碍李亚普诺夫函数：其中，e
i
是误差变量并且会在后续步骤中进行定义，这样包含跟踪误差e1在内的所有误差变量会被限制在以有限时间性能函数为界的区域内，即|e
i
|＜p
i
；步骤3：结合神经网络逼近技术，利用动态面控制反推方法来设计虚拟控制、实际输入、自适应更新律和非线性干扰观测器以满足控制目标；步骤4：结合所使用的基于非线性干扰观测器和全状态约束的非线性系统有限时间预定性能自适应神经网络动态面控制策略设计出合适的正定李亚普诺夫函数l，计算l的时间导数并将设计的虚拟控制、实际输入、自适应更新律和非线性干扰观测器代入进行化简放缩得到的不等式；判断不等式是否满足半全局有限时间稳定判断依据若满足，证明该控制策略能够实现系统半全局有限时间稳定，若不满足，则重新设计虚拟控制、实际输入、自适应更新律和非线性干扰观测器来进行代入计算，直至满足(5)根据李亚普诺夫稳定性理论来进行分析，证明所述控制策略能够保证系统在有限时间内稳定，且能够在满足约束条件的情况下保证跟踪误差在规定时间收敛到预定义的范围内。
2.根据权利要求1所述的改善机器人运动平衡性的自适应控制策略，其特征在于，在步骤1中，具有非匹配干扰和全状态约束的严格反馈非线性系统的状态方程表示为：其中，是系统的状态变量且需满足是状态变量的约束，u∈r,y∈r代表系统的控制输入与控制输出，表示系统的未知外部干扰，和分别代表未知和已知的光滑函数且满足g
i,1
≤|g
i
|≤g
i,m
，g
i,1
和g
i,m
是已知常数，i＝1,2,...,n。3.根据权利要求2所述的改善机器人运动平衡性的自适应控制策略，其特征在于，所述步骤3中控制目标具体为：目标1：保证闭环系统所有变量都是半全局有限时间稳定的，非匹配干扰得到良好的抑制；目标2：非线性系统所有的状态变量都确保在一定的约束条件内，不违反全状态约束；目标3：系统的输出能够遵循期望输出且跟踪误差在规定时间里收敛到预定范围内。4.根据权利要求3所述的改善机器人运动平衡性的自适应控制策略，其特征在于，所述步骤3具体包括如下步骤：1)结合神经网络技术得到将具有非匹配干扰和全状态约束的严格反馈非线性系统的状态方程转化成如下形式：其中，是复合干扰且满足|d
i
(t)|≤d
i,1
，d
i,1
和d
i,m
是正的常数；ξ
i
是神经网络基函数，w
i*
代表最优权值，表示神经网络的逼近误差，i＝1,2,...,n；这样，神经网络的逼近误差也会进入到非线性干扰观测器里，使得整个控制策略的误差更小；2)结合神经网络逼近技术，利用动态面控制反推方法来设计的一系列变量为：e1＝x
1-y
s
,e
i
＝x
i-ζ
i
,v
i
＝ζ
i-x
i,c
,,其中，e1,e
i
是误差变量，y
s
是期望轨迹且满足ε
l
＞0是常数，l＝0,1,2；x
i,c
和ζ
i
分别为滤波器的输入和输出，该滤波器会在后续步骤中进行定义，v
i
是滤波器的误差变量，表示神经网络权值向量的估计值，是由非线性干扰观测器输出的复合干扰估计值，
分别定义为两个估计值与实际值的误差；3)结合神经网络逼近技术，利用动态面控制反推方法来设计的虚拟控制、实际输入、自适应更新律为：适应更新律为：适应更新律为：适应更新律为：适应更新律为：适应更新律为：其中，c
a,1
,c
i,1
是正的待设计参数，是辅助变量，0＜β＜1。5.根据权利要求4所述的改善机器人运动平衡性的自适应控制策略，其特征在于，所述步骤4具体包括以下步骤：步骤(41)结合具有非匹配干扰和全状态约束的严格反馈非线性系统的状态方程和误差变量e1＝x
1-y
s
，对e1求其时间导数，得到：为了解决未知干扰所造成的影响，设计一个如下形式的非线性干扰观测器：根据式(2)，求复合干扰估计值的时间导数，得到：由于所以复合干扰估计误差的时间导数为：
为了避免反推方法中对虚拟控制x
2,c
重复求导所导致的计算量“爆炸”的问题，根据所设计的虚拟控制x
2,c
和自适应更新律来构造一个如下形式的一阶滤波器：其中，λ2是滤波器的时间常数，该滤波器的输入和输出分别是虚拟控制x
2,c
和变量ζ2；定义v2＝ζ
2-x
2,c
并求其时间导数，计算得到：其中，虚拟控制的导数是一个连续函数且满足ρ
c,2
是一个正的常数，为了方便表示，定义如此，有：设计如下所示的正定lyapunov函数：对l1求其时间导数，得到：其中，辅助变量基于young不等式，可以得到以下一系列不等式：
除此之外，有将式(10)和(11)代入到式(9)中去来进行放缩，得到：步骤(42)对l
i
求其时间导数，经过等式计算和不等式放缩，得到：步骤(43)对l
n
求其时间导数，经过等式计算和不等式放缩，得到：6.根据权利要求5所述的改善机器人运动平衡性的自适应控制策略，其特征在于，所述步骤5的验证过程包括：整合设计的所有lyapunov函数，得到：需注意，结合得到如下不等式：
整合所有计算和式(16)，可得：定义：因此，式(17)变为：结合以下不等式除此之外，根据log函数的定义和性质，有：将式(20)和式(21)代入到式(19)中，计算得到：
其中，显然，式(22)可以化简为：计算并化简式(23)，得到成立，w是一个常数且满足0＜w≤1，得到的收敛时间t
r
表示为：由上述所有的推导步骤可知，闭环系统的所有信号e1,...,e
n
,v1,...,v
n
都是半全局有限时间稳定的，复合干扰误差有限时间稳定证明非线性干扰观测器能够很好地预测干扰，从而实现干扰抑制；由于x1＝e1+y
s
，因此，其中，也就是说，|x1|＜p1+ε0；类似的，d
i
和w
i*
有界，根据和所以和有界，由于虚拟控制x
i,c
是关于p
i-1
,e
i-1
,的连续函数，p
i-1
,e
i-1
,均有界，所以，虚拟控制x
i,c
是有界的，与之对应的状态变量这样就确保了系统满足全状态约束条件；结合设计的有限时间性能函数p1来进行分析，系统输出y与参考轨迹y
s
之间的跟踪误差e1会在规定的时间内收敛到以为上下界的预定区域内；至此，针对具有非匹配干扰和全状态约束的严格反馈非线性系统的控制目标都能够实现。

技术总结
本发明公开了一种改善机器人运动平衡性的自适应控制策略，包括：将机器人运动的状态方程进行转化，得到一般形式的状态方程；设计有限时间性能函数，结合障碍李亚普诺夫函数构建合适的受约束误差变量；结合神经网络逼近技术，利用动态面控制反推方法设计虚拟控制、实际输入、自适应更新律和非线性干扰观测器；设计合适的正定李亚普诺夫函数L，对其进行求导计算代入虚拟控制、实际输入、自适应更新律和非线性干扰观测器得到并进行稳定性判定。与现有技术相比，本发明能够保证系统在有限时间内稳定，且能够在满足约束条件的情况下保证跟踪误差在规定时间收敛到预定义的范围内，实现了机器人运动系统的约束控制、干扰抑制和有限时间预定性能指标。限时间预定性能指标。限时间预定性能指标。

技术研发人员：刘伟钱宗敏赵建航费诗淇刘滢王俊豪唐威靖阳余慧季新然赵环宇杜董生刘根水张丽娟
受保护的技术使用者：淮阴工学院
技术研发日：2023.03.22
技术公布日：2023/7/18

版权声明

本文仅代表作者观点，不代表航空之家立场。
本文系作者授权航家号发表，未经原创作者书面授权，任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时，须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的，航空之家将依法追究其法律责任。（航空之家官方QQ：2926969996）

飞行汽车 https://www.autovtol.com/

上一篇：一种用于医疗系统中的医患智能沟通交互装置的制作方法 下一篇：一种可旋转及滑动的中控屏安装结构的制作方法

一种改善机器人运动平衡性的自适应控制策略

版权声明

航空之家

相关推荐

文章排行

最近发表

标签列表

一种改善机器人运动平衡性的自适应控制策略

版权声明

相关文章

航空之家

相关推荐

文章排行

最近发表

标签列表