多智能体系统的有限时间时变编队跟踪控制方法及系统
未命名
07-26
阅读:256
评论:0
1.本发明属于多智能体系统的编队跟踪控制技术领域,具体涉及异构非线性多智能体系统的有限时间时变编队跟踪控制,基于有限时间观测器和自适应输出调节方法提出了一种新的分布式输出时变编队跟踪控制器。
背景技术:
2.多智能体系统的编队控制是目前控制领域的研究热点,在众多领域都具有重要应用前景。该技术融合了多传感器技术、通信技术和协同控制技术,相较于单个智能体,具有独特的优势。在自主驾驶车辆、卫星编队控制、海洋勘探、无人机编队等实际场景中,多智能体的编队和跟踪控制技术是实现典型任务的必要条件。因此,深入研究和广泛应用多智能体系统技术对促进这些领域的发展至关重要。
3.编队控制的主要目标是设计合适的控制器,使具有信息交互能力的智能体能根据任务要求实现所需的编队。目前在机器人领域已经提出了几种经典的编队控制方法并得到了验证,包括基于行为、虚拟结构和领导者-跟随者的编队控制。然而,这些方法都有其自身的缺点,影响了多智能体系统的工作效率。例如,对于领导者-跟随者的控制方式,如果领导者因各种因素导致不能工作,那么整个编队构型则无法维持。
4.随着一致性控制理论的进步,由于其鲁棒性强、计算量少、稳定性好,研究人员利用分布式一致性理论研究了多智能体的编队控制或编队跟踪问题。基于一致性的编队控制方法有很多,并且优点很多,值得注意的是,多智能体不仅需要形成所需的编队形状,而且还需要确保编队在实际情况下应在有限时间内跟踪领导者的状态轨迹。然而,目前的研究很多都集中在探讨固定形式的多智能体一致性跟踪问题或编队跟踪问题,但很少有研究探讨如何在有限时间内实现编队控制,对于一些实际应用,如编队穿透、协同探测等,可能需要多智能体的编队随时间变化。例如,无人水面舰艇需要快速变换编队形状才能通过狭窄的水道。此外,许多先前的研究都是基于同构系统的,而现实世界中,多智能体可能是由多种不同类型的智能机器人组成,因此探讨如何在异构非线性多智能体中实现形成跟踪控制也是十分必要的。因此,如何为异构多智能体系统设计合适的时变编队跟踪控制器具有重要意义。
技术实现要素:
5.本发明的目的是提供本一种多智能体系统的有限时间时变编队跟踪控制方法及系统,旨在解决实际应用中包含不同种类智能体的多智能体系统面临编队随时间变化的需求,即异构多智能体系统的有限时间一致性或编队跟踪控制。
6.为实现上述目的,本发明提供了如下方案:
7.一种多智能体系统的有限时间时变编队跟踪控制方法,所述方法包括:
8.建立异构非线性多智能体系统领导者和跟随者的动力学模型;
9.基于所述动力学模型,构建具有未知输入的领导者的分布式有限时间状态观测
器,并利用所述状态观测器估计领导者状态和领导者系统矩阵;
10.基于所述状态观测器的观测结果,利用自适应算法对所述跟随者的输出控制调节方程进行求解,得出跟随者的反馈控制律;
11.引入一个额外变量;所述额外变量是在保证所述异构非线性多智能体系统在领导者未知输入的影响下实现有限时间输出时变编队控制的前提下提出的;
12.基于所述状态观测器的观测结果、所述跟随者的反馈控制律和所述额外变量设计所述跟随者的自适应有限时间输出时变编队控制协议;所述观测结果包括所述状态观测器估计领导者状态和领导者系统矩阵。
13.可选的,所述动力学模型包括跟随者动力学模型和领导者动力学模型;
14.所述跟随者动力学模型包括:
[0015][0016]
yi(t)=cixi(t),
[0017]
其中,i=1,2,...,n;n为跟随者的个数;xi(t),yi(t),ui(t)分别表示跟随者i的状态、输出和控制输入向量;表示已知的第i个跟随者的固有非线性动力学方程;ai为跟随者i的动态矩阵;bi为跟随者i的控制输入矩阵;ci为跟随者i的输出矩阵;为xi(t)的一阶导。
[0018]
所述领导者动力学模型包括:
[0019][0020]
y0(t)=fx0(t)
[0021]
其中,x0(t),y0(t)分别表示领导者的状态和输出;d为领导者的动态矩阵;e为领导者的外部控制输入矩阵;f为领导者的输出矩阵;为x0(t)的一阶导。
[0022]
可选的,所述状态观测器的表达式为:
[0023][0024]
其中,其中,
[0025]
式中,ηi(t)代表第i个跟随者在t时刻对领导者状态x0(t)的估计值;为ηi(t)的一阶导;vec-1
表示向量到矩阵的逆变换;sign()为符号函数;t表示转置;γi>0;ξi(t)表示编队跟踪邻域误差;0<β<1;κ1,κ2,κ3,κ4分别表示正常数;0<β1<1,0<β2<1,0<β3<1,0<β4<1;<1;d0=vec(d),e0=vec(e),f0=vec(f);w
ij
表示第j个领导者到第i个跟随者之间的通信权重,如果存在通信路径,则w
ij
=1,否则w
ij
=0;w
i0
表示第i个跟随者与领导者之间的权重;d0,e0,f0分别表示领导者的状态矩阵d,e,f的向量形式;di(t),ei(t),fi(t),di分别表示第i个跟随者的
状态矩阵d,e,f和偏置d的估计值。
[0026]
可选的,所述跟随者的输出控制调节方程包括第一调节方程、第二调节方程和恢复解真实参数的方程;
[0027]
所述第一调节方程为:
[0028][0029]
其中,(xi,ui)为满足第一调节方程的解,xi是跟随者i的状态反馈增益矩阵,ui是跟随者i的输入反馈增益矩阵;
[0030]
第二调节方程为:
[0031]
0=b
iri-x
ie[0032]ri
为满足第二调节方程的解,ri为跟随者i的跟踪所需参考信号的反馈增益矩阵;
[0033]
恢复解真实参数的方程为:
[0034][0035]
其中,0<κ;0<φ<1;
[0036][0037]
可选的,所述额外变量的表达式为:
[0038][0039]
其中,为额外变量ζi(t)的一阶导;表示坐标变换;φi(t)满足hi(t)=ciφi(t);hi(t)是通过跟随者的状态向量进行线性变换得到的输出向量;k
0i
表示待设计的增益矩阵;0<β
1i
<νi;vi(t)表示编队跟踪补偿;q
1i
和q
2i
分别表示正定矩阵。
[0040]
可选的,所述跟随者的自适应有限时间输出时变编队控制协议的表达式为:
[0041]
ui(t)=k
2i
(t)ηi(t)+k
1i
(xi(t)-φi(t)-ζi(t))
‑‑di
(t)ri(t)gi(t)+vi(t)+k
0i
ζi(t)-fi(xi(t))
[0042]
其中,k
1i
,k
2i
(t)分别为待设计的两个增益矩阵,k
2i
(t)=ui(t)-k
1i
xi(t);
[0043]hi
(t)=q
1ibiri
(t)。
[0044]
本发明还提供一种多智能体系统的有限时间时变编队跟踪控制系统,其所述系统包括:
[0045]
动力学模型构建模块,用于建立异构非线性多智能体系统领导者和跟随者的动力学模型;
[0046]
状态观测器构建模块,用于基于所述动力学模型,构建具有未知输入的领导者的分布式有限时间状态观测器,并利用所述状态观测器估计领导者状态和领导者系统矩阵;
[0047]
自适应求解模块,用于基于所述状态观测器的观测结果,利用自适应算法对所述跟随者的输出控制调节方程进行求解,得出跟随者的反馈控制律;
[0048]
额外变量定义模块,用于引入一个额外变量;所述额外变量是在保证所述异构非线性多智能体系统在领导者未知输入的影响下实现有限时间输出时变编队控制的前提下提出的;
[0049]
时变编队控制协议构建模块,用于基于所述状态观测器的观测结果、所述跟随者的反馈控制律和所述额外变量设计所述跟随者的自适应有限时间输出时变编队控制协议;所述观测结果包括所述状态观测器估计领导者状态和领导者系统矩阵。
[0050]
根据本发明提供的具体实施例,本发明公开了以下技术效果:
[0051]
本发明提供一种多智能体系统的有限时间时变编队跟踪控制方法及系统,设计了分布式有限时间观测器,可估计影响下领导者状态和系统矩阵的信息领导者的未知输入。与现有有限时间观测器相比,删除了领导者的系统矩阵对所有跟随者可用的假设。开发了一种新的异构非线性多智能体系统分布式有限时间输出时变编队控制协议,克服了跟随器输入矩阵不满行秩的挑战,进一步拓展了有限时间编队跟踪控制的应用范围。提出了一种自适应算法求解智能体输出的调节方程,所提出的算法保证了在有限时间内可以得到方程的解,扩展了已有结果的指数收敛性到有限时间收敛。显然,基于分布式有限时间观测器、自适应算法求解智能体输出的调节方程以及时变编队控制协议,实现了针对异构非线性多智能体系统的有限时间一致性或编队跟踪控制。
附图说明
[0052]
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0053]
图1为本发明实施例1提供的未知输入的多智能体基于观测器的有限时间时变编队控制系统结构;
[0054]
图2为本发明实施例1提供的一种多智能体系统的有限时间时变编队跟踪控制方法流程图;
[0055]
图3为本发明实施例1提供的智能体之间的通信拓扑结构;
[0056]
图4为本发明实施例1提供的异构非线性控制系统在有限时间时变编队控制器作用下15秒内的快照;
[0057]
图5为本发明实施例1提供的编队跟踪误差曲线;
[0058]
图6为本发明实施例1提供的编队跟踪邻域误差曲线;
[0059]
图7为本发明实施例1提供的跟随者状态估计偏差曲线;
[0060]
图8为本发明实施例1提供的多智能体系统在本发明提出的方法和经典方法7秒内
的输出快照;
[0061]
图9本发明实施例1提供的两种不同控制协议下的输出编队跟踪的误差曲线。
具体实施方式
[0062]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0063]
本发明提供一种多智能体系统的有限时间时变编队跟踪控制方法及系统,旨在解决实际应用中包含不同种类智能体的多智能体系统面临编队随时间变化的需求,即异构多智能体系统的有限时间一致性或编队跟踪控制。
[0064]
为实现上述目的,本发明提供了一种基于邻近交互的分布式有限时间编队跟踪控制协议,最终目标是跟随者可跟踪领导者并在有限时间内实现期望的编队。为消除跟随者对领导者系统矩阵信息及其未知控制输入的需求,构造了一种有限时间观测器,以估计领导者的状态和系统矩阵,并补偿未知输入的影响;引入额外变量的坐标变换技术,提出了一种新颖的有限时间分布式输出时变编队控制器,消除了跟随者的输入矩阵需要在已有的结果中找到的广义逆假设;借助李雅普诺夫理论,证明了预期的有限时间输出时变编队控制器可以通过所考虑的异构非线性多智能体系统在有限时间内实现。最后,证明所提出控制协议的稳定性。
[0065]
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
[0066]
本实施例提供一种多智能体系统的有限时间时变编队跟踪控制方法,是一种基于邻近交互的分布式有限时间编队跟踪控制方法,控制系统设计示意图如图1所示,该系统分别为每个跟随者设计了两种新型分布式观测器,用于估计输入未知的领导者的动态矩阵和状态。借助引入额外变量的坐标变换技术,提出了一种基于构造观测器的新型有限时间时变编队控制器。为了确定构造控制器中的参数,提出了一种自适应求解智能体输出调节方程的算法。
[0067]
如图2所示,所述方法主要分成以下几个内容:
[0068]
s1:建立异构非线性多智能体系统领导者和跟随者的动力学模型。
[0069]
对于一般的异构非线性多智能体系统,第i个跟随者的动力学描述如下:
[0070][0071]
yi(t)=cixi(t),\*mergeformat(1)
[0072]
其中,i=1,2,...,n;n为跟随者的个数;分别表示跟随器i的状态、输出和控制输入向量,且rank(bi)=mi;(ai,bi)是稳定的,并且(ci,ai)是可检测的;表示已知的第i个跟随者的固有非线性动力学方程。ai为跟随者i的动态矩阵,定义了系统的动态行为;bi为跟随者i的控制输入矩阵,定义了控制输入如何影响系统的动态行为;ci为跟随者i的输出矩阵,定义了系
统的输出与状态之间的关系;为xi(t)的一阶导。
[0073]
领导者的动力学模型由下式给出:
[0074][0075]
其中,分别表示领导者的状态和输出,x0(t)是有界的;d为领导者的动态矩阵;e为领导者的外部控制输入矩阵;f为领导者的输出矩阵;为x0(t)的一阶导。(d,e)是可检测的,并且矩阵d,e,f的信息只能由包含作为邻居领导者的跟随者导出,即矩阵d、e、f的信息只能通过包含领导者邻居的跟随者来推导出来。在一个多智能体系统中,通常存在一个领导者和一些跟随者。跟随者可以通过与领导者之间的通信来获取领导者的状态信息,但是他们不能直接观察到领导者。因此,跟随者只能通过他们自己的状态信息以及从领导者邻居那里获得的信息来推断矩阵d、e、f的值。具体来说,矩阵d、e、f通常用于描述系统的拓扑结构,包括智能体之间的连接关系、通信方式等。由于跟随者无法直接观察到领导者,因此他们只能通过自己的邻居信息来推断出整个系统的拓扑结构,进而推导出矩阵d、e、f的信息。
[0076]
表示领导者的外部控制输入,其是连续的且有界的,即
[0077]
||u0(t)||
∞
<d\*mergeformat(3)
[0078]
其中,d是正常数,只有几个以领导者为邻居的追随者才可接收到。
[0079]
从(1)和(2)可以看出,上述动力学方程描述了具有领导者未知输入的异构非线性多智能体系统模型,其中每个智能体的动力学在非线性动力学、系统矩阵和状态维度方面是异构的。
[0080]
建立动力学模型后,后续所有的计算均是在该模型的基础上实现的。
[0081]
s2:基于所述动力学模型,构建具有未知输入的领导者的分布式有限时间状态观测器,并利用所述状态观测器估计领导者状态和领导者系统矩阵。
[0082]
由于领导者的状态不可能对所有跟随者都适用,因此有必要通过使用相邻智能体的相对信息来获取x0(t)来设计状态观测器。然而,构造分布式状态观测器观测器的困难在于,领导者的系统矩阵和未知控制输入(即d,e,f,d)的上状态观测器边界仅可用于跟随者的子集,这在许多实际系统中是普遍存在的问题。d是领导者的未知控制输入,u0为我们给领导者的控制输入,是已知的。观测器的设计就是在解决领导者状态不可观和系统矩阵不完全已知的问题,以实现tvft。
[0083]
为了确保异构非线性多智能体系统能够实现有限时间输出时变编队控制,构建以下观测器来估计领导者和领导者系统矩阵的状态:
[0084][0085][0086]
[0087][0088][0089]
式中,ηi(t)代表第i个跟随者在t时刻对领导者状态x0(t)的估计值;为ηi(t)的一阶导;vec-1
表示向量到矩阵的逆变换;di(t)和ei(t)加了横线表示的含义是将矩阵di(t)和ei(t)转换成向量形式,这是为了方便进行计算和处理;sign()为符号函数;t表示转置;γi>0;0<β<1;β为一个0到1的常数,为增长指数,用来调整函数的增长速率,以实现更快的收敛速度和更小的观测误差;κ1,κ2,κ3,κ4分别表示正常数;0<β1<1,0<β2<1,0<β3<1,0<β4<1;<1;d0=vec(d),e0=vec(e),f0=vec(f);w
ij
表示第j个领导者到第i个跟随者之间的通信权重,如果存在通信路径,则w
ij
=1,否则w
ij
=0;w
i0
表示第i个跟随者与领导者之间的权重;d0,e0,f0分别表示领导者的状态矩阵d,e,f的向量形式;di(t),ei(t),fi(t),di分别表示第i个跟随者的状态矩阵d,e,f和偏置d的估计值。ξi(t)表示形成跟踪邻域误差,是一个向量;ξi(t)的形式描述如下:
[0090][0091]di
(t),ei(t),fi(t),di(t)是为了估计d0,e0,f0,d而构造的;(角标为i的参数表示第i个观测器中的状态变量,角标为0的参数则是系统中的未知参数,即要估计的领导者的系统矩阵,需要通过构造的观测器(角标为i的参数)估计出来);
[0092]
下面给出的是每个观测器的估计误差,用于评估观测的效果。
[0093]
令然后,根据公式(2)和公式(4),有
[0094][0095]
其中
[0096]
令则系统(10)可得:
[0097][0098]
其中γ=diag{γ1,γ2,
…
,γn}。
[0099]
公式(4)为观测器表达式,公式(10)为每个观测器的估计误差,用于评估观测的效
果,公式(11)将每个观测器的观测结果融合,进行最优估计。
[0100]
对于多智能体系统的拓扑图若存在一棵以领导者为根的生成树,则跟随者之间的拓扑结构是无向的,那么对于图我们可以推导出如下拉普拉斯矩阵l:
[0101][0102]
由上述规定,可以验证di(t),ei(t),fi(t)和di(t)可以在固定时间t1估计d0,e0,f0,d,并且分布式观测器(4)可以在有限时间t
*
内收敛到领导者状态,即由此验证了di(t),ei(t),fi(t)和di(t)可以在固定时间t1内估计d0,e0,f0,d,并且ηi(t)可以收敛到有限时间t
*
(0<t
*
)内具有未知的控制输入的领导者的状态(即x0(t))。
[0103]
s3:基于所述状态观测器的观测结果,利用自适应算法对所述跟随者的输出控制调节方程进行求解,得出跟随者的反馈控制律。
[0104]
为了克服状态维度和系统矩阵之间耦合的困难,对所考虑的系统提出了以下标准。
[0105]
对于跟随者i,我们可以找到满足以下调节器方程(第一调节方程)的解(xi,ui):
[0106][0107]
对于跟随者i,我们总能找到一个解ri满足如下调节器方程(第二调节方程):
[0108]
0=b
iri-xie,\*mergeformat(13)
[0109]
其中,0<κ;0<φ<1;
[0110]
公式(12)和(13)是在多智能体系统输出调节控制的情况下做出的假设。在这种情况下,目标是设计一种控制策略,使跟随者的输出在未知干扰和系统不确定性的情况下渐近地跟踪所需的参考信号。
[0111]
调节方程(12)和(13)是需要解决的方程,以实现输出调节控制。解(xi,ui)和ri表示第i个跟随者的反馈控制律,其中xi是状态反馈增益矩阵,ui是输入反馈增益矩阵,ri是参考信号反馈增益矩阵。
[0112]
调节方程的可解性条件基于矩阵的秩等于ni+p,该矩阵取决于系统矩阵ai,bi和ci,以及未知矩阵d。然而,由于跟随者无法得知矩阵d,因此无法直接检查可解性条件。
[0113]
为解决这个问题,采用一种自适应方法,在线估计跟随者可以使用可用的测量数据来估计未知矩阵d。基于这些估计值,跟随者可以自适应地解决调节方程,以获得所需的反馈控制律。因此,自适应算法用于实时估计未知矩阵d并解决调节方程(12)和(13),从而使跟随者能够在系统不确定性的情况下实现输出调节控制。
[0114]
上述规定是所考虑系统的输出调节控制的两个必要条件。如果对所有都成立,则调节器方程(12)和(13)分别是可解的其中表示d的频谱。但是矩阵d,e,f并非对所有跟随者都可用。也就是说,不
能直接检查调节器方程(12)。受自适应方法和之前工作的启发,估计矩阵di(t),ei(t),fi(t)可自适应地用于求解方程(12)和(13)。
[0115]
因此,在(12)和(13)的前提下,对于任意初始值有以下等式(恢复解真实参数的方程):
[0116][0117]
其中,
[0118]
这两个矩阵是用来构造跟随者i的状态估计误差的。
[0119]
第一个矩阵中,是ni×
ni的单位矩阵,表示跟随者i的状态矩阵xi的前ni个分量是可以被准确估计的。而矩阵的后两个分量都是零,表示跟随者i的状态矩阵xi的后面的分量是无法被准确估计的。这个矩阵的作用是在估计跟随者i的状态时,只考虑可以被准确估计的分量,而忽略无法被准确估计的分量,从而提高状态估计的精度。
[0120]
第二个矩阵中ai,bi,ci是第i个跟随者的状态矩阵,n
i mi分别表示第i个跟随者的状态维数和输入维数。这个矩阵的作用是在估计跟随者i的状态时,将跟随者的状态矩阵xi,ui,ri的估计误差与领导者的状态矩阵e,f的估计误差联系起来,从而实现分布式状态估计。具体来说,这个矩阵将跟随者i的状态矩阵xi的估计误差与领导者的状态矩阵e的估计误差联系起来,将跟随者i的输入矩阵ui的估计误差与领导者的状态矩阵f的估计误差联系起来,将跟随者i的扰动矩阵ri的估计误差与领导者的状态矩阵b的估计误差联系起来。这样,通过领导者的状态估计误差,就可以实现对跟随者的状态估计。
[0121]
是领导节点的状态矩阵d的转置;表示kronecker积。
[0122]
有唯一的有界解这样在有限时间t
*
内满足系统标准。
[0123]
→
表示将左边的变量或者表达式转化为右边的变量或者表达式。在这个公式中,是第i个跟随者的状态向量的估计值,表示将跟随者i的状态向量xi,输入向量ui和扰动向量ri按照列向量的形式排列起来,然后将它们转化为一个列向量。因此,
的含义是将第i个跟随者的状态向量的估计值转化为一个列向量,其中列向量的元素是跟随者i的状态向量xi,输入向量ui和扰动向量ri的元素。
[0124]
此外,如果其中则认为在有限时间t
*
内有
[0125]
和分别表示跟随者i的状态向量xi,输入向量ui和扰动向量ri的估计值。
[0126]
表示将跟随者i的状态向量的估计值转化为真实的状态向量xi。
[0127]
表示将跟随者i的输入向量的估计值转化为真实的输入向量ui。
[0128]
表示将跟随者i的扰动向量的估计值转化为真实的扰动向量ri。这些转化的目的是为了在分布式状态估计中,将跟随者的状态向量、输入向量和扰动向量的估计误差转化为真实的状态向量、输入向量和扰动向量,从而提高状态估计的精度。
[0129]
公式(14)是建立在公式(12)和(13)的假设下推理得来的,将证明步骤在后续内容进行介绍,大致而言,它利用了向量的结构,并将其拆分为矩阵xi,ui和ri的向量化表示。因此,通过应用向量化的逆操作vec^{-1},可以恢复出这些矩阵的值。最终,公式14提供了一种从向量中恢复真实参数xi,ui和ri的方法。
[0130]
公式14的证明:调节器方程(12)可以表示为:
[0131][0132]
对上面的方程进行变换:
[0133]
πiθi=bi,
[0134]
其中,
[0135][0136][0137]
根据公式(12)和公式(13),对于跟随者i,第一个方程有解对(xi,ui,ri)。因此,
根据之前的工作(j.huang,“nonlinear output regulation:theory and applications,”philadelphia,pa,usa:siam,2004),方程(14)有一个唯一的有界解满足在有限时间t
*
内。
[0138]
s4:引入一个额外变量;所述额外变量是在保证所述异构非线性多智能体系统在领导者未知输入的影响下实现有限时间输出时变编队控制的前提下提出的。
[0139]
为了保证所考虑的系统能够在领导者未知输入的影响下实现有限时间输出时变编队控制,引入一个额外的变量ζi(t)(i=1,2,
…
,n)如下:
[0140][0141]
其中,为额外变量ζi(t)的一阶导;表示坐标变换,满足hi(t)=ciφi(t)和k
0i
表示待设计的增益矩阵;q
1i
和q
2i
分别表示正定矩阵,0<β
1i
<νi。
[0142]hi
(t)是通过跟随者的状态向量进行线性变换得到的输出向量,ci是一个系数矩阵,φi(t)是一个待求解的向量,用于满足hi(t)=ciφi(t)。
[0143]
νi是编队跟踪补偿中的一个控制参数,用于控制状态误差的收敛速度。当νi越大时,状态误差的收敛速度越快。
[0144]
s5:基于所述状态观测器的观测结果、所述跟随者的反馈控制律和所述额外变量设计所述跟随者的自适应有限时间输出时变编队控制协议;所述观测结果包括所述状态观测器估计领导者状态和领导者系统矩阵。
[0145]
在分布式自适应观测器(4)和附加变量(15)的基础上,设计了自适应有限时间输出时变编队控制协议如下:
[0146][0147]
其中,表示编队跟踪补偿,由期望的时变编队信息决定,k
1i
,k
2i
(t)分别为待设计的两个增益矩阵,k
2i
(t)=ui(t)-k
1i
xi(t);gi(t)设计如下,以抑制领导者未知输入的影响:
[0148][0149]
和hi(t)=q
1ibiri
(t)。
[0150]
定义根据公式(1)(2)和公式(15)(16),有
[0151][0152]
对于第i个跟随者,有限时间输出时变编队控制协议(16)可以通过以下步骤确定:
[0153]
(1):考虑由向量hi(t)指定的时变编队。对于满足hi(t)=ciφi(t)的φi(t),检查以下有限时间输出时变编队可行性条件(19):
[0154][0155]
如果满足可行条件,则继续;否则无法在有限时间输出时变编队控制协议(16)下找到所需的φi(t)并停止。
[0156]
(2):表示编队跟踪补偿的vi(t)由下式给出:
[0157][0158]
其中vi(t)在有限时间输出控制协议(16)中定义。
[0159]
(3):k
1i
,k
0i
分别设计成ai+b
ik1i
和ai+b
ik0i
。从以下条件求解正定矩阵
[0160][0161]
由此可保证有限时间输出时变编队可以通过所考虑的系统(1)在由构造的自适应控制器(16)下实现。
[0162]
下面是本实施提供的方法的仿真算例
[0163]
考虑一种由5个智能体组成的异构非线性多智能体系统。智能体之间的通信拓扑结构如图3所示。根据图3所示的交互拓扑图和式(9)中的定义,可得w
ik
(k=0,1,
…
,4)。跟随者和领导者的动态由多智能体系统(1)和(2)描述,其中者和领导者的动态由多智能体系统(1)和(2)描述,其中者和领导者的动态由多智能体系统(1)和(2)描述,其中
[0164]
领导者的控制输入为u0(t)=[0.1cos(4t),0.1sin(4t)]
t
。此外,跟随者的输出有望实现时变编队跟踪,由下式给出:
[0165]
[0166]
其中i=1,2,3,4。
[0167]
根据有限时间输出时变编队控制器的设计步骤,存在φi(t)(i=1,2,3,4)满足可行条件(19),并且φi(t)可以通过φ1(t)=[3cos(2t),3sin(2t)]
t
φ2(t)=[3cos(2t+π/2),-6sin(2t+π/2),3sin(2t+π/2),6cos(2t+π/2)]
t
,φ3(t)=[3cos(2t+π),-6sin(2t+π),3sin(2t+π),6cos(2t+π)]
t
,φ4(t)=[3cos(2t+3π/2),-6sin(2t+3π/2),-12cos(2t+3π/2),3sin(2t+3π/2),6cos(2t+3π/2),-12sin(2t+3π/2)]
t
求得。鉴于编队跟踪补偿(20),可以到得v1(t)=[-6sin(2t),6cos(2t)]
t
,v2(t)=[-12cos(2t+π/2),-12sin(2t+π/2)]
t
,v3(t)=[-6sin(2t+π)-9cos(2t+π),-9sin(2t+π)+6cos(2t+π/2)]
t
,v4(t)=[0,12sin(2t+3π/2)+6cos(2t+3π/2),0,6sin(2t+3π/2)-12cos(2t+3π/2)]
t
。
[0168]
借助matlab可得增益矩阵k
1i
(i=1,2,3,4),其中k
01
=k
11
=[-3
ꢀ‑
6],6],q
11
=q
21
=2i2,
[0169]
在有限时间输出时变编队控制协议(16)中。xi(t),x0(t),ηi(t),ζi(t)的初值由-2到2之间的随机数t生成。
[0170]
情况1:非线性系统描述为:
[0171][0172][0173][0174][0175]
根据步骤s5,有限时间输出时变编队由构造的自适应控制器(16)下的考虑系统实现。图4-7显示了模拟的结果。
[0176]
情况2:如果多智能体系统(1)中的fi(xi(t))=0,则本发明提出的方法也可以应用于研究异构线性多智能体系统的有限时间输出时变编队跟踪。为了更好地展示本方法的优点,与基于观测器的经典时变编队控制方法进行对比仿真,其中时变编队控制器用以下形式描述:
[0177]
ui(t)=k
2i
ηi(t)+k
1i
(xi(t)-φi(t))+vi(t)
[0178]
为了保证除控制算法以外的因素相同,不考虑非线性函数和领队未知输入的影响,我们设计的有限时间时变编队跟踪控制器重构为以下形式:
[0179]
ui(t)=k
2i
(t)ηi(t)+k
1i
(xi(t)-φi(t)-ζi(t))+vi(t)+k
0i
ζi(t)
[0180]
图8分别使用本发明提出的方法和经典方法表示了智能体在7秒内的输出快照,其中四个跟随者用正方形表示,领导者用菱形表示,两种输出编队跟踪误差||e
yi
(t)||(i=1,2,3,4)的变化过程如图9所示。
[0181]
本发明的优点在于:
[0182]
(1)设计的分布式有限时间观测器,可估计影响下领导者状态和系统矩阵的信息领导者的未知输入。与现有有限时间观测器相比,删除了领导者的系统矩阵对所有跟随者可用的假设。
[0183]
(2)开发了一种新的异构非线性多智能体系统分布式有限时间输出时变编队控制协议,克服了跟随器输入矩阵不满行秩的挑战,进一步拓展了有限时间编队跟踪控制的应用范围。
[0184]
(3)提出了一种自适应算法求解智能体输出的调节方程,所提出的算法保证了在有限时间内可以得到方程的解,扩展了已有结果的指数收敛性到有限时间收敛。
[0185]
实施例2
[0186]
本实施例提供一种多智能体系统的有限时间时变编队跟踪控制系统,其所述系统包括:
[0187]
动力学模型构建模块,用于建立异构非线性多智能体系统领导者和跟随者的动力学模型。
[0188]
状态观测器构建模块,用于基于所述动力学模型,构建具有未知输入的领导者的分布式有限时间状态观测器,并利用所述状态观测器估计领导者状态和领导者系统矩阵。
[0189]
自适应求解模块,用于基于所述状态观测器的观测结果,利用自适应算法对所述跟随者的输出控制调节方程进行求解,得出跟随者的反馈控制律。
[0190]
额外变量定义模块,用于引入一个额外变量;所述额外变量是在保证所述异构非线性多智能体系统在领导者未知输入的影响下实现有限时间输出时变编队控制的前提下提出的。
[0191]
时变编队控制协议构建模块,用于基于所述状态观测器的观测结果、所述跟随者的反馈控制律和所述额外变量设计所述跟随者的自适应有限时间输出时变编队控制协议;所述观测结果包括所述状态观测器估计领导者状态和领导者系统矩阵。
[0192]
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
[0193]
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。
技术特征:
1.一种多智能体系统的有限时间时变编队跟踪控制方法,其特征在于,所述方法包括:建立异构非线性多智能体系统领导者和跟随者的动力学模型;基于所述动力学模型,构建具有未知输入的领导者的分布式有限时间状态观测器,并利用所述状态观测器估计领导者状态和领导者系统矩阵;基于所述状态观测器的观测结果,利用自适应算法对所述跟随者的输出控制调节方程进行求解,得出跟随者的反馈控制律;引入一个额外变量;所述额外变量是在保证所述异构非线性多智能体系统在领导者未知输入的影响下实现有限时间输出时变编队控制的前提下提出的;基于所述状态观测器的观测结果、所述跟随者的反馈控制律和所述额外变量设计所述跟随者的自适应有限时间输出时变编队控制协议;所述观测结果包括所述状态观测器估计领导者状态和领导者系统矩阵。2.根据权利要求1所述的方法,其特征在于,所述动力学模型包括跟随者动力学模型和领导者动力学模型;所述跟随者动力学模型包括:y
i
(t)=c
i
x
i
(t),其中,i=1,2,...,n;n为跟随者的个数;x
i
(t),y
i
(t),u
i
(t)分别表示跟随者i的状态、输出和控制输入向量;表示已知的第i个跟随者的固有非线性动力学方程;a
i
为跟随者i的动态矩阵;b
i
为跟随者i的控制输入矩阵;c
i
为跟随者i的输出矩阵;为x
i
(t)的一阶导。所述领导者动力学模型包括:y0(t)=fx0(t)其中,x0(t),y0(t)分别表示领导者的状态和输出;d为领导者的动态矩阵;e为领导者的外部控制输入矩阵;f为领导者的输出矩阵;为x0(t)的一阶导。3.根据权利要求2所述的方法,其特征在于,所述状态观测器的表达式为:其中,其中,式中,η
i
(t)代表第i个跟随者在t时刻对领导者状态x0(t)的估计值;为η
i
(t)的一阶导;vec-1
表示向量到矩阵的逆变换;sign()为符号函数;t表示转置;γ
i
>0;ξ
i
(t)表示编队跟踪邻域误差;0<β<1;κ1,κ2,κ3,κ4分别表示正常数;0<β1<1,0<β2<1,0<β3<1,0<β4<1;
d0=vec(d),e0=vec(e),f0=vec(f);w
ij
表示第j个领导者到第i个跟随者之间的通信权重,如果存在通信路径,则w
ij
=1,否则w
ij
=0;w
i0
表示第i个跟随者与领导者之间的权重;d0,e0,f0分别表示领导者的状态矩阵d,e,f的向量形式;d
i
(t),e
i
(t),f
i
(t),d
i
分别表示第i个跟随者的状态矩阵d,e,f和偏置d的估计值。4.根据权利要求3所述的方法,其特征在于,所述跟随者的输出控制调节方程包括第一调节方程、第二调节方程和恢复解真实参数的方程;所述第一调节方程为:其中,(x
i
,u
i
)为满足第一调节方程的解,xi是跟随者i的状态反馈增益矩阵,u
i
是跟随者i的输入反馈增益矩阵;第二调节方程为:0=b
i
r
i-x
i
er
i
为满足第二调节方程的解,r
i
为跟随者i的跟踪所需参考信号的反馈增益矩阵;恢复解真实参数的方程为:其中,0<κ;0<φ<1;其中,0<κ;0<φ<1;5.根据权利要求4所述的方法,其特征在于,所述额外变量的表达式为:其中,为额外变量ζ
i
(t)的一阶导;表示坐标变换;φ
i
(t)满足h
i
(t)=c
i
φ
i
(t);h
i
(t)是通过跟随者的状态向量进行线性变换得到的输出向量;k
0i
表示待设计的增益矩阵;0<β
1i
<ν
i
;v
i
(t)表示编队跟踪补偿;q
1i
和q
2i
分别表示正定矩阵。6.根据权利要求5所述的方法,其特征在于,所述跟随者的自适应有限时间输出时变编队控制协议的表达式为:u
i
(t)=k
2i
(t)η
i
(t)+k
1i
(x
i
(t)-φ
i
(t)-ζ
i
(t))
‑‑
d
i
(t)r
i
(t)g
i
(t)+v
i
(t)+k
0i
ζ
i
(t)-f
i
(x
i
(t))其中,k
1i
,k
2i
(t)分别为待设计的两个增益矩阵,k
2i
(t)=u
i
(t)-k
1i
x
i
(t);
h
i
(t)=q
1i
b
i
r
i
(t)。7.一种多智能体系统的有限时间时变编队跟踪控制系统,其特征在于,所述系统包括:动力学模型构建模块,用于建立异构非线性多智能体系统领导者和跟随者的动力学模型;状态观测器构建模块,用于基于所述动力学模型,构建具有未知输入的领导者的分布式有限时间状态观测器,并利用所述状态观测器估计领导者状态和领导者系统矩阵;自适应求解模块,用于基于所述状态观测器的观测结果,利用自适应算法对所述跟随者的输出控制调节方程进行求解,得出跟随者的反馈控制律;额外变量定义模块,用于引入一个额外变量;所述额外变量是在保证所述异构非线性多智能体系统在领导者未知输入的影响下实现有限时间输出时变编队控制的前提下提出的;时变编队控制协议构建模块,用于基于所述状态观测器的观测结果、所述跟随者的反馈控制律和所述额外变量设计所述跟随者的自适应有限时间输出时变编队控制协议;所述观测结果包括所述状态观测器估计领导者状态和领导者系统矩阵。
技术总结
本发明公开一种多智能体系统的有限时间时变编队跟踪控制方法及系统,涉及智能体系统时变编队跟踪控制领域,方法包括:建立异构非线性多智能体系统领导者和跟随者的动力学模型;构建具有未知输入的领导者的分布式有限时间状态观测器;利用自适应算法对所述跟随者的输出控制调节方程进行求解,得出跟随者的反馈控制律;在保证异构非线性多智能体系统在领导者未知输入的影响下实现有限时间输出时变编队控制的前提下引入一个额外变量;基于状态观测器、跟随者的反馈控制律和额外变量设计跟随者的时变编队控制协议。基于本发明的方案实现了针对异构非线性多智能体系统的有限时间一致性或编队跟踪控制。致性或编队跟踪控制。致性或编队跟踪控制。
技术研发人员:董希旺 王庆 孔祥锡 化永朝 于江龙 任章 李清东
受保护的技术使用者:北京航空航天大学
技术研发日:2023.04.21
技术公布日:2023/7/25
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
