一种基于偏差校正的多智能体协同跟踪控制系统及方法
未命名
08-15
阅读:136
评论:0
1.本发明涉及工程控制领域,特别是涉及一种基于偏差校正的多智能体协同跟踪控制系统及方法。
背景技术:
2.自然界有很多有趣的生物现象,比如大雁的排队列飞行、蚁群的聚集和鱼群的移动等,虽然这些行为看似简单,但是它们具有一种整体的特性,能够通过个体的相互合作完成一些复杂任务。受此启发,越来越多的研究人员对此进行了深入地研究。在这种背景下,多智能体系统应运而生。
3.近年来,多智能体系统在各个领域的应用成倍增加,从制造业和电气工程到军事应用和现代医疗行业。同时,随着网络技术的飞速发展和各类系统规模的不断扩大,智能体之间需要通过网络彼此通信来协同完成既定目标,即网络化多智能体系统协同控制,由于其独特的优势,网络化多智能体系统的协同控制被应用到各个领域,如无人机编队、智能电网和多传感器网络等。
4.然而,由于通信网络的引入,网络化多智能体系统中不可避免地存在随机网络诱导时延、数据包乱序与丢失等通信约束问题,包括多智能体之间的通信约束以及每个智能体内部反馈通道和前馈通道的通信约束,这些通信约束不仅会影响系统的控制性能,更严重的甚至会破坏系统的稳定性。
5.目前,解决网络化多智能体系统协同输出跟踪控制问题的方法主要存在以下不足:1)实际应用中大多数智能体系统的状态是不可直接测量的,而现有方法中一般假设状态直接可测;2)实际通信中产生的网络诱导时延、数据包乱序与丢失均具有较强的随机性,且大多时候远远小于其上界值,而现有方法将其统一处理为固定时延具有较强的保守性;3)对于多智能体之间的通信约束以及每个智能体内部反馈通道和前馈通道的通信约束,采用现有办法不能完全解决。
6.由于上述局限,大大限制了现有网络化多智能体主从式协同输出跟踪控制方法在实际工程中的应用和推广,因此,网络化多智能体系统的控制性能和系统的稳定性仍有待提升。
技术实现要素:
7.基于此,本发明实施例提供一种基于偏差校正的多智能体协同跟踪控制系统及方法,以提高多智能体系统的控制性能,从而提升系统的稳定性。
8.为实现上述目的,本发明实施例提供了如下方案:
9.一种基于偏差校正的多智能体协同跟踪控制系统,包括:多个控制模块,一个控制模块连接一个智能体;
10.对于第i个智能体,第i个控制模块,包括:依次连接的数据缓存器、双预测发生器、控制预测器和时延补偿器;所述数据缓存器和所述时延补偿器均与第i个智能体连接;
11.第i个控制模块中的所述数据缓存器,用于:
12.获取并缓存第i个智能体的输出数据包;所述输出数据包,包括传感器输出的数据序列和对应的时间戳;
13.将第i个智能体的输出数据包发送至第i个控制模块中的所述双预测发生器中;
14.第i个控制模块中的所述双预测发生器,用于:
15.根据第i个智能体的输出数据包、系统参考输入信号、历史控制量和随机网络时延,采用预测控制方法计算预测量;所述随机网络时延,包括:智能体的反馈通道的随机网络时延、智能体的前馈通道的随机网络时延和智能体之间的随机网络时延;
16.将预测量分为自身控制预测量和输出预测量,将所述自身控制预测量发送至第i个控制模块中的控制预测器,将所述输出预测量发送至其他控制模块中的控制预测器;所述其他控制模块,包括:与多智能体系统中除第i个智能体之外的智能体连接的控制模块;
17.第i个控制模块中的所述控制预测器,用于:
18.获取其他控制模块发送的输出预测量;
19.根据第i个控制模块中的所述双预测发生器发送的自身控制预测量和其他控制模块发送的输出预测量,计算第i个智能体的控制包,并将所述控制包发送至第i个控制模块中的所述时延补偿器中;所述控制包,包括:控制序列和对应的时间戳;
20.第i个控制模块中的所述时延补偿器,用于:
21.根据智能体的前馈通道的随机网络时延和所述控制包中的时间戳,从控制序列中选取合适的控制量施加到第i个智能体上。
22.本发明还提供了一种基于偏差校正的多智能体协同跟踪控制方法,包括:
23.获取并缓存第i个智能体的输出数据包;所述输出数据包,包括传感器输出的数据序列和对应的时间戳;
24.根据第i个智能体的输出数据包、系统参考输入信号、历史控制量和随机网络时延,采用预测控制方法计算预测量,并将预测量分为自身控制预测量和输出预测量;所述随机网络时延,包括:智能体的反馈通道的随机网络时延、智能体的前馈通道的随机网络时延和智能体之间的随机网络时延;
25.获取其他智能体的输出预测量;所述其智能体为多智能体系统中除第i个智能体之外的智能体;
26.根据第i个智能体的自身控制预测量和其他智能体的输出预测量,计算第i个智能体的控制包;所述控制包,包括:控制序列和对应的时间戳;
27.根据智能体的前馈通道的随机网络时延和所述控制包中的时间戳,从控制序列中选取相应的控制量施加到第i个智能体上。
28.根据本发明提供的具体实施例,本发明公开了以下技术效果:
29.本发明实施例提出了一种基于偏差校正的多智能体协同跟踪控制系统及方法,将通信网络产生的随机网络诱导时延、数据包乱序与丢失统一处理为随机网络时延,为了主动补偿智能体之间和每个智能体反馈通道和前馈通道存在的随机网络时延,设计多智能体协同跟踪控制系统,包括:数据缓存器、双预测发生器、控制预测器和时延补偿器,本发明实施例同时考虑了智能体之间的通信约束以及每个智能体内部反馈通道和前馈通道的通信约束,这些通信约束问题都会被主动补偿,能提高多智能体系统的控制性能,从而提升系统
的稳定性。
附图说明
30.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
31.图1为本发明实施例提供的基于偏差校正的多智能体协同跟踪控制系统的结构示意图;
32.图2为主智能体1、从智能体2和从智能体3反馈通道、前馈通道以及智能体之间的随机网络时延示意图;
33.图3为网络化多智能体系统在随机网络时延下无补偿效果图;
34.图4为网络化多智能体系统在随机网络时延下无协同效果图;
35.图5为网络化多智能体系统在随机网络时延下有协同无校正效果图;
36.图6为网络化多智能体系统在随机网络时延下有协同有校正效果图;
37.图7为本发明实施例提供的基于偏差校正的多智能体协同跟踪控制方法的流程图。
具体实施方式
38.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
39.为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
40.实施例一
41.参见图1,本实施例的基于偏差校正的多智能体协同跟踪控制系统,包括:多个控制模块,一个控制模块连接一个智能体。
42.对于第i个智能体,第i个控制模块,包括:依次连接的数据缓存器、双预测发生器、控制预测器和时延补偿器;所述数据缓存器和所述时延补偿器均与第i个智能体连接。
43.第i个控制模块中的所述数据缓存器,用于:获取并缓存第i个智能体的输出数据包;所述输出数据包,包括传感器输出的数据序列和对应的时间戳;将第i个智能体的输出数据包发送至第i个控制模块中的所述双预测发生器中。
44.第i个控制模块中的所述双预测发生器,用于:根据第i个智能体的输出数据包、系统参考输入信号、历史控制量和随机网络时延,采用预测控制方法计算预测量;所述随机网络时延,包括:智能体的反馈通道的随机网络时延、智能体的前馈通道的随机网络时延和智能体之间的随机网络时延;将预测量分为自身控制预测量和输出预测量,将所述自身控制预测量发送至第i个控制模块中的控制预测器,将所述输出预测量发送至其他控制模块中的控制预测器;所述其他控制模块,包括:与多智能体系统中除第i个智能体之外的智能体
连接的控制模块。
45.第i个控制模块中的所述控制预测器,用于:获取其他控制模块发送的输出预测量;根据第i个控制模块中的所述双预测发生器发送的自身控制预测量和其他控制模块发送的输出预测量,计算第i个智能体的控制包,并将所述控制包发送至第i个控制模块中的所述时延补偿器中;所述控制包,包括:控制序列和对应的时间戳。
46.第i个控制模块中的所述时延补偿器,用于:根据智能体的前馈通道的随机网络时延和所述控制包中的时间戳,从控制序列中选取相应的控制量施加到第i个智能体上。
47.在一个示例中,第i个控制模块中的所述双预测发生器,具体包括:
48.数据缓冲器,用于:比较第i个智能体的输出数据包中的时间戳,得到比较结果。
49.状态观测器,与所述数据缓冲器连接,用于:根据所述比较结果、第i个智能体的传感器输出的数据序列、系统参考输入信号、历史控制量和随机网络时延,得到状态估计值,基于所述状态估计量采用预测控制方法计算预测量;将预测量分为自身控制预测量和输出预测量,将所述自身控制预测量发送至第i个控制模块中的控制预测器,将所述输出预测量发送至其他控制模块中的控制预测器。
50.在一个示例中,所述状态观测器,在根据所述比较结果、第i个智能体的传感器输出的数据序列、系统参考输入信号、历史控制量和随机网络时延,得到状态估计量,基于所述状态估计量采用预测控制方法计算预测量的方面,具体用于:若所述比较结果为当前时刻的时间戳小于上一时刻的时间戳,则根据第i个智能体的传感器在上一时刻输出的数据、系统参考输入信号、历史控制量和随机网络时延,计算当前时刻的状态估计量。若所述比较结果为当前时刻的时间戳大于或等于上一时刻的时间戳,则将上一时刻的状态估计量作为当前时刻的状态估计量。基于所述状态估计量采用预测控制方法计算预测量。
51.在一个示例中,第i个控制模块中的所述双预测发生器中自身控制预测量为:
[0052][0053]
其中,t表示时刻;表示第i个智能体的反馈通道的随机网络时延;表示主智能体的反馈通道在时刻的随机网络时延;表示智能体之间的随机网络时延;σi为正整数;为正整数;表示第i个智能体的前馈通道随机网络时延;表示第i个智能体前馈通道的随机网络时延的最大值;表示所有智能体的前馈通道随机网络时延最大值中的上限值;表示基于时刻得到的时刻增广状态的预测值;表示基于时刻得到的时刻增广状态的预测值;表示第i个智能体在时刻控制量的增量值;表示第i个智能体参考输入的预测值;a
e,i
、b
e,i
和ee表示增广系统的系统矩阵。
[0054]
第i个控制模块中的所述双预测发生器中输出预测量为:
[0055][0056]
其中,其中,表示智能体之间随机网络时延的最大值;νi为正整数;表示基于时刻得到的时刻增广状态的预测值;表示基于时刻得到的时刻增广状态的预测值;表示第i个智能体在时刻虚拟控制量的增量值;表示第i个智能体在时刻的偏差校正值;表示第i个智能体参考输入的预测值;表示校正参数矩阵。
[0057]
在一个示例中,第i个控制模块中的所述控制预测器,在根据第i个控制模块中的所述双预测发生器发送的自身控制预测量和其他控制模块发送的输出预测量,计算第i个智能体的控制包方面,具体用于:
[0058]
根据第i个控制模块中的所述双预测发生器发送的自身控制预测量和其他控制模块发送的输出预测量,计算控制增量;根据控制增量计算控制信号;根据各个时刻的控制信号确定第i个智能体的控制序列;由第i个智能体的控制序列和对应的时间戳,确定第i个智能体的控制包。
[0059]
在一个示例中,所述控制增量的计算公式为:
[0060][0061]
其中,表示第i个智能体在时刻的控制增量;t表示时刻;n表示多智能体系统中智能体的数量;表示所有智能体的前馈通道的随机网络时延的最大值的上限值;表示第i个智能体的反馈通道的随机网络时延;表示第i个智能体的控制器增益矩阵;表示第i个智能体的协同参数矩阵;di和dj均表示常值矩阵;ci表示输出矩阵;i表示单位矩阵;表示第i个智能体基于时刻得到的时刻增广状态的预测值;表示第j个智能体基于时刻得到的时刻增广状态的预测值;a
i,j
表示第i个智能体是否能够从第j个智能体接收到输出预测量;若第i个智能体能够从第j个智能体接收到输出预
测量,则a
i,j
=1,否则a
i,j
=0。
[0062]
所述控制信号的计算公式为其中,表示第i个智能体在时刻的控制信号;表示第i个智能体在时刻的控制信号。
[0063]
所述控制序列的计算公式为其中,表示第i个智能体在时刻的控制序列;ui(t)表示第i个智能体在时刻t的控制信号;ui(t+1)表示第i个智能体在时刻t+1的控制信号;t表示转置。
[0064]
下面给出一个在实际应用中的具体实施例,针对网络化多智能体主从式协同输出跟踪控制问题,充分利用通信网络的“包传输”特性,对上述基于偏差校正的多智能体协同跟踪控制系统进行进一步详细介绍。
[0065]
该多智能体协同跟踪控制系统,主动补偿智能体之间和每个智能体反馈通道和前馈通道存在的随机网络诱导时延、数据包乱序与丢失。
[0066]
在具体实施例中,通信网络产生的随机网络诱导时延、数据包乱序与丢失被统一处理为随机网络时延。为了主动补偿智能体之间和每个智能体反馈通道和前馈通道存在的随机网络时延,本具体实施例的多智能体协同跟踪控制系统主要包括数据缓存器、双预测发生器、控制预测器和时延补偿器。
[0067]
数据缓存器模块设置在每个智能体传感器中,缓存被控对象的输出数据,并将其与时间戳打包发往自身的控制器。
[0068]
双预测发生器模块在每个智能体控制预测器之前,利用来自传感器的反馈数据(即被控对象的输出数据及其时间戳)、系统参考输入信号和双预测发生器中保存的历史控制量,根据随机网络时延,采用预测控制方法,计算出预测值,将一部分发往自身的控制预测器,另一部分发往其它智能体的控制预测器中。
[0069]
控制预测器利用自身双预测发生器传送过来的预测值以及其它智能体发送过来的预测值来计算控制量,然后将所得一系列控制量和时间戳一起打包发往时延补偿器中。
[0070]
时延补偿器设置在执行器中,在每个采样时刻接收到来自于控制预测器的控制预测序列,根据前馈通道的随机网络时延选取合适的控制量应用到被控对象上。
[0071]
具体如下:
[0072]
在网络化多智能体系统中,智能体之间的拓扑结构通常被建模为有向图f=(χ,ψ,ω),其中智能体的集合可表示为χ={1,2,
…
,n},n表示多智能体系统中智能体的数量,智能体之间的通信通道可表示为ψ∈(ψ
ij
,i,j=1,2,
…
,n,i≠j),ψ
ij
表示第i个智能体与第j个智能体之间的通信通道,f的非负邻接矩阵可表示为ω=[a
i,j
],当第i个智能体可以从第j个智能体接收到数据信息时,则a
i,j
=1,否则a
i,j
=0。
[0073]
本发明具体实施例考虑的多智能体系统是由n个线性异构智能体组成,其中,每个智能体的动态特性可描述为:
[0074][0075]
式中,xi(t)∈rn、ui(t)∈rm和yi(t)∈rq分别是第i个智能体在时间戳t的系统状
态、控制输入和系统输出;ai∈rn×n、bi∈rn×m和ci∈rq×n分别是第i个智能体具有适当维数(对应n
×
n维、n
×
m维、q
×
n维)的状态矩阵,控制矩阵和输出矩阵。其中,i为智能体编号,i∈{1,2,
…
,n}。本发明具体实施例将主智能体编号定义为1,其余智能体为从智能体。第i个智能体反馈通道和前馈通道中的随机网络时延定义为和智能体之间的随机网络时延统一定义为延统一定义为都是正整数,表示第i个智能体的反馈通道的随机网络时延的上限值,表示第i个智能体的反馈通道的随机网络时延的上限值,表示所有智能体的反馈通道的随机网络时延的上限值的最大值,表示在时刻t智能体之间的随机网络时延的值;表示智能体之间的随机网络时延的最大值,表示智能体之间的随机网络时延的最小值。
[0076]
本发明具体实施例,考虑随机网络时延和设计一种网络化控制方案,使主智能体的输出y1(t)跟踪参考输入信号r(t)∈rq,而从智能体的输出yi(t)跟踪主智能体的输出y1(t),从而实现多智能体系统(式(1))的协同输出跟踪控制。第i个智能体的输出跟踪误差定义为:
[0077][0078]
式中,
[0079]
式(1)的增量形式可表示为:
[0080][0081]
式中,
[0082]
由式(2)和式(3)可得:
[0083][0084]
式中,δr(t+1)=r(t+1)-r(t)。将式(3)和式(4)合并,可得如下增广系统:
[0085][0086]
式中,
[0087]
[0088]ce,i
=[c
i 0q×q],w=n+q。
[0089]
其中,0和i分别为适当维数的零矩阵和单位矩阵。由式(5)可以看出,多智能体系统(式(1))的协同输出跟踪控制问题转化为了增广系统(式(5))的镇定问题。本发明具体实施例的目标是,针对多智能体系统(式(5)),考虑随机网络时延施例的目标是,针对多智能体系统(式(5)),考虑随机网络时延和设计一种网络化控制方案,使闭环系统全局渐进一致稳定。
[0090]
公式中,δ表示增量,ai表示状态矩阵;bi表示控制矩阵;ci表示输出矩阵;e表示输出跟踪误差;x
e,i
表示增广状态;a
e,i
、b
e,i
、c
e,i
、ee均为增广系统(5)的系统矩阵。
[0091]
为实现上述目标,本发明具体实施例做如下现实假设:
[0092]
假设1:(ai,bi)是能控的,(ai,ci)是能观的;假设2:每个智能体系统的传感器、控制器和执行器均为时间驱动,且时钟同步。
[0093]
仍请参见图1,对本发明具体实施例的数据缓存器、双预测发生器、控制预测器和时延补偿器各部分的具体设计进行介绍。
[0094]
1)数据缓存器设计
[0095]
数据缓存器设置在传感器中,为了主动补偿智能体i反馈通道中的数据包乱序与丢失,缓存被控对象的输出数据序列并在每个采样时刻,传感器将数据序列gi(t)及其时间戳t打包发往智能体i的双预测发生器。
[0096]
2)双预测发生器设计
[0097]
双预测发生器通过网络接收来自数据缓冲器的数据包,但是网络的引入会导致数据包传输的乱序情况,因此双预测发生器中的数据缓冲器会比较数据包的时间戳来避免这种情况,最终得到最新的数据序列由于网络化多智能体系统的真实状态值无法直接测量,因此我们需要设计状态观测器,根据中的值来获得状态估计值,可分为以下两种情况:
[0098]
a.在t时刻,当双预测发生器中的数据缓冲器接收到一个新的数据包时,如果满足则执行以下运算,
[0099][0100]
式中,为状态的估计值,li∈rn×q是智能体i的观测器增益矩阵,一般可采用常规现代控制理论来设计,如极点配置方法等。
[0101]
b.在t时刻,如果双预测发生器中数据缓冲器接收到的新数据包的时间戳小于前一个缓冲数据包的时间戳,或者没有接收到新的数据包,则状态的估计值等于上一时刻状态的估计值,即
[0102][0103]
由式(6)可以得到智能体i在时刻状态估计值的增量为:
[0104]
[0105]
根据时刻的增量式状态估计值和参考输入值,将双预测发生器分为控制预测过程和输出预测过程两部分。如下所示,控制预测过程中得到的预测值被发送给控制预测器来计算自己的控制量,
[0106][0107][0108]
式中,
[0109][0110][0111]
输出预测过程如下所示:
[0112][0113]
式中,
[0114][0115][0116][0117]
为校正参数矩阵,为虚拟控制律(12)的增益矩阵,一般选取合适的值以保证多智能体系统的稳定性。因此,在每个时刻,将以下输出预测序列
[0118]
和时间戳一起打包发往其它智能体的控制预测器中。
[0119]
3)控制预测器设计
[0120]
为了解决网络化多智能体系统在随机网络时延下的协同跟踪控制问题,利用自身双预测发生器和其他智能体发送的数据设计了以下控制律来计算一系列控制量,
[0121][0122][0123]
式中,式中,和是智能体i的控制器增益矩阵和协同参数矩阵,分别决定多智能体系统的动态性能和协同性能,通常通过极点配置的方法获得,通常选择适当的参数来保证多智能体系统的协同性能和稳定性能。因此,智能体i在时间的控
制信号为:
[0124][0125]
在每个采样时刻,控制预测器将以下控制序列和时间戳一起打包通过网络发往时延补偿器。
[0126]
4)时延补偿器设计
[0127]
时延补偿器根据从控制预测器接收到的最新控制预测序列在每个采样时刻,选择第控制信号应用于被控对象,从而主动补偿前馈通道的随机通信时延。
[0128]
下面利用matlab软件对本发明的控制系统进行数值仿真验证。考虑由三个无刷直流电机组成的多智能体系统,其状态空间模型参数分别如下:
[0129][0130][0131][0132]
系统的参考输入为幅值2000的方波信号,采样时间为0.05s,三个电机的初始状态分别取为:x1(t)=[0 0]
t
、x2(t)=[0 0]
t
、x3(t)=[0 0]
t
。通过极点配置方法,得到三个观测器增益矩阵如下:
[0133][0134]
在保证系统稳定的条件下,式(11)和(12)中的校正参数矩阵和虚拟控制器增益矩阵、式(15)中的控制器增益矩阵和协同参数矩阵分别如下:
[0135][0136][0137][0138][0139][0140][0141]
网络化多智能体系统的拓扑结构设置为:a
1,1
=a
2,2
=a
3,3
=0,a
2,1
=a
3,1
=a
1,2
=a
1,3
=a
2,3
=a
3,2
=1。在仿真中,假定各个智能体i反馈通道中的随机网络时延为2~5步,即
各个智能体i前馈通道中的随机网络时延为2~6步,即智能体之间随机网络时延统一为1~3步,即如图2所示,图2示出了主智能体1、从智能体2和从智能体3反馈通道、前馈通道以及智能体之间的随机网络时延,其中,图2的第一行(即(a)部分、(b)部分和(c)部分)表示主智能体1、从智能体2和从智能体3反馈通道的随机网络时延,图2的第二行(即(d)部分、(e)部分和(f)部分)表示主智能体1、从智能体2和从智能体3前馈通道的随机网络时延,图2的第三行(即(g)部分、(h)部分和(i)部分)表示主智能体1与其他智能体之间、从智能体2与其他智能体之间、从智能体3与其他智能体之间的随机网络时延。
[0142]
仿真分为如下四种情形进行:
[0143]
(1)在随机网络时延下无补偿:
[0144]
在这种情况下,考虑了随机通信时延,即和但没有采用本实施例的控制系统。图3示出了随机网络时延下无补偿时系统输出结果,从图3中可以看出,随机网络时延不能及时主动补偿,导致闭环系统不稳定。
[0145]
(2)在随机网络时延下无协同:
[0146]
在这种情况下,考虑了随机通信时延,即和采用本实施例的控制系统。但是,为了反映协同项的作用,在控制律(15)中不采用协同项,式(15)就变成了
[0147]
图4示出了随机网络时延下无协同时系统输出结果,从图4中可以看出,虽然智能体1的输出最终跟踪到了参考信号,智能体2和智能体3的输出最终跟踪到了智能体1的输出,但是智能体2和智能体3的协同性能比较差。
[0148]
(3)在随机网络时延下有协同无校正:
[0149]
在这种情况下,考虑了随机通信时延,即和采用本实施例的控制系统。但是,为了反映校正的作用,在输出预测过程(11)中不采用校正项,式(11)就变成了如下:
[0150][0151]
图5示出了随机网络时延下无校正时系统输出结果,从图5中可以看出,智能体1的输出最终跟踪到了参考信号,智能体2和智能体3的输出最终跟踪到了智能体1的输出,虽然智能体2和智能体3的协同性能相比无协同情况时有了很大的提高,但是协同性能还是较差。
[0152]
(4)在随机网络时延下有协同有校正:
[0153]
在这种情况下,考虑了随机通信时延,即和采用本实施例的控制系统。图6示出了随机网络时延下有协同有校正时系统输出结果图,从图6中可以看出,智能体1,智能体2和智能体3都实现了零稳态输出跟踪误差,并且智能体2和智能体3的协同性能非常好,由此,证明了本实施例的控制系统的有效性。
[0154]
本实施例的控制系统,适用于智能体之间以及每个智能体反馈通道和前馈通道同
时存在随机网络诱导时延、数据包乱序与丢失等通信约束的多个线性同构或异构智能体的协同输出跟踪控制,该控制系统,同时考虑了智能体之间的通信约束以及每个智能体内部反馈通道和前馈通道的通信约束,这些通信约束问题都会被主动补偿;设计了一种基于偏差校正的控制方法,同时设计了一种具有比例积分作用的协同控制律;控制结构简单,易于实现,其系统状态不要求直接可测,便于在实际工程中应用和推广。
[0155]
为了实现上述实施例一对应的控制系统,以得到相应的功能和技术效果,下面提供一种基于偏差校正的多智能体协同跟踪控制方法。
[0156]
参见图7,所述方法,包括:
[0157]
步骤101:获取并缓存第i个智能体的输出数据包;所述输出数据包,包括传感器输出的数据序列和对应的时间戳。
[0158]
步骤102:根据第i个智能体的输出数据包、系统参考输入信号、历史控制量和随机网络时延,采用预测控制方法计算预测量,并将预测量分为自身控制预测量和输出预测量。
[0159]
其中,所述随机网络时延,包括:智能体的反馈通道的随机网络时延、智能体的前馈通道的随机网络时延和智能体之间的随机网络时延。
[0160]
步骤103:获取其他智能体的输出预测量。
[0161]
所述其智能体为多智能体系统中除第i个智能体之外的智能体。
[0162]
步骤104:根据第i个智能体的自身控制预测量和其他智能体的输出预测量,计算第i个智能体的控制包。
[0163]
其中,所述控制包,包括:控制序列和对应的时间戳。
[0164]
步骤105:根据智能体的前馈通道的随机网络时延和所述控制包中的时间戳,从控制序列中选取相应的控制量施加到第i个智能体上。
[0165]
在一个示例中,步骤102中的根据第i个智能体的输出数据包、系统参考输入信号、历史控制量和随机网络时延,采用预测控制方法计算预测量,具体包括:
[0166]
比较第i个智能体的输出数据包中的时间戳,得到比较结果。
[0167]
根据所述比较结果、第i个智能体的传感器输出的数据序列、系统参考输入信号、历史控制量和随机网络时延,得到状态估计量,基于所述状态估计量采用预测控制方法计算预测量,具体为:若所述比较结果为当前时刻的时间戳小于上一时刻的时间戳,则根据第i个智能体的传感器在上一时刻输出的数据、系统参考输入信号、历史控制量和随机网络时延,得到当前时刻的状态估计量;若所述比较结果为当前时刻的时间戳大于或等于上一时刻的时间戳,则将上一时刻的状态估计量作为当前时刻的状态估计量;基于所述状态估计量采用预测控制方法计算预测量。
[0168]
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的方法而言,由于其与实施例公开的系统相对应,所以描述的比较简单,相关之处参见系统部分说明即可。
[0169]
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。
技术特征:
1.一种基于偏差校正的多智能体协同跟踪控制系统,其特征在于,包括:多个控制模块,一个控制模块连接一个智能体;对于第i个智能体,第i个控制模块,包括:依次连接的数据缓存器、双预测发生器、控制预测器和时延补偿器;所述数据缓存器和所述时延补偿器均与第i个智能体连接;第i个控制模块中的所述数据缓存器,用于:获取并缓存第i个智能体的输出数据包;所述输出数据包,包括传感器输出的数据序列和对应的时间戳;将第i个智能体的输出数据包发送至第i个控制模块中的所述双预测发生器中;第i个控制模块中的所述双预测发生器,用于:根据第i个智能体的输出数据包、系统参考输入信号、历史控制量和随机网络时延,采用预测控制方法计算预测量;所述随机网络时延,包括:智能体的反馈通道的随机网络时延、智能体的前馈通道的随机网络时延和智能体之间的随机网络时延;将预测量分为自身控制预测量和输出预测量,将所述自身控制预测量发送至第i个控制模块中的控制预测器,将所述输出预测量发送至其他控制模块中的控制预测器;所述其他控制模块,包括:与多智能体系统中除第i个智能体之外的智能体连接的控制模块;第i个控制模块中的所述控制预测器,用于:获取其他控制模块发送的输出预测量;根据第i个控制模块中的所述双预测发生器发送的自身控制预测量和其他控制模块发送的输出预测量,计算第i个智能体的控制包,并将所述控制包发送至第i个控制模块中的所述时延补偿器中;所述控制包,包括:控制序列和对应的时间戳;第i个控制模块中的所述时延补偿器,用于:根据智能体的前馈通道的随机网络时延和所述控制包中的时间戳,从控制序列中选取相应的控制量施加到第i个智能体上。2.根据权利要求1所述的一种基于偏差校正的多智能体协同跟踪控制系统,其特征在于,第i个控制模块中的所述双预测发生器,具体包括:数据缓冲器,用于:比较第i个智能体的输出数据包中的时间戳,得到比较结果;状态观测器,与所述数据缓冲器连接,用于:根据所述比较结果、第i个智能体的传感器输出的数据序列、系统参考输入信号、历史控制量和随机网络时延,得到状态估计量,基于所述状态估计量采用预测控制方法计算预测量;将预测量分为自身控制预测量和输出预测量,将所述自身控制预测量发送至第i个控制模块中的控制预测器,将所述输出预测量发送至其他控制模块中的控制预测器。3.根据权利要求2所述的一种基于偏差校正的多智能体协同跟踪控制系统,其特征在于,所述状态观测器,在根据所述比较结果、第i个智能体的传感器输出的数据序列、系统参考输入信号、历史控制量和随机网络时延,得到状态估计量,基于所述状态估计量采用预测控制方法计算预测量的方面,具体用于:若所述比较结果为当前时刻的时间戳小于上一时刻的时间戳,则根据第i个智能体的传感器在上一时刻输出的数据、系统参考输入信号、历史控制量和随机网络时延,得到当前
时刻的状态估计量;若所述比较结果为当前时刻的时间戳大于或等于上一时刻的时间戳,则将上一时刻的状态估计量作为当前时刻的状态估计量;基于所述状态估计量采用预测控制方法计算预测量。4.根据权利要求1所述的一种基于偏差校正的多智能体协同跟踪控制系统,其特征在于,第i个控制模块中的所述双预测发生器中自身控制预测量为:其中,t表示时刻;表示第i个智能体的反馈通道的随机网络时延;表示主智能体的反馈通道在时刻的随机网络时延;表示智能体之间的随机网络时延;σ
i
为正整数;σ
i
=1,2,
…
,表示所有智能体的前馈通道随机网络时延最大值中的上限值;表示基于时刻得到的时刻增广状态的预测值;表示基于时刻得到的时刻增广状态的预测值;表示第i个智能体在时刻控制量的增量值;表示第i个智能体参考输入的预测值;a
e,i
、b
e,i
和e
e
表示增广系统的系统矩阵;第i个控制模块中的所述双预测发生器中输出预测量为:其中,表示智能体之间随机网络时延的最大值;ν
i
为正整数;表示基于时刻得到的时刻增广状态的预测值;表示基于时刻得到的时刻增广状态的预测值;表示第i个智能体在时刻虚拟控制量的增量值;表示第i个智能体在时刻的偏差校正值;表示第i个智能体参考输入的预测值;表示校正参数矩阵。5.根据权利要求1所述的一种基于偏差校正的多智能体协同跟踪控制系统,其特征在于,第i个控制模块中的所述控制预测器,在根据第i个控制模块中的所述双预测发生器发送的自身控制预测量和其他控制模块发送的输出预测量,计算第i个智能体的控制包方面,
具体用于:根据第i个控制模块中的所述双预测发生器发送的自身控制预测量和其他控制模块发送的输出预测量,计算控制增量;根据控制增量计算控制信号;根据各个时刻的控制信号确定第i个智能体的控制序列;由第i个智能体的控制序列和对应的时间戳,确定第i个智能体的控制包。6.根据权利要求5所述的一种基于偏差校正的多智能体协同跟踪控制系统,其特征在于,所述控制增量的计算公式为:其中,表示第i个智能体在时刻的控制增量;t表示时刻;n表示多智能体系统中智能体的数量;表示所有智能体的前馈通道的随机网络时延的最大值的上限值;表示第i个智能体的反馈通道的随机网络时延;表示第i个智能体的控制器增益矩阵;表示第i个智能体的协同参数矩阵;d
i
和d
j
均表示常值矩阵;c
i
表示输出矩阵;i表示单位矩阵;表示第i个智能体基于时刻得到的时刻增广状态的预测值;表示第j个智能体基于时刻得到的时刻增广状态的预测值;a
i,j
表示第i个智能体是否能够从第j个智能体接收到输出预测量;若第i个智能体能够从第j个智能体接收到输出预测量,则a
i,j
=1,否则a
i,j
=0;所述控制信号的计算公式为其中,表示第i个智能体在时刻的控制信号;表示第i个智能体在时刻的控制信号;所述控制序列的计算公式为其中,表示第i个智能体在时刻的控制序列;u
i
(t)表示第i个智能体在时刻t的控制信号;u
i
(t+1)表示第i个智能体在时刻t+1的控制信号;t表示转置。7.一种基于偏差校正的多智能体协同跟踪控制方法,其特征在于,包括:获取并缓存第i个智能体的输出数据包;所述输出数据包,包括传感器输出的数据序列和对应的时间戳;根据第i个智能体的输出数据包、系统参考输入信号、历史控制量和随机网络时延,采用预测控制方法计算预测量,并将预测量分为自身控制预测量和输出预测量;所述随机网络时延,包括:智能体的反馈通道的随机网络时延、智能体的前馈通道的随机网络时延和智
能体之间的随机网络时延;获取其他智能体的输出预测量;所述其智能体为多智能体系统中除第i个智能体之外的智能体;根据第i个智能体的自身控制预测量和其他智能体的输出预测量,计算第i个智能体的控制包;所述控制包,包括:控制序列和对应的时间戳;根据智能体的前馈通道的随机网络时延和所述控制包中的时间戳,从控制序列中选取相应的控制量施加到第i个智能体上。8.根据权利要求7所述的一种基于偏差校正的多智能体协同跟踪控制方法,其特征在于,根据第i个智能体的输出数据包、系统参考输入信号、历史控制量和随机网络时延,首先得到状态估计量,然后采用预测控制方法计算预测量,具体包括:比较第i个智能体的输出数据包中的时间戳,得到比较结果;根据所述比较结果、第i个智能体的传感器输出的数据序列、系统参考输入信号、历史控制量和随机网络时延,得到状态估计量,基于所述状态估计量采用预测控制方法计算预测量。9.根据权利要求8所述的一种基于偏差校正的多智能体协同跟踪控制方法,其特征在于,根据所述比较结果、第i个智能体的传感器输出的数据序列、系统参考输入信号、历史控制量和随机网络时延,首先得到状态估计量,然后采用预测控制方法计算预测量,具体包括:若所述比较结果为当前时刻的时间戳小于上一时刻的时间戳,则根据第i个智能体的传感器在上一时刻输出的数据、系统参考输入信号、历史控制量和随机网络时延,得到当前时刻的状态估计量;若所述比较结果为当前时刻的时间戳大于或等于上一时刻的时间戳,则将上一时刻的状态估计量作为当前时刻的状态估计量;基于所述状态估计量采用预测控制方法计算预测量。
技术总结
本发明公开了一种基于偏差校正的多智能体协同跟踪控制系统及方法,涉及工程控制领域,该多智能体协同跟踪控制系统,包括:数据缓存器、双预测发生器、控制预测器和时延补偿器;数据缓存器获取并缓存智能体的输出数据包;双预测发生器根据输出数据包、系统参考输入信号、历史控制量和随机网络时延,采用预测控制方法计算预测量,并将预测量分为自身控制预测量和输出预测量;控制预测器根据自身控制预测量和接收到的其他的双预测发生器的输出预测量计算控制量,从而得到控制包;时延补偿器根据智能体的前馈通道的随机网络时延和控制包中的时间戳,从控制序列中选取相应的控制量施加到智能体上。本发明能提高多智能体系统的控制性能和稳定性。制性能和稳定性。制性能和稳定性。
技术研发人员:庞中华 杜涛
受保护的技术使用者:北方工业大学
技术研发日:2023.06.07
技术公布日:2023/8/13
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
