一种针对机动目标的避障制导方法

未命名 10-19 阅读:97 评论:0


1.本发明涉及一种针对机动目标的避障制导方法,属于避障制导方法技术领域。


背景技术:

2.为了提高拦截器的命中精度,几十年来提出了许多制导方法。然而,随着作战环境的日益复杂,目前的制导方法在以下情况下逐渐暴露出局限性:
3.1)在目标机动时实现精确制导。
4.2)在追击目标时避开地面障碍或敌人威胁。
5.对于前一种情况,针对机动目标提出了如下一些改进的制导方法:
6.增强比例导引律(augmented proportional navigation guidance,apng)、自适应滑模制导律(adaptive sliding-mode guidance,asmg)、最优制导律等,作为一种改进的比例导引律(proportional navigation guidance,png),apng具有形式简单、实用性强的特点,它通过在png导引律中添加修正项来抑制目标机动对制导精度的影响[zarchan p.tactical and strategic missile guidance,sixth edition[m].reston,virginia:american institute of aeronautics and astronautics,inc.,2012:16-34.]。shen等人[shen j.research on generalized guidance law of anti-tactical ballistic missiles[j].acta armamentarii,2015,36(s2):25-29.]推导出了两种apng形式,其中一种基于目标速度的法向加速度,另一种基于视线的角加速度(los),然而,这两种形式都需要已知的精确目标机动信息。此外,apng无法克服传统png的缺点,即在制导的最后阶段所需的过载过大,这可能导致飞行过程中的姿态不稳定。asmg是一种基于变结构控制理论的新型制导方法,具有对参数摄动不敏感、抗外界干扰等优点。ji等人[ji h,liu x,song z,et al.time-varying sliding mode guidance scheme for maneuvering target interception with impact angle constraint[j].journal of the franklin institute,2017,355(18):9192-9208.]提出了一种新的时变全局滑模控制技术,该技术使用线性扩展状态观测器来估计未知目标加速度,可以在期望的冲击角下实现机动目标拦截。文献[wang xx,lu h q,huang x l,et al.three-dimensional time-varying sliding mode guidance law against maneuvering targets with terminal angle constraint[j].chinese journal of aeronautics,2022,35(04):303-319.]的作者研究了在三维非解耦几何条件下拦截机动目标的问题,并开发了基于时基生成器函数的时变滑模控制方法。尽管已被证明是机动目标拦截的先进方法[lin c m,hsu c f.guidance law design by adaptive fuzzy sliding-mode control[j].journal of guidance,control,and dynamics,2002,25(2):248-256.],[zhou d,mu c,xu w.adaptive sliding-mode guidance of a homing missile[j].journal of guidance control and dynamics,2015,22(4):589-594.],asmg无法处理具有复杂约束的制导问题。这些约束来自于不同环境中的实际作战需求。
[0007]
因此提出了基于最优控制理论的制导律。由于能够处理各种约束和目标,自
for unmanned aerial vehicle based on interfered fluid dynamical system[j].chinese journal of aeronautics,2015,28(01):229-239.]。然而,它通过在目标点放置一个下沉流来确保无人机飞到目的地,这在本质上与构建吸引力的方法相似,并将导致与apf方法在制导问题中遇到的同样的困难。


技术实现要素:

[0011]
本发明的目的是提供一种针对机动目标的避障制导方法。
[0012]
本发明的一种针对机动目标的避障制导方法,其特殊之处在于包括以下步骤:
[0013]
一种针对机动目标的避障制导方法,其特征在于包括以下步骤:
[0014]
1)基于目标运动历史信息对目标机动造成的干扰进行估计,得到预测时域内的干扰估计值
[0015]
2)利用算法1求解有限时域最优控制问题1-1,得到最优制导指令u
*
(k),问题1-1的目标函数1设计如式(27)所示;
[0016][0017]
3)根据触发条件j2(u
*
(k))=0判断u
*
(k)能否作为最终制导指令,若是,则令并转步骤5),若否,则执行步骤4),其中j2(
·
)如式(52)所示:
[0018][0019]
4)利用算法2求解最优制导避障问题1-2,得到最优制导避障指令问题1-2的目标函数2定义为(53);
[0020][0021]
5)输出作为当前采样时刻拦截器制导指令,当时间到达下一采样时刻k+1,令k=k+1并获取系统状态χ(k),若有则停止制导,若否,则继续制导并重复上述步骤。
[0022]
步骤1)中所述得到预测时域内的干扰估计值的步骤为:
[0023]
首先,考虑到扰动无法直接观测,因此使用θ
t
和ψ
t
的前向差分代替,并将估计对象定义为
[0024][0025]
其次,给定历史信息序列e(k-q),

,e(k-1),则e(k-q),

,e(k-1)与时间步1,

,q之间的函数关系可由非线性函数g(
·
)进行拟合
[0026]
[0027]
根据拟合误差采取不同的方式进行估计,若拟合误差在指定范围内表明估计对象与时间有显著的相关性,则该函数可用于后续估计,并且有
[0028][0029]
若拟合误差超出指定范围,表明函数g(
·
)不能很好地拟合上述关系,或者估计对象与时间之间的相关性很弱,那么基于估计对象在预测范围内保持不变的保守假设,只有最近的观测信息用于前馈补偿;
[0030][0031]
上述估计方法可以表示为:
[0032][0033]
考虑到多项式在逼近连续函数方面的良好性能,选择多项式函数来拟合上述关系,其系数由最小二乘法确定,具有优化系数的多项式函数写成
[0034][0035]
其中,n-1是多项式函数的次数,系数α0(k),


n-1
(k)将在每一采样时刻进行更新,确保观测信息得到充分利用。
[0036]
目标函数1的推导过程如下:
[0037]
拦截器和目标在惯性坐标系中的运动学方程分别为(1)和(2)。
[0038][0039][0040]
其中,下标m和t分别代表拦截器与目标,其航迹倾斜角分别为θm和θ
t
,航迹偏转角为ψm与ψ
t
,空速为vm、v
t
。选择式(3)作为制导系统状态向量。
[0041]
χ=[xm,ym,zm,θm,ψm,x
t
,y
t
,z
t

t

t
]
t
ꢀꢀꢀ
(3)
[0042]
则非线性系统可以由状态方程(4)、(5)进行描述:
[0043]
[0044][0045]
其中是拦截器的控制输入,是目标机动形成的系统干扰;
[0046]
零效脱靶量(zem)被定义为在目标继续沿其当前航向飞行且拦截器没有进一步修正机动的情况下,拦截器最终将错过目标的距离,在这种情况下,拦截器和目标之间的距离随时间的变化公式为(24);
[0047][0048]
从(24)可以看出,拦截器在之后将不再继续接近目标,因此zem可以确定为双方在t
go
(χ)时的相对距离,根据二次函数的最值公式,该距离为
[0049][0050]
并且有
[0051][0052]
因此,基于zem的目标函数为
[0053][0054]
步骤2)中所述有限时域最优控制问题1-1是给定系统状态χ(k)和估计值找到最优控制输入序列
[0055][0056]
s.t.
[0057][0058][0059]
步骤2)中所述算法1的具体步骤为:
[0060]
step1初始化:设定算法参数k1,β1,β2,α,利用式(57)生成初始解u
(0)
(p;k),初始化一阶、二阶有偏矩估计,以及迭代次数iter=0;
[0061][0062]
step2算法主循环:当时,执行step2.1~step2.4,否则执行step3
[0063]
step2.1利用(41),(42)计算j1(u
(iter)
(p;k)),利用(67)计算κ;
[0064][0065]
step2.2利用(59)~(64)更新u
(iter)
(p;k);
[0066]
获取目标函数的梯度
[0067][0068]
更新有偏一阶矩估计值
[0069]
η
(iter)
=β1η
(iter-1)
+(1-β1)g
(iter)
ꢀꢀꢀ
(60)
[0070]
更新有偏二阶矩估计值
[0071]
ν
(iter)
=β2ν
(iter-1)
+(1-β2)g
(iter)
⊙g(iter)
ꢀꢀꢀ
(61)
[0072]
计算无偏一阶矩估计值
[0073][0074]
计算无偏二阶矩估计值
[0075][0076]
更新u
(iter)
[0077][0078]
其中,对于向量的所有运算都是逐元素进行的,β1,β2∈(0,1]是矩估计的衰减率,α∈(0,1]是步长,是一个小的正有理数。初始有偏矩估计值满足
[0079]
此外,为了使满足迭代过程中的控制输入约束,引入了非线性饱和函数sat(
·
):
[0080][0081]
step2.3利用(66)修正u
(iter)
(p;k);
[0082][0083]
step2.4更新当前迭代次数为iter=iter+1;
[0084]
step3利用(70)确定最优解u
*
(p;k),取其首个分量作为u
*
(k);
[0085][0086]
步骤3、步骤4)中的触发条件以及目标函数2的推导过程如下:
[0087]
为了在制导过程中避免地面障碍或空间区域,首先需要一种有效的建模方法,所有检测到的障碍物或敌方威胁区域都被视为可以适当包围它们的规则几何体,统一模型用公式(7)、(8)来描述;
[0088]
为了便于表达,所有障碍物、威胁区域和它们被视为的规则几何形状统称为障碍物;
[0089][0090]
其中是障碍物集合,(z
oi
,x
oi
)是障碍物oi的几何中心在zox上的投影,参数向量ωi决定oi的形状,并且有:
[0091][0092]
考虑到拦截器在惯性坐标系中的运动,如果拦截器没有进一步机动,根据式(7),γi的变化将如公式(44)所示;
[0093][0094]
这里,t的可行范围是(45).
[0095][0096]
从(45)中可以注意到,除了将拦截器的飞行高度限制在拦截器可能与障碍物碰撞的范围内的现有约束之外,还应针对拦截器在遇到障碍物之前击中目标的情况施加额外的约束,即t<t
go
(χ);
[0097]

[0098][0099]
则有
[0100][0101]
定义单个障碍的威胁函数为(48)
[0102][0103]
拦截器沿当前航向进入障碍物的深度越深,障碍物的威胁就越大,如果拦截器在没有进一步机动的情况下未与障碍物相撞,障碍物威胁则为零,然而,由于t的可行范围涉及不同的情况,公式(48)中的很难确定,参见下述内容:
[0104]
威胁函数和代价函数的解析表达式
[0105]
为了获得的确切值,将与相关的所有可能情况总结如下:
[0106][0107]
然后,根据一元二次函数的极值点与可行区间的端点之间的关系,可以分段形式表示为(50);
[0108][0109]

[0110][0111]
其中为一较大正有理数。这样,ζi(χ,ωi)在任何可能情况下的取值可由(49),(50),(51)和(48)确定;
[0112]
避障的总代价被视为来自所有探测到的障碍物的威胁总和,即(52),使用下一采样时刻的预测系统状态,问题1-2的目标函数可以定义为(53);
[0113][0114]
[0115]
此处,通过式(40)取得;
[0116]
基于预测系统状态可通过递推获得
[0117][0118]
其中
[0119]
步骤4)中所述最优制导避障问题1-2是给定系统状态χ(k)、估计值以及求解问题1-1获得的制导指令u
*
(k),找到最优避障-制导指令
[0120][0121]
s.t.
[0122][0123]
j2(χ(k),u
*
(k))>0
ꢀꢀꢀꢀꢀ
(56)。
[0124]
步骤4)中所述算法2的具体步骤为:
[0125]
step1初始化:设定算法参数k1,β1,β2,α,利用(58)生成初始解
[0126][0127]
step2对于种群中的任意个体,初始化其一阶、二阶有偏矩估计,以及迭代次数iter=0,
[0128]
当时,执行step2.1~step2.4,否则执行step3;
[0129]
step2.1利用(41),(42)计算利用(67)计算κ;
[0130][0131]
s.t.
[0132][0133][0134]
step2.2利用(59)~(64)更新
[0135]
获取目标函数的梯度
[0136][0137]
更新有偏一阶矩估计值
[0138]
η
(iter)
=β1η
(iter-1)
+(1-β1)g
(iter)
ꢀꢀꢀ
(60)
[0139]
更新有偏二阶矩估计值
[0140]
ν
(iter)
=β2ν
(iter-1)
+(1-β2)g
(iter)
⊙g(iter)
ꢀꢀꢀ
(61)
[0141]
计算无偏一阶矩估计值
[0142][0143]
计算无偏二阶矩估计值
[0144][0145]
更新u
(iter)
[0146][0147]
其中,对于向量的所有运算都是逐元素进行的,β1,β2∈(0,1]是矩估计的衰减率,α∈(0,1]是步长,是一个小的正有理数。初始有偏矩估计值满足
[0148]
step2.3利用(66)修正
[0149][0150]
step2.4更新当前迭代次数为iter=iter+1;
[0151]
step3利用(70)确定个体最优利用(71)确定全局最优解
[0152][0153][0154]
本发明一种针对机动目标的避障制导方法,解决了具有避障要求的机动目标的三维制导问题,利用优化技术、mpc理论和几何方法的新型制导方法。主要有益效果如下:
[0155]
(1)将最优制导问题中的避障约束转化为具有触发条件的独立优化问题,在此基础上提出了避障制导的总体方案;
[0156]
(2)提出了一种改进目标函数和干扰估计器的mpc制导方法,以确保拦截器在无需避开任何障碍物的情况下能够精确命中目标;
[0157]
(3)基于vo模型和简化的障碍物几何结构,推导了不同形状障碍物威胁函数的统一表达式,构建了用于防撞和制导的目标函数;
[0158]
(4)针对制导避障问题,设计了自适应矩估计(adam)算法,其解将作为拦截器的实时制导指令。
附图说明
[0159]
图1为拦截器或目标在惯性坐标系中的运动图;
[0160]
图2为障碍物的三种典型几何形状及其参数图;
[0161]
图3为避障制导总体方案图;
[0162]
图4为与可行时间范围相关的情况图;
[0163]
图5为关于威胁函数值的几种情况图;
[0164]
图6为几种情况下的函数图像图;
[0165]
图7为工况1中拦截器和目标的飞行轨迹图;
[0166]
图8为工况1中两种距离的变化图;
[0167]
图9为工况1中拦截器的控制输入变化图;
[0168]
图10为工况2中拦截器和目标的飞行轨迹
[0169]
图11为工况2中两种距离的变化
[0170]
图12为工况2中拦截器的控制输入变化
[0171]
图13为工况3中拦截器和目标的飞行轨迹
[0172]
图14为工况3中两种距离的变化
[0173]
图15为工况3中拦截器的控制输入变化图
[0174]
图16为工况4、工况5和工况6的地形条件图
[0175]
图17为工况4、工况5和工况6的目标机动输入图
[0176]
图18为工况4中拦截器和目标的飞行轨迹图
[0177]
图19为工况4中拦截器和目标飞行轨迹的投影图
[0178]
图20为工况4中两种距离的变化图
[0179]
图21为工况4中拦截器的控制输入变化图
[0180]
图22为工况5中拦截器和目标的飞行轨迹图
[0181]
图23为工况5中拦截器和目标飞行轨迹的投影图
[0182]
图24为工况5中两种距离的变化图
[0183]
图25为工况5中拦截器的控制输入变化图
[0184]
图26为工况6中拦截器和目标的飞行轨迹图
[0185]
图27为工况6中拦截器和目标飞行轨迹的投影图
[0186]
图28为工况6中两种距离的变化图
[0187]
图29为工况6中拦截器的控制输入变化图。
具体实施方式
[0188]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0189]
实施例
[0190]
本实施例的一种针对机动目标的避障制导方法,描述如下:
[0191]
1.1制导几何描述
[0192]
制导问题的常用坐标系包括惯性坐标系、速度坐标系和视线坐标系等。本文建立了一个惯性坐标系来描述避障制导问题,拦截器和目标的运动学方程分别(1)为和(2)。拦截器或目标在惯性坐标系中的运动图参见附图1
[0193]
[0194][0195]
其中,下标m和t分别代表拦截器与目标,其航迹倾斜角分别为θm和θ
t
,航迹偏转角为ψm与ψ
t
,空速为vm、v
t
。选择式(3)作为制导系统状态向量。
[0196]
χ=[xm,ym,zm,θm,ψm,x
t
,y
t
,z
t

t

t
]
t
ꢀꢀꢀ
(3)
[0197]
则非线性系统可以由状态方程(4)、(5)进行描述。
[0198][0199][0200]
其中是拦截器的控制输入,是目标机动形成的系统干扰。制导的目的是在控制结束时使公式(6)中所示的双方距离尽可能小。
[0201][0202]
1.2环境建模
[0203]
为了在制导过程中避免地面障碍或空间区域,首先需要一种有效的建模方法。在本文中,所有检测到的障碍物或敌方威胁区域都被视为可以适当包围它们的规则几何体。例如,山脉被视为圆锥体,建筑物被视为圆柱体,敌方雷达或防空武器的覆盖区域被视为半球,其半径为覆盖范围。它们的统一模型可以用公(7)、(8).来描述。
[0204]
备注1为了便于表达,所有障碍物、威胁区域和它们被视为的规则几何形状统称为障碍物。
[0205][0206][0207]
其中是障碍物集合,(z
oi
,x
oi
)是障碍物oi的几何中心在zox上的投影,参数向量ωi决定oi的形状,并且有:
[0208][0209]
附图2为障碍物的三种典型几何形状及其参数图。这项工作降低了建模的复杂性
和时间成本,为后续部分的避障算法开发提供了数学基础。
[0210]
2.3具有避障约束的最优制导模型
[0211]
基于上文,具有避障约束的最优制导问题可以表示为问题1。
[0212]
问题1给定初始系统状态χ(t0),找到
[0213][0214]
s.t.
[0215][0216]
γi(χ1(t),χ2(t),χ3(t))>0
ꢀꢀꢀ
(12)
[0217]
2.4避障-制导总体方案
[0218]
要解决上述最优制导问题,首先应考虑如下难点:
[0219]
a、避障约束(12)难以处理。
[0220]
b、除非完全知道目标的未来机动信息,否则很难获得终端时间。
[0221]
关于a,处理避障约束的一般方法是在目标函数中添加惩罚项。修改后的函数将具有以下形式。
[0222][0223]
其中,j1(χ(t),u(t),w(t))=r(χ(tf),u(t),w(t)),j2(
·
)是基于避障约束构建的成本函数,μ是影响制导精度和避障成功率的权重系数。
[0224]
然而,考虑到j2的可能值在制导初始阶段远小于j1的情况,μ的取值必须足够大以避免碰撞。因此,当j1的值在制导的最后阶段非常小时,其任何可能变化对目标函数的影响都是十分微小的,这可能会导致制导精度的降低。
[0225]
为了避免上述情况,本文采用的避障约束处理方法是将最优问题1分解为两个子问题,它们分别是
[0226]
问题1-1给定系统初始状态χ(t0),找到
[0227][0228]
s.t.
[0229][0230]
问题1-2给定系统状态χ(t)以及制导指令u
*
(t),找到
[0231][0232]
s.t.
[0233][0234][0235]
其中,当拦截器不需要避开任何障碍物时,问题1-1的最优解将作为最终制导指令。一旦不等式(18)成立,表明拦截器需要改变其制导命令,以免与障碍物相撞,那么制导指令将通过解决问题1-2获得。问题1-2的目标函数由的p范数和避障成本函
数组成,因此其最优解与问题1-1的最优解相差不大,从而确保了避障的制导精度和成功率。通过这种方式,具有避障功能的制导方案如附图3所示。
[0236]
对于b,由于目标机动引起的系统干扰的存在,很难精确地获得终端时间。而模型预测控制(mpc)通过将其转化为有限时域的最优控制问题,对这类终端时间不确定的最优控制问题具有良好的适应性。因此,为了从问题1-1中获得最优制导命令u
*
(t),在以下部分中提出了一种基于mpc的制导方法。
[0237]
2、mpc制导方法
[0238]
最优制导问题1-1将被重新定义为mpc框架下的有限时域最优控制问题(finite-horizon optimal control problem,fhocp),其目标函数由零效脱靶量(zero-effort miss,zem)推导获得,并提出了一种估计方法来抑制目标机动的干扰。
[0239]
2.1非线性mpc
[0240]
描述为(5)的非线性连续系统可以使用显式欧拉方法离散化,离散系统状态方程写成(19)。
[0241][0242]
其中δ是离散系统的采样周期。
[0243]
在k时刻,给定初始系统状态χ(k),控制输入序列u(k),

,u(k+p-1)以及系统干扰w(k),

,w(k+p-1),此后有限时域的系统状态可通过递推计算获得:
[0244]
χ(k+i)=f(χ(k+i-1),u(k+i-1),w(k+i-1))
ꢀꢀꢀ
(20)
[0245]
i=1,

,p
[0246]
其中,为预测时域。
[0247]
那么,问题1-1可被重新定义为fhocp
[0248]
问题1-1给定系统初始状态χ(k),找到最优控制输入序列
[0249][0250]
s.t.
[0251]
χ(k+i)=f(χ(k+i-1),u(k+i-1),w(k+i-1))
ꢀꢀ
(22)
[0252][0253]
mpc即在每一采样时刻使用最优控制输入序列的首个分量作为系统的实际输入,并在下一、采样时刻获得系统状态,用以进行反馈校正和后续优化。该过程将重复进行,直到控制结束。mpc通过实时校正和滚动优化,可以有效地处理外部干扰和模型不确定性,从而确保系统的鲁棒性和稳定性。
[0254]
2.2基于zem的改进目标函数
[0255]
目标函数的选择是mpc控制器设计的重要部分。对于全局最优控制问题,其目标函数通常可以进一步用于其相应的mpc问题,但在不同情况下,这样做的实际效果可能会有较大差异。例如原问题1-1的目标函数,如果它以r(χ(k+p))的形式用于重新定义的问题1-1,则在p=1处的最优解将具有与vpgl相同的解析表达式。然而如上文所述,对于目标机动而言,vpgl不是一个很好的选择。因此,为了提高mpc对机动目标的制导性能,本节推导了基于
zem的目标函数。
[0256]
zem被定义为在目标继续沿其当前航向飞行且拦截器没有进一步修正机动的情况下,拦截器最终将错过目标的距离。在这种情况下,拦截器和目标之间的距离随时间的变化公式为(24)。
[0257][0258]
从(24)可以看出,拦截器在之后将不再继续接近目标,因此zem可以确定为双方在t
go
(χ)时的相对距离,根据二次函数的最值公式,该距离为
[0259][0260]
并且有
[0261][0262]
因此,基于zem的目标函数为
[0263][0264]
可以证明,使j1(χ(p;k),u(p;k),w(p;k))最小化的控制输入同样可以使拦截器与目标之间的距离收敛到0。这里,为了确保拦截器在追击和拦截场景中都有机会击中目标,令vm>v
t

[0265]
由(25),以作为控制输入的终端状态χ(k+p)满足等式(28).
[0266][0267]
即,存在常数λ满足(29)
[0268][0269]
由于拦截器与目标的速度均为常数,因此下式成立。
[0270][0271]
其中,
[0272][0273]
通过求解(30),可以得到
[0274][0275]
于是拦截器与目标在k+p+1时刻的距离满足不等式(33),除非有r2(χ(k+p))=0
[0276][0277]
因此,最优控制输入可以使拦截器与目标之间的距离最终减小到零。
[0278]
2.3基于历史信息的干扰估计
[0279]
然而在制导问题中,由于目标机动引起的系统扰动无法预先观测,因此很难获得如(20)所示的未来系统状态。为了抑制干扰的影响,本节提出了一种基于历史信息的估计方法,其结果可用于制导系统的前馈补偿。
[0280]
首先,考虑到扰动无法直接观测,因此使用θ
t
和ψ
t
的前向差分代替,并将估计对象定义为
[0281][0282]
其次,给定历史信息序列e(k-q),...,e(k-1),则e(k-q),...,e(k-1)与时间步1,...,q之间的函数关系可由非线性函数g(
·
)进行拟合
[0283][0284]
根据拟合误差采取不同的方式进行估计。若拟合误差在指定范围内表明估计对象与时间有显著的相关性,则该函数可用于后续估计。并且有
[0285][0286]
若拟合误差超出指定范围,表明函数g(
·
)不能很好地拟合上述关系,或者估计对象与时间之间的相关性很弱,那么基于估计对象在预测范围内保持不变的保守假设,只有最近的观测信息用于前馈补偿。
[0287][0288]
上述估计方法可以表示为:
[0289][0290]
考虑到多项式在逼近连续函数方面的良好性能,选择多项式函数来拟合上述关系,其系数由最小二乘法确定。那么具有优化系数的多项式函数可以写成
[0291][0292]
其中,n-1是多项式函数的次数,系数α0(k),...,α
n-1
(k)将在每一采样时刻进行更新,这将确保观测信息得到充分利用。
[0293]
基于预测系统状态可通过递推获得
[0294][0295]
其中
[0296]
然后,fhocp问题1-1可以重写如下:
[0297]
问题1-1给定系统状态χ(k)和估计值找到最优控制输入序列
[0298][0299]
s.t.
[0300][0301][0302]
然而,由于存在非线性约束(42),因此高维优化问题1-1的解析解很难获得,只能通过某种迭代方法取得其近似数值解。因此,引入了一种新兴的随机优化技术——自适应矩估计(adam)算法来解决上述问题。其求解过程将在以下部分详细阐述。
[0303]
3、避障制导方法
[0304]
如果拦截器在命中目标前无需避开任何特定区域,mpc制导方法可以实现预期的拦截精度。然而,当在低空执行任务时,拦截器受到山区、敌方雷达或防空武器的威胁,如果不及时规避,将极大地危及拦截器的飞行安全。
[0305]
3.1基于速度障碍模型的单个障碍威胁评估
[0306]
作为一种经典的基于几何的避障方法,vo在处理障碍物为二维形式的情况时通常是有效的。它的基本原理是找到一组飞行角度的集合(碰撞锥),拦截器沿这些角度飞行时将与障碍物发生碰撞。然而,对于三维空间中不同形状的障碍物,很难确定碰撞锥的边界并建立其统一表达式。与传统的vo不同,我们基于拦截器相对于障碍物的运动建立了一个统一的函数来评估不同障碍物的威胁。任何可行的飞行角度都将被分配一个函数值,该函数值取决于碰撞是否会发生以及碰撞的严重程度。
[0307]
考虑到拦截器在惯性坐标系中的运动,如果拦截器没有进一步机动,根据式(7),γi的变化将如公式(44)所示。
[0308][0309]
这里,t的可行范围是(45).
[0310][0311]
从(45)中可以注意到,除了将拦截器的飞行高度限制在拦截器可能与障碍物碰撞的范围内的现有约束之外,还应针对拦截器在遇到障碍物之前击中目标的情况施加额外的约束,即t<t
go
(χ).
[0312]

[0313][0314]
则有
[0315][0316]
定义单个障碍的威胁函数为(48)
[0317][0318]
这样,拦截器沿当前航向进入障碍物的深度越深,障碍物的威胁就越大。如果拦截器在没有进一步机动的情况下未与障碍物相撞,障碍物威胁则为零。然而,由于t的可行范围涉及不同的情况,公式(48)中的值很难确定,因此将围绕其进行进一步的讨论。
[0319]
3.2威胁函数和代价函数的解析表达式
[0320]
为了获得的确切值,将与相关的所有可能情况总结如下:
[0321][0322]
附图4给出了上述情况的可视化表示。
[0323]
然后,根据一元二次函数的极值点与可行区间的端点之间的关系,如图5所示,
可以分段形式表示(50)。
[0324][0325]
附图5为关于威胁函数值的几种情况图
[0326]

[0327][0328]
其中为一较大正有理数。这样,ζi(χ,ωi)在任何可能情况下的取值可由(49),(50),(51)和(48)确定。
[0329]
避障的总代价被视为来自所有探测到的障碍物的威胁总和,(52)。使用下一采样时刻的预测系统状态,问题1-2的目标函数可以定义为(53).
[0330][0331][0332]
此处,可通过式(40)取得。在不同情况下的大致函数图像如附图6所示。
[0333]
最后,最优问题1-2可以改写如下:
[0334]
问题1-2给定系统状态χ(k)、估计值以及求解问题1-1获得的制导指令u
*
(k),找到最优避障-制导指令
[0335][0336]
s.t.
[0337]
[0338]
j2(χ(k),u
*
(k))>0
ꢀꢀꢀ
(56)
[0339]
4.3基于adam的最优制导避障算法
[0340]
当求解具有非线性约束(42)和非凸目标函数(53)的高维最优问题1-1和问题1-2时,经典的基于梯度的算法在接近最优解时往往收敛过缓,而基于群体智能的方法有时难以在群体大小和收敛速度之间找到平衡。
[0341]
adam作为深度学习领域的一种新兴算法,在解决凸和非凸优化问题方面具有突出优势,从而提高了目标函数在许多优化场景中的收敛速度。然而,受初始解的限制,adam在解决复杂的非凸问题时,仍可能像大多数基于单解的算法一样陷入局部最优,需要结合具体情况进一步改进。
[0342]
在这一部分中,为了在确保控制实时性的同时获得最优制导避障命令,进行了如下设计:
[0343]
(1)对于目标函数相对简单的高维最优问题1-1,使用基于单解的adam来寻找最优解u
*
(k)。考虑到系统的慢时变特性,最优解u
*
(k)更可能出现在其前一时刻对应解u
*
(k-1)的附近,因此选择前一时刻的制导指令u
*
(k-1)作为初始解,即(57).
[0344][0345]
其中是kronecker乘积的算子,1
p
×1是元素均为1的矩阵。
[0346]
(2)对于具有非凸目标函数的问题1-2,将adam扩展为基于种群的算法。为了扩大搜索区域并帮助跳出局部最优,在生成初始种群时采用了反向学习策略。反向学习策略是将所选个体的相反个体添加到初始群体,以应对初始解远离或位于最优解的相反位置的情况。
[0347]
为问题1-2选择的初始解是u
*
(k)和,[0,0]
t
其相反个体和-u
*
(k)也将被包括在初始种群中。因此,初始种群可以表示为(58).
[0348][0349]u(iter)
(p;k)和的更新规则是相同的,这里是为了统一描述,用向量替换u
(iter)
(p;k)和用j(u
(iter)
)替换问题1-1和问题1-2的目标函数,则u
(iter)
的更新过程可以描述为(59)~(64).
[0350]
(获取目标函数的梯度)
[0351][0352]
(更新有偏一阶矩估计值)
[0353]
η
(iter)
=β1η
(iter-1)
+(1-β1)g
(iter)
ꢀꢀꢀ
(60)
[0354]
(更新有偏二阶矩估计值)
[0355]
ν
(iter)
=β2ν
(iter-1)
+(1-β2)g
(iter)
⊙g(iter)
ꢀꢀꢀ
(61)
[0356]
(计算无偏一阶矩估计值)
[0357][0358]
(计算无偏二阶矩估计值)
polytechnical university,2020,38(5):977-986.]和apng[shen j.research on generalized guidance law of anti-tactical ballistic missiles[j].acta armamentarii,2015,36(s2):25-29.]的仿真结果进行了比较。
[0379]
试验例1(单障碍场景)
[0380]
在本部分中,拦截器将在每种工况下遇到三个典型障碍之一,以测试所提出的方法在处理简单场景时的性能。每种工况下障碍物的形状和位置如表1所示。
[0381]
表1示例1中障碍物的形状和位置
[0382][0383]
拦截器和目标在三种工况下的初始状态如表2所示。
[0384]
表2示例1中拦截器和目标的初始状态
[0385][0386]
在所有三种工况下,采样周期和预测时域的长度被设置为式(72)和式(73)。所提出方法的控制输入约束设置为u
max1
=0.05rad/s和u
max2
=0.1rad/s。拦截器对障碍物的探测范围(在apf方法中也称为排斥力范围)设置为400m,apng的比例因子设置为k1=10,k2=10。
[0387][0388][0389]
每种工况的仿真结果分别如图7-9、10-12和13-15所示。其中,图7、图10和图13显示了拦截器和目标的飞行轨迹,可以发现,使用所提出的避障-制导方法的拦截器比使用改进apf方法的拦截器具有更平滑的轨迹,并且在制导的最后阶段需要更少的修正机动动作。图8、图11和图14显示了拦截器和目标之间的距离变化,以及拦截器和障碍物之间距离的变化。就制导性能而言,所提出的方法在所有三种工况下都达到了最高的制导精度,其次是apng。改进apf方法排在最后,但其制导精度是可以接受的,这是因为使用apf方法的拦截器在制导的最后阶段进行大幅度机动动作以追击目标,如图9、12和15所示。然而,对于大多数机动能力有限的拦截器,进行瞬时角速度高达60rad/s(给定速度下过载最高可达240g)的机动是不切实际的,因此改进apf方法的实际制导精度可能远低于仿真结果。相比之下,使
用所提出方法的拦截器在整个制导过程中可将其控制输入保持在给定范围内。在避障性能方面,使用所提出的方法和使用改进apf方法的拦截器在所有三种工况下都成功地避免了碰撞,然而,在相同的探测范围设置下,使用所提方法的拦截器比使用apf的拦截器更早地执行避障机动,并且需要更小的控制输入。
[0390]
试验例2(多障碍场景)
[0391]
在试验例中,为每种工况(工况4、工况5和工况6)创建了具有多个障碍物的随机地形,以测试所提出的方法是否能否适应更复杂的场景。每种工况下的地形和目标机动输入如图16和17所示,三种工况下拦截器和目标的初始状态如表3所示,其他仿真参数与示例1相同。
[0392]
表3示例2中拦截器和目标的初始状态
[0393][0394]
每种工况的仿真结果分别如图18-21、22-25和26-29所示。其中,图18、22和26显示了拦截器和目标在3d空间中的飞行轨迹,其在平面zox上的投影如图19、23和27所示。图20、24和28显示了拦截器和目标之间距离的变化,以及拦截器和障碍物之间最小距离的变化。图21、25和29显示了不同方法控制输入的变化。可以发现,使用改进apf方法的拦截器在初始阶段更快地接近目标,而使用所提出的方法和apng的拦截器最终具有更小的脱靶距离。主要原因是,后两种方法更多地关注双方的未来运动,而前一种方法只考虑目标的当前位置,因此无法在最后阶段应对目标机动。还可以注意到,在工况5和工况6中,改进apf方法在处理重叠障碍物时无法解决局部最优的问题,因此拦截器无法进一步接近目标,而使用所提出方法的拦截器不仅成功地避免了多个重叠障碍物,还在所有三种工况下达到了最高的制导精度,这说明所提出的方法在面对复杂工况时更加鲁棒。此外,利用所提出的方法,拦截器的控制输入可以始终限制在给定范围内,这为将所提出的方法应用于其他类型的拦截器提供了条件。

技术特征:
1.一种针对机动目标的避障制导方法,其特征在于包括以下步骤:1)基于目标运动历史信息对目标机动造成的干扰进行估计,得到预测时域内的干扰估计值2)利用算法1求解有限时域最优控制问题1-1,得到最优制导指令u
*
(k),问题1-1的目标函数1设计如式(27)所示;3)根据触发条件j2(u
*
(k))=0判断u
*
(k)能否作为最终制导指令,若是,则令并转步骤5),若否,则执行步骤4),其中j2(
·
)如式(52)所示:4)利用算法2求解最优制导避障问题1-2,得到最优制导避障指令问题1-2的目标函数2定义为(53);5)输出作为当前采样时刻拦截器制导指令,当时间到达下一采样时刻k+1,令k=k+1并获取系统状态χ(k),若有则停止制导,若否,则继续制导并重复上述步骤。2.按照权利要求1所述的一种针对机动目标的避障制导方法,其特征在于步骤1)中所述得到预测时域内的干扰估计值的步骤为:首先,考虑到扰动无法直接观测,因此使用θ
t
和ψ
t
的前向差分代替,并将估计对象定义为其次,给定历史信息序列e(k-q),

,e(k-1),则e(k-q),

,e(k-1)与时间步1,

,q之间的函数关系可由非线性函数g(
·
)进行拟合根据拟合误差采取不同的方式进行估计,若拟合误差在指定范围内表明估计对象与时间有显著的相关性,则该函数可用于后续估计,并且有若拟合误差超出指定范围,表明函数g(
·
)不能很好地拟合上述关系,或者估计对象与时间之间的相关性很弱,那么基于估计对象在预测范围内保持不变的保守假设,只有最近的观测信息用于前馈补偿;
上述估计方法可以表示为:考虑到多项式在逼近连续函数方面的良好性能,选择多项式函数来拟合上述关系,其系数由最小二乘法确定,具有优化系数的多项式函数写成其中,n-1是多项式函数的次数,系数α0(k),


n-1
(k)将在每一采样时刻进行更新,确保观测信息得到充分利用。3.按照权利要求1所述的一种针对机动目标的避障制导方法,其特征在于目标函数1的推导过程如下:拦截器和目标在惯性坐标系中的运动学方程分别(1)为和(2)。拦截器和目标在惯性坐标系中的运动学方程分别(1)为和(2)。其中,下标m和t分别代表拦截器与目标,其航迹倾斜角分别为θ
m
和θ
t
,航迹偏转角为ψ
m
与ψ
t
,空速为v
m
、v
t
,选择式(3)作为制导系统状态向量;χ=[x
m
,y
m
,z
m

m

m
,x
t
,y
t
,z
t

t

t
]
t
ꢀꢀꢀꢀꢀꢀꢀꢀ
(3)则非线性系统可以由状态方程(4)、(5)进行描述:则非线性系统可以由状态方程(4)、(5)进行描述:其中是拦截器的控制输入,是目标机动形成的系统干扰;
零效脱靶量被定义为在目标继续沿其当前航向飞行且拦截器没有进一步修正机动的情况下,拦截器最终将错过目标的距离,在这种情况下,拦截器和目标之间的距离随时间的变化公式为(24);从(24)可以看出,拦截器在之后将不再继续接近目标,因此zem可以确定为双方在t
go
(χ)时的相对距离,根据二次函数的最值公式,该距离为并且有因此,基于zem的目标函数为4.按照权利要求1所述的一种针对机动目标的避障制导方法,其特征在于步骤2)中所述有限时域最优控制问题1-1是给定系统状态χ(k)和估计值找到最优控制输入序列s.t.s.t.5.按照权利要求4所述的一种针对机动目标的避障制导方法,其特征在于步骤2)中所述算法1的具体步骤为:step1初始化:设定算法参数k1,β1,β2,α,利用式(57)生成初始解u
(0)
(p;k),初始化一阶、二阶有偏矩估计,以及迭代次数iter=0;step2算法主循环:当时,执行step2.1~step2.4,否则执行step3step2.1利用(41),(42)计算j1(u
(iter)
(p;k)),利用(67)计算κ;
step2.2利用(59)~(64)更新u
(iter)
(p;k);获取目标函数的梯度g
(iter)


u
j(u
(iter-1)
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(59)更新有偏一阶矩估计值η
(iter)
=β1η
(iter-1)
+(1-β1)g
(iter)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(60)更新有偏二阶矩估计值ν
(iter)
=β2ν
(iter-1)
+(1-β2)g
(iter)

g
(iter)
ꢀꢀꢀꢀꢀꢀꢀꢀ
(61)计算无偏一阶矩估计值计算无偏二阶矩估计值更新u
(iter)
其中,对于向量的所有运算都是逐元素进行的,β1,β2∈(0,1]是矩估计的衰减率,α∈(0,1]是步长,是一个小的正有理数。初始有偏矩估计值满足此外,为了使满足迭代过程中的控制输入约束,引入了非线性饱和函数sat(
·
):step2.3利用(66)修正u
(iter)
(p;k);step2.4更新当前迭代次数为iter=iter+1;step3利用(70)确定最优解u
*
(p;k),取其首个分量作为u
*
(k);6.按照权利要求1所述的一种针对机动目标的避障制导方法,其特征在于步骤3)、步骤4)中的触发条件以及目标函数2的推导过程如下:为了在制导过程中避免地面障碍或空间区域,首先需要一种有效的建模方法,所有检测到的障碍物或敌方威胁区域都被视为可以适当包围它们的规则几何体,统一模型用公式(7)、(8)来描述;为了便于表达,所有障碍物、威胁区域和它们被视为的规则几何形状统称为障碍物;为了便于表达,所有障碍物、威胁区域和它们被视为的规则几何形状统称为障碍物;
其中是障碍物集合,(z
oi
,x
oi
)是障碍物o
i
的几何中心在zox上的投影,参数向量ω
i
决定o
i
的形状,并且有:考虑到拦截器在惯性坐标系中的运动,如果拦截器没有进一步机动,根据式(7),γ
i
的变化将如公式(44)所示;这里,t的可行范围是(45);从(45)中可以注意到,除了将拦截器的飞行高度限制在拦截器可能与障碍物碰撞的范围内的现有约束之外,还应针对拦截器在遇到障碍物之前击中目标的情况施加额外的约束,即t<t
go
(χ);令则有定义单个障碍的威胁函数为(48)拦截器沿当前航向进入障碍物的深度越深,障碍物的威胁就越大,如果拦截器在没有进一步机动的情况下未与障碍物相撞,障碍物威胁则为零,然而,由于t的可行范围涉及不同的情况,公式(48)中的很难确定,参见下述内容:威胁函数和代价函数的解析表达式为了获得的确切值,将与相关的所有可能情况总结如下:
然后,根据一元二次函数的极值点与可行区间的端点之间的关系,可以分段形式表示为(50);令其中为一较大正有理数。这样,ζ
i
(χ,ω
i
)在任何可能情况下的取值可由(49),(50),(51)和(48)确定;避障的总代价被视为来自所有探测到的障碍物的威胁总和,即(52),使用下一采样时刻的预测系统状态,问题1-2的目标函数可以定义为(53);2的目标函数可以定义为(53);此处,通过式(40)取得;
基于预测系统状态可通过递推获得其中7.按照权利要求1所述的一种针对机动目标的避障制导方法,其特征在于步骤4)中所述最优制导避障问题1-2是给定系统状态χ(k)、估计值以及求解问题1-1获得的制导指令u
*
(k),找到最优避障-制导指令s.t.j2(χ(k),u
*
(k))>0
ꢀꢀꢀꢀꢀ
(56)。8.按照权利要求1所述的一种针对机动目标的避障制导方法,其特征在于步骤4)中所述算法2的具体步骤为:step1初始化:设定算法参数k1,β1,β2,α,利用(58)生成初始解,α,利用(58)生成初始解step2对于种群中的任意个体,初始化其一阶、二阶有偏矩估计,以及迭代次数iter=0,当时,执行step2.1~step2.4,否则执行step3;step2.1利用(41),(42)计算利用(67)计算κ;s.t.s.t.step2.2利用(59)~(64)更新获取目标函数的梯度g
(iter)


u
j(u
(iter-1)
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(59)更新有偏一阶矩估计值η
(iter)
=β1η
(iter-1)
+(1-β1)g
(iter)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(60)更新有偏二阶矩估计值
ν
(iter)
=β2ν
(iter-1)
+(1-β2)g
(iter)

g
(iter)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(61)计算无偏一阶矩估计值计算无偏二阶矩估计值更新u
(iter)
其中,对于向量的所有运算都是逐元素进行的,β1,β2∈(0,1]是矩估计的衰减率,α∈(0,1]是步长,是一个小的正有理数。初始有偏矩估计值满足step2.3利用(66)修正step2.3利用(66)修正step2.4更新当前迭代次数为iter=iter+1;step3利用(70)确定个体最优利用(71)确定全局最优解利用(71)确定全局最优解利用(71)确定全局最优解

技术总结
本发明涉及一种针对机动目标的避障制导方法,属于避障制导方法技术领域。首先,为了实现精确制导的主要目标,开发了一种基于模型预测控制的制导方法,并提出了一种抑制目标机动干扰的估计方法。其次,为了在引导过程中避免障碍和威胁,通过将避障约束转化为具有触发条件的独立优化问题,设计了整体方案,并针对不同形状的障碍构建了统一的威胁函数用于避障决策。最后,针对所提出的制导避障方案,开发了一种改进的自适应矩估计(Adam)解算器,其解将作为实时制导指令。作为实时制导指令。作为实时制导指令。


技术研发人员:杨秀霞 张毅 姜子劼 杨林 于浩 李文强 王宏
受保护的技术使用者:中国人民解放军海军航空大学
技术研发日:2023.03.21
技术公布日:2023/9/23
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐