用于机弹对抗末端机动规避指标生成的神经网络建模方法

未命名 07-28 阅读：119 评论：0

1.本发明涉及机弹对抗决策领域，尤其是用于无人机与中远距空空导弹对抗末端机动规避指标生成的神经网络建模方法。

背景技术：

2.无人机规避中远距空空导弹问题是追逃对策的一种，导弹是追击者，其作战目标是在战术技术指标约束下命中目标，而无人机是逃逸者，其作战目标则是实施机动规避导弹攻击。随着现代高性能中远距空空导弹的不断出现，无人机的作战环境愈加恶劣，为了提高无人机的生存率，保障完成任务的可靠性，研究空战中如何使用高效的逃逸机动策略以提高无人机在高风险、快节奏、强对抗的机弹对抗环境中的生存能力，将成为应用无人机作战的重点问题之一。
3.在机弹对抗末端，无人机需要根据机动规避指标执行相应机动动作以规避来袭导弹攻击，传统的经验决策法、随机选择法等机动规避指标模糊，无法给出定量化的指标参数，难以适应瞬息万变的机弹对抗末端态势。用于机弹对抗末端机动规避指标生成的神经网络建模方法能够由实时的机弹相对态势关系生成明确的末端机动规避指标，进而实现无人机末端自主规避决策。

技术实现要素：

4.为了克服现有技术的不足，本发明提供一种用于机弹对抗末端机动规避指标生成的神经网络建模方法。本发明利用神经网络的非线性映射能力通过机弹相对态势生成无人机末端机动规避指标，以实现无人机末端自主规避决策，提高规避成功概率。
5.本发明解决其技术问题所采用的技术方案包括以下步骤：
6.步骤1：构建末端规避数据集；
7.(1.1)利用已有的机弹对抗仿真系统随机设定不同机弹初始态势，并进行机弹对抗过程仿真，记录末端规避启动时刻机弹相对态势数据；
8.(1.2)在同种态势下，无人机采用不同的机动规避指标进行规避，选择中远距空空导弹脱靶量最大的规避动作作为当前态势下无人机最优规避动作，并记录最优规避动作的机动规避指标；
9.重复步骤(1.1)和(1.2)的过程，直至获得大于100000条以上的不同态势下的最优规避动作指标数据，构成末端规避数据集，然后将末端规避数据集划分成训练集和测试集其中，n和m分别表示训练集和测试集中的样本个数；i表示单个样本中的特征参量个数；
10.步骤2：特征参量选取；
11.确定bp神经网络输入层和输出层的特征参量；
12.步骤3：数据预处理；
13.通过尺度变换，对特征参量的数值进行归一化处理，变换到[-1,1]区间内；
[0014]
步骤4：确定bp神经网络层级结构；
[0015]
构建bp神经网络通用模型；
[0016]
步骤5：bp神经网络模型训练，得到训练好的bp神经网络模型；
[0017]
步骤6：无人机利用训练好的bp神经网络模型根据末端相对态势生成机动规避指标，并执行相应机动动作以规避导弹攻击，若导弹脱靶量r
mis
大于杀伤半径r
kill
，则判定无人机成功规避，若导弹脱靶量r
mis
小于等于杀伤半径r
kill
，则规避失败。
[0018]
所述步骤1中，其中末端规避数据集的80％划分为训练集，末端规避数据集的20％划分为测试集。
[0019]
所述步骤2中，bp神经网络的输入为末端规避启动时刻机弹相对态势，如图1所示，机弹相对态势用机弹相对方位angle
mp
、机弹相对高度h
mp
、机弹相对距离r
mp
和机弹相对速度v
mp
4个特征参量进行表示；规避动作由侧向过载角度n
angle
，侧向过载大小n
num
和侧向过载持续时间n
time
3个机动规避指标决定，侧向过载角度n
angle
作为bp神经网络的输出，侧向过载大小n
num
和侧向过载持续时间n
time
作为末端规避动作的约束条件。
[0020]
所述步骤3中，通过尺度变换，对特征参量的数值进行归一化处理，变换到[-1,1]区间内，具体公式为其中，x
′
、x分别为每组样本中的特征参量的数值归一化后和归一化前的值，特征参量的数值为bp神经网络输入的机弹相对态势中的angle
mp
、h
mp
、r
mp
、v
mp
和n
angle
；x
max
、x
min
分别为x同一个特征参量的数值的最大值和最小值。
[0021]
所述步骤4中，构建bp神经网络通用模型的网络拓扑结构包括1层输入层、3层隐含层和1层输出层；bp神经网络模型为：输入层向量x＝(x1,x2,
…
,xn)
t
，n为输入层神经元个数；隐含层向量数；隐含层向量m为隐含层神经元个数；输出层向量a＝(a1,a2,
…
,ak)
t
，k为输出层神经元个数。
[0022]
所述步骤5中，(5.1)将神经网络的权值和阈值均初始化为(-1,1)区间内的随机数，从训练集中选择第g个样本并计算输出值，g＝0,1,
…
,n，则bp神经网络模型各层的输出值公式为其中，表示神经网络第l层第i个神经元与第l+1层第j个神经元之间的权值；表示神经网络第l层第i个神经元的输出值；表示神经网络第l+1层第j个神经元的阈值；表示神经网络第l+1层第j个神经元的输出值；神经网络各层之间采用的激活函数为f(x)＝(1-e-2x
)/(1+e-2x
)；
[0023]
(5.2)设定神经网络的学习速率采用最小均方误差函数作为损失函数，计算输出值和实际值的误差，最小均方误差函数为其中，k＝1,2,
…
,n，n为训练集样本个数；ak、tk分别为网络输出值和网络实际值；然后再根据最小均方误差e进行反向传递，并根据链式求导法则逐层进行权值和阈值和修正；训练过程中，神经网络的权值和阈值按照梯度下降算法进行更新，更新公式为：
[0024][0025]
其中，表示损失函数对权值的误差梯度；表示损失函数对阈值的误差梯度；分别表示更新前的权值和阈值；分别表示更新后的权值和阈值；
[0026]
(5.3)从训练集中选取新的样本重复步骤5.1和步骤5.2的操作，直至训练集中的所有样本训练完毕，并获得训练后的bp神经网络模型；然后将测试集q中的样本数据输入到训练后的bp神经网络模型，将计算出来的输出值与测试集中的实际值进行对比，求样本误差：
[0027][0028]
其中，rm表示测试集中第m个样本的输出值；dm表示测试集中第m个样本的实际值；
[0029]
(5.4)若满足样本误差e≤5％的测试样本占总测试样本数量的比值为p，且p大于等于阈值λ，则bp神经网络模型的精度符合要求，保存此时的bp神经网络模型，并结束训练过程，进入步骤6；若比值p小于阈值λ，则训练的bp神经网络模型的精度没有达到指定的要求，再次判定此时是否达到bp神经网络模型最大训练次数n，如果没有达到bp神经网络模型最大训练次数n，则继续训练，如果此时已经达到bp神经网络模型最大训练次数n，说明模型在达到最大训练次数后仍不满足精度要求，则重新进入步骤5对模型参数进行初始化并对模型进行重新训练。
[0030]
所述神经网络学习速率
[0031]
所述阈值λ＝0.85。
[0032]
所述最大训练次数n＝1000。
[0033]
本发明的有益效果在于提出了一种用于机弹对抗末端机动规避指标生成的神经网络建模方法，通过对末端规避数据集进行学习，实现了从机弹相对态势输入到机动规避指标输出的映射关系，无人机只需要利用训练好的神经网络模型即可进行末端自主规避决策。与随机选择法和经验决策法相比，机动规避指标明确，且生成机动规避指标的时间短，满足实时性和有效性要求。
附图说明
[0034]
图1为末端规避启动时刻机弹相对态势示意图。
[0035]
图2为bp神经网络模型构建及训练流程图。
[0036]
图3为bp神经网络拓扑结构图。
[0037]
图4为机弹对抗全过程飞行轨迹示意图。
[0038]
图5为末端飞行轨迹示意图。
具体实施方式
[0039]
下面结合附图和实施例对本发明进一步说明。
[0040]
如图2所示，本发明的实例包括以下几个步骤：
[0041]
步骤1.构建末端规避数据集。如图1所示，利用已有的机弹对抗仿真系统随机设定不同机弹初始距离(15km-60km)、机弹初始方位(0
°‑
360
°
)、导弹初始高度和速度(5km-15km，0.9ma-1.5ma)、无人机初始高度和速度(5km-15km，0.5ma-0.8ma)并进行机弹对抗过程仿真，记录末端规避启动时刻机弹相对态势数据；同种态势下，选择中远距空空导弹脱靶量最大的规避动作作为当前态势下无人机最优规避动作，并记录最优规避动作的机动规避指标。计算机弹对抗飞行轨迹约20万条，构成末端规避数据集，其中80％划分为训练集p、20％划分为测试集q。
[0042]
步骤2.特征参量选取；
[0043]
bp神经网络输入层的特征参量为机弹相对方位angle
mp
、机弹相对高度h
mp
、机弹相对距离r
mp
、机弹相对速度v
mp
；输出层的特征参量为侧向过载角度n
angle
；侧向过载大小n
num
和侧向过载持续时间n
time
指标作为末端规避动作的约束条件，即
[0044]
步骤3.数据预处理；
[0045]
对bp神经网络的输入和输出数据全部进行归一化处理，将其变换到[-1,1]区间内，具体公式为其中，angle
′
mp
、h
′
mp
、r
′
mp
、v
′
mp
、n
′
angle
分别为归一化后的机弹相对方位、机弹相对高度、机弹相对距离、机弹相对速度和侧向过载角度。
[0046]
步骤4.确定bp神经网络层级结构；
[0047]
构建bp神经网络模型，网络拓扑结构为1层输入层、3层隐含层和1层输出层，输入层神经元个数n＝4，隐含层神经元个数m＝10，输出层神经元个数k＝1，bp神经网络拓扑结构如图3所示。bp神经网络模型为：输入层向量x＝(x1,x2,x3,x4)
t
；隐含层向量输出层向量a＝a1；
[0048]
步骤5.bp神经网络模型训练；
[0049]
(5.1)采用(-1,1)区间内的随机数初始化神经网络的权值和阈值，从训练集中选择第一个样本并计算输出值，bp神经网络模型各层的输出值公式为
其中，表示神经网络第l层第i个神经元与第l+1层第j个神经元之间的权值；表示神经网络第l层第i个神经元的输出值；表示神经网络第l+1层第j个神经元的阈值；表示神经网络第l+1层第j个神经元的输出值；神经网络各层之间采用的激活函数为f(x)＝(1-e-2x
)/(1+e-2x
)；
[0050]
(5.2)设定神经网络学习速率采用最小均方误差函数作为损失函数计算输出值和实际值的误差，其中，k＝1,2,
…
,n，n为训练集样本个数；ak、tk分别为网络输出值和实际值。然后再根据误差进行反向传递，逐层进行权值和阈值的修正。训练过程中，神经网络的权值和阈值按照梯度下降算法进行更新，公式为其中，表示损失函数对权值的误差梯度；表示损失函数对阈值的误差梯度；分别表示更新前的权值和阈值；分别表示更新后的权值和阈值；
[0051]
(5.3)从训练集中选取新的样本重复步骤5.1至步骤5.2，直至训练集中的所有样本训练完毕；然后将测试集q中的样本数据输入bp神经网络模型，将计算出来的输出值与测试集实际值进行对比，求样本误差其中，rm表示测试集中第m个样本的输出值；dm表示测试集中第m个样本的实际值；
[0052]
(4)设定阈值λ＝0.85，最大训练次数n＝1000，在21350个测试样本中，e≤5％的测试样本有18956个，占总测试样本数量的比值p＝0.89，大于阈值λ，因此bp神经网络模型的精度符合要求，保存此时的bp神经网络模型，并结束训练过程。
[0053]
步骤6.无人机利用训练好的bp神经网络模型根据末端相对态势生成机动规避指标，并执行相应机动动作以规避导弹攻击。导弹杀伤半径r
kill
＝10m，机弹初始距离35264m，机弹初始方位37
°
，无人机初始高度7120m、速度0.62ma，导弹初始高度8426m、速度0.93ma。无人机在机弹相遇前1.61s进行规避，末端规避启动时刻机弹相对态势为利用bp神经网络模型生成的机动规避指标为无人机执行相应机动动作规避导弹攻击，最终脱靶量r
mis
＝37.51m，无人机成功规避。机弹对抗全过程飞行轨迹如图4所示，末端飞行轨迹如图5所示。

技术特征：
1.一种用于机弹对抗末端机动规避指标生成的神经网络建模方法，其特征在于包括下述步骤：步骤1：构建末端规避数据集；(1.1)利用已有的机弹对抗仿真系统随机设定不同机弹初始态势，并进行机弹对抗过程仿真，记录末端规避启动时刻机弹相对态势数据；(1.2)在同种态势下，无人机采用不同的机动规避指标进行规避，选择中远距空空导弹脱靶量最大的规避动作作为当前态势下无人机最优规避动作，并记录最优规避动作的机动规避指标；重复步骤(1.1)和(1.2)的过程，直至获得大于100000条以上的不同态势下的最优规避动作指标数据，构成末端规避数据集，然后将末端规避数据集划分成训练集和测试集其中，n和m分别表示训练集和测试集中的样本个数；i表示单个样本中的特征参量个数；步骤2：特征参量选取；确定bp神经网络输入层和输出层的特征参量；步骤3：数据预处理；通过尺度变换，对特征参量的数值进行归一化处理，变换到[-1,1]区间内；步骤4：确定bp神经网络层级结构；构建bp神经网络通用模型；步骤5：bp神经网络模型训练，得到训练好的bp神经网络模型；步骤6：无人机利用训练好的bp神经网络模型根据末端相对态势生成机动规避指标，并执行相应机动动作以规避导弹攻击，若导弹脱靶量r
mis
大于杀伤半径r
kill
，则判定无人机成功规避，若导弹脱靶量r
mis
小于等于杀伤半径r
kill
，则规避失败。2.根据权利要求1所述的其特征在于包括下述步骤，其特征在于：所述步骤1中，其中末端规避数据集的80％划分为训练集，末端规避数据集的20％划分为测试集。3.根据权利要求1所述的其特征在于包括下述步骤，其特征在于：所述步骤2中，bp神经网络的输入为末端规避启动时刻机弹相对态势，机弹相对态势用机弹相对方位angle
mp
、机弹相对高度h
mp
、机弹相对距离r
mp
和机弹相对速度v
mp
4个特征参量进行表示；规避动作由侧向过载角度n
angle
，侧向过载大小n
num
和侧向过载持续时间n
time
3个机动规避指标决定，侧向过载角度n
angle
作为bp神经网络的输出，侧向过载大小n
num
和侧向过载持续时间n
time
作为末端规避动作的约束条件。4.根据权利要求1所述的其特征在于包括下述步骤，其特征在于：所述步骤3中，通过尺度变换，对特征参量的数值进行归一化处理，变换到[-1,1]区间内，具体公式为其中，x
′
、x分别为每组样本中的特征参量的数值归一化后和归一化前的值，特征参量的数值为bp神经网络输入的机弹相对态势中的
angle
mp
、h
mp
、r
mp
、v
mp
和n
angle
；x
max
、x
min
分别为x同一个特征参量的数值的最大值和最小值。5.根据权利要求1所述的其特征在于包括下述步骤，其特征在于：所述步骤4中，构建bp神经网络通用模型的网络拓扑结构包括1层输入层、3层隐含层和1层输出层；bp神经网络模型为：输入层向量x＝(x1,x2,
…
,x
n
)
t
，n为输入层神经元个数；隐含层向量含层向量m为隐含层神经元个数；输出层向量a＝(a1,a2,
…
,a
k
)
t
，k为输出层神经元个数。6.根据权利要求1所述的其特征在于包括下述步骤，其特征在于：所述步骤5中，(5.1)将神经网络的权值和阈值均初始化为(-1,1)区间内的随机数，从训练集中选择第g个样本并计算输出值，g＝0,1,
…
,n，则bp神经网络模型各层的输出值公式为其中，表示神经网络第l层第i个神经元与第l+1层第j个神经元之间的权值；表示神经网络第l层第i个神经元的输出值；表示神经网络第l+1层第j个神经元的阈值；表示神经网络第l+1层第j个神经元的输出值；神经网络各层之间采用的激活函数为f(x)＝(1-e-2x
)/(1+e-2x
)；(5.2)设定神经网络的学习速率采用最小均方误差函数作为损失函数，计算输出值和实际值的误差，最小均方误差函数为其中，k＝1,2,
…
,n，n为训练集样本个数；a
k
、t
k
分别为网络输出值和网络实际值；然后再根据最小均方误差e进行反向传递，并根据链式求导法则逐层进行权值和阈值和修正；训练过程中，神经网络的权值和阈值按照梯度下降算法进行更新，更新公式为：其中，表示损失函数对权值的误差梯度；表示损失函数对阈值的误差梯度；分别表示更新前的权值和阈值；分别表示更新后的权值和阈值；(5.3)从训练集中选取新的样本重复步骤5.1和步骤5.2的操作，直至训练集中的所有样本训练完毕，并获得训练后的bp神经网络模型；然后将测试集q中的样本数据输入到训练后的bp神经网络模型，将计算出来的输出值与测试集中的实际值进行对比，求样本误差：其中，r
m
表示测试集中第m个样本的输出值；d
m
表示测试集中第m个样本的实际值；(5.4)若满足样本误差e≤5％的测试样本占总测试样本数量的比值为p，且p大于等于阈值λ，则bp神经网络模型的精度符合要求，保存此时的bp神经网络模型，并结束训练过程，进入步骤6；若比值p小于阈值λ，则训练的bp神经网络模型的精度没有达到指定的要求，再
次判定此时是否达到bp神经网络模型最大训练次数n，如果没有达到bp神经网络模型最大训练次数n，则继续训练，如果此时已经达到bp神经网络模型最大训练次数n，说明模型在达到最大训练次数后仍不满足精度要求，则重新进入步骤5对模型参数进行初始化并对模型进行重新训练。7.根据权利要求6所述的其特征在于包括下述步骤，其特征在于：所述神经网络学习速率8.根据权利要求6所述的其特征在于包括下述步骤，其特征在于：所述阈值λ＝0.85。9.根据权利要求6所述的其特征在于包括下述步骤，其特征在于：所述最大训练次数n＝1000。

技术总结
本发明提供了一种用于机弹对抗末端机动规避指标生成的神经网络建模方法，构建末端规避数据集，确定BP神经网络输入层和输出层的特征参量，通过尺度变换，对特征参量的数值进行归一化处理，构建BP神经网络通用模型，并训练BP神经网络模型，无人机利用训练好的BP神经网络模型根据末端相对态势生成机动规避指标，并执行相应机动动作以规避导弹攻击。本发明利用神经网络的非线性映射能力通过机弹相对态势生成无人机末端机动规避指标，以实现无人机末端自主规避决策，提高规避成功概率，与随机选择法和经验决策法相比，机动规避指标明确，且生成机动规避指标的时间短，满足实时性和有效性要求。性要求。性要求。

技术研发人员：毕文豪毛泽铭张安杨忠杰
受保护的技术使用者：西北工业大学
技术研发日：2023.05.04
技术公布日：2023/7/27

版权声明

本文仅代表作者观点，不代表航空之家立场。
本文系作者授权航家号发表，未经原创作者书面授权，任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时，须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的，航空之家将依法追究其法律责任。（航空之家官方QQ：2926969996）

飞行汽车 https://www.autovtol.com/

上一篇：一种铲运车功能闭锁控制系统的制作方法 下一篇：一种全方位立体型品牌标识的制作方法

用于机弹对抗末端机动规避指标生成的神经网络建模方法

版权声明

航空之家

相关推荐

文章排行

最近发表

标签列表

用于机弹对抗末端机动规避指标生成的神经网络建模方法

版权声明

相关文章

航空之家

相关推荐

文章排行

最近发表

标签列表