一种基于序贯归纳法的雷达/干扰对抗均衡策略设计方法

未命名 07-18 阅读：124 评论：0

1.本发明属于雷达技术领域，具体涉及一种基于序贯归纳法的雷达/干扰对抗均衡策略设计方法。

背景技术：

2.主瓣干扰已成为雷达的一个严重威胁。针对该干扰，大多数空域滤波技术及被动抗干扰技术效率低下，因此研究双方在频率域的对抗以及设计雷达主动抗干扰策略至关重要。
3.雷达频率捷变作为一种主动抗主瓣干扰技术，受到了越来越多的关注。与此同时，干扰机可用的技术也在不断改进，使得同一台干扰机可同时装备多种干扰模式。双方之间的竞争日益激烈。博弈论是一个分析决策者交互过程的有效工具，基于博弈论分析雷达和干扰机之间的对抗过程并设计雷达的抗干扰策略是可行的。
4.现有技术中，基于博弈论进行雷达和干扰机策略设计存在以下局限：
5.其一、基于静态博弈对雷达和干扰机建模，忽略了双方之间的动态交互过程，无法表征雷达和干扰机之间序列决策这一现实需要。
6.其二、基于动态博弈对雷达和干扰机建模，这类研究所得的策略通常将动作概率分布与历史状态耦合，该类策略在执行过程中需要给不同的雷达状态分配不同的策略，不利于雷达统一决策。
7.其三、忽视了雷达和干扰机同时行动的特点和多回合交互的特点中的任意一个，因而无法对雷达和干扰机交互过程进行准确建模。
8.因此，有必要设计一种基于序贯归纳法的雷达/干扰对抗均衡策略设计方法，以解决上述技术问题。

技术实现要素：

9.为了解决现有技术中存在的上述问题，本发明提供了一种基于序贯归纳法的雷达/干扰对抗均衡策略设计方法。本发明要解决的技术问题通过以下技术方案实现：
10.一种基于序贯归纳法的雷达/干扰对抗均衡策略设计方法，所述设计方法包括：
11.步骤1、将雷达和干扰机定义为博弈的两个玩家，其中，在每个脉冲中，雷达和干扰机同时行动，所述博弈对应的博弈树的元素包括动作集合、博弈结束时的收益函数；
12.步骤2、通过序贯归纳法得到所述雷达和干扰机的均衡策略，以确定频率捷变雷达抗主瓣干扰策略。
13.在本发明的一个实施例中，所述雷达包括脉内跳频雷达，所述干扰机包括收发分时体制的干扰机。
14.在本发明的一个实施例中，脉内跳频雷达在一个cpi内发射的信号表示为：
15.16.其中，tr是雷达脉冲重复间隔，p是一个cpi内的脉冲数，s
p
(t)是第p个脉冲的信号，s
p
(t)表示为：
[0017][0018]
其中，a(t)是复包络，rect(x)为矩形脉冲，当x属于[0,1]时为1，否则为0，是雷达第p个脉冲第k个子脉冲的载频，雷达每个子脉冲有q个可选频点，f
q-1
是雷达子脉冲第q-1个可选频点，k是一个脉冲内子脉冲的数量，t
sub
是雷达的子脉冲宽度；
[0019]
第p个脉冲下雷达的动作表示为：
[0020][0021]
雷达的动作集合表示为：
[0022][0023]
其中，
×
表示笛卡尔乘积。
[0024]
在本发明的一个实施例中，干扰机对应于雷达一个cpi内p个脉冲的干扰信号表示为：
[0025][0026]
其中，j
p
(t)是相对于雷达第p个脉冲的干扰信号；
[0027]
干扰机的动作集合表示为：
[0028][0029]
其中，spot是瞄准式压制干扰，band是宽带阻塞式压制干扰，sweep是扫频式压制干扰，{mcj}是多频点压制干扰的集合，advanced是先进型瞄准式压制干扰，是干扰机发射以fq为载频的窄带噪声压制干扰信号fq∈{f0,f1,...,f
q-1
}，fq是频率。
[0030]
在本发明的一个实施例中，所述雷达的收益函数的计算方法为：
[0031]
s1、当雷达收到多个子脉冲回波时，将干信比大于阈值的子脉冲舍弃；
[0032]
s2、按照频率对剩余的子脉冲进行分组，将同一个频率的子脉冲分为一组，并对每个组内的子脉冲进行相干积累，频率为fq的子脉冲的相干积累结果为rq；
[0033]
s3、基于相干积累结果计算恒虚警检测门限t，计算公式为：
[0034][0035]
其中，pf是雷达虚警概率，sinrq是频率fq的子脉冲的信干噪比，q是雷达每个子脉冲可选频点的个数，pr是事件的概率；
[0036]
s4、基于步骤s3的恒虚警检测门限t计算检测概率，并将检测概率作为收益函数，检测概率的计算公式为：
[0037][0038]
其中，pd是雷达检测概率。
[0039]
在本发明的一个实施例中，所述干扰机的收益函数为所述雷达的收益函数的相反数。
[0040]
在本发明的一个实施例中，所述步骤2包括：
[0041]
步骤2.1、初始化雷达在cpi内的脉冲数p，雷达和干扰机的动作集合分别为
[0042]
步骤2.2、对cpi内的每个脉冲，构建形状为行列的矩阵其中，矩阵初始为全零矩阵，和分别为雷达和干扰机动作的个数；
[0043]
步骤2.3、若当前脉冲为第一个脉冲，则跳转至步骤2.4，若当前脉冲不为第一个脉冲，则跳转至步骤2.5；
[0044]
步骤2.4、计算雷达和干扰机对应的当前动作组合(ar,aj)的收益，并将所计算的雷达的收益结果填入矩阵直至处理完所有的动作组合，之后跳转至步骤2.9，其中，
[0045]
步骤2.5、计算历史动作组合的发生概率，历史动作组合的发生概率的计算公式为：
[0046][0047]
其中，p(h)是历史动作组合的发生概率，是历史动作组合所处脉冲的序号，是第个脉冲下雷达采取动作ar的概率，是第个脉冲下干扰机采取动作aj的概率，
[0048]
步骤2.6、构建形状为行列的矩阵矩阵初始为全零矩阵；
[0049]
步骤2.7、计算某一历史动作组合及当前动作组合的收益，并将收益乘以对应历史动作组合的发生概率，将得到的结果填入矩阵对应的位置，直至该历史动作组合与所有当前动作组合对应的结果均填入矩阵对应的位置，之后跳转至步骤2.5，执行下一组历史动作组合，直至所有历史动作组合均执行完毕，完成矩阵的填入；
[0050]
步骤2.8、根据步骤2.7得到的矩阵和历史动作组合的发生概率得到矩阵计算公式为：
[0051][0052]
步骤2.9、求解步骤2.4或者步骤2.8的矩阵得到当前脉冲的策略p表示第p个脉冲，σ
p
是第p个脉冲内雷达和干扰机的策略对，是第p个脉
冲内雷达的策略，是第p个脉冲内干扰机的策略；
[0053]
步骤2.8、判断当前脉冲是否为最后一个脉冲，若否，则跳转至步骤2.2，若是，则输出所得策略σ＝(σ1,σ2,...,σ
p
)。
[0054]
在本发明的一个实施例中，在步骤2之后，还包括：
[0055]
步骤3、验证所述步骤2所得的干扰策略的有效性。
[0056]
本发明的有益效果：
[0057]
1、本发明考虑的雷达和干扰机具备相同智能水平，同时干扰机具备多种干扰机类型，对干扰机的建模更加准确。
[0058]
2、本发明同时考虑了雷达和干扰机同时行动的特点和多回合交互的特点，对雷达和干扰机交互过程的建模更加准确。
[0059]
3、本发明将雷达和干扰机的均衡策略求解为一个脉冲对应一个动作概率分布，降低了雷达和干扰机的均衡策略耦合历史动作的复杂性。
附图说明
[0060]
图1是本发明实施例提供的一种基于序贯归纳法的雷达/干扰对抗均衡策略设计方法的流程示意图；
[0061]
图2是本发明实施例提供的雷达脉冲信号示意图。
[0062]
图3是本发明实施例提供的阶段数为2的含同时行动的两人零和扩展形式博弈的博弈树。
具体实施方式
[0063]
下面结合具体实施例对本发明做进一步详细的描述，但本发明的实施方式不限于此。
[0064]
实施例一
[0065]
请参见图1，图1是本发明实施例提供的一种基于序贯归纳法的雷达/干扰对抗均衡策略设计方法的流程示意图。本发明提供一种基于序贯归纳法的雷达/干扰对抗均衡策略设计方法，该设计方法包括：
[0066]
步骤1、将雷达和干扰机定义为博弈的两个玩家，其中，在每个脉冲中，雷达和干扰机同时行动，博弈对应的博弈树的元素包括动作集合、博弈结束时的收益函数。
[0067]
这里，请参见图2，雷达是脉内跳频雷达，发射的单个脉冲包含多个子脉冲，当雷达接收到一个相干处理间隔(coherent processing interval，cpi)内的多个脉冲信号之后，雷达对多个脉冲信号进行统一处理，雷达采取的动作为各个子脉冲的载频序列；干扰机是收发分时体制，可发射不同种类的压制式干扰信号，包括瞄准式压制干扰信号、宽带阻塞压制干扰信号、点频干扰信号等，注意到，由于干扰机发射干扰信号的载频有时会依据其所截获到的雷达信号的载频，所以同一种信号类型会对应不同的频率分布，干扰机采取的行动为不同频率下的压制式干扰信号类型。
[0068]
接下来，介绍雷达和干扰机的信号模型及博弈树的各个元素，博弈对应的博弈树的元素包括动作集合、博弈结束时的收益函数。
[0069]
具体而言，脉内跳频雷达在一个cpi内发射的信号表示为：
[0070][0071]
其中，tr是雷达脉冲重复间隔，p是一个cpi内的脉冲数，s
p
(t)是第p个脉冲的信号，s
p
(t)表示为：
[0072][0073]
其中，a(t)是复包络，通常使用线性调频信号，rect(x)为矩形脉冲，当x属于[0,1]时为1，否则为0，是雷达第p个脉冲第k个子脉冲的载频，雷达每个子脉冲有q个可选频点，f
q-1
是雷达第q-1个可选频点，k是一个脉冲内子脉冲的数量，t
sub
是雷达的子脉冲宽度；
[0074]
第p个脉冲下雷达的动作表示为：
[0075][0076]
雷达的动作集合表示为：
[0077][0078]
其中，
×
表示笛卡尔乘积。
[0079]
具体而言，干扰机对应于雷达一个cpi内p个脉冲的干扰信号表示为：
[0080][0081]
其中，j
p
(t)是相对于雷达第p个脉冲的干扰信号，可以具备多种干扰样式，包括瞄准式压制干扰(spot)，宽带阻塞式压制干扰(band)，点频式压制干扰(pf)，扫频式压制干扰(sweep)，多频点压制干扰(mcj)，先进型瞄准式压制干扰(advanced)等，其中先进型瞄准式压制干扰是指截获时间长于瞄准式干扰，并对截获到的信息进行分析，然后再选择干扰信号载频的一种干扰类型，这种干扰类型可以有效预防雷达存在欺骗脉冲使得瞄准干扰失效的情况。
[0082]
综上，干扰机的动作集合表示为：
[0083][0084]
其中，spot是瞄准式压制干扰，band是宽带阻塞式压制干扰，sweep是扫频式压制干扰，advanced是先进型瞄准式压制干扰，是干扰机发射以fq为载频的窄带噪声压制干扰信号fq∈{f0,f1,...,f
q-1
}，fq是频率，而由于多频点压制干扰中干扰机对多个频点的选择会形成不同的选择结果，所以{mcj}是一个集合，{mcj}是多频点压制干扰的集合。
[0085]
具体而言，雷达和干扰机博弈结果的收益函数需要表征双方对不同动作的不同偏好，因此收益函数计算方法不唯一。本发明通过计算检测概率作为博弈收益函数，雷达的收益函数的计算方法为：
[0086]
s1、当雷达收到多个子脉冲回波时，将干信大于阈值的子脉冲舍弃；其中，该阈值可以根据实际需求设定，本发明对此不作具体限定。
[0087]
s2、按照频率对子脉冲进行分组，将同一个频率的子脉冲分为一组，并对每个组内的子脉冲进行相干积累，频率为fq的子脉冲的相干积累结果为rq，其中，fq∈{f0,f1,...,f
q-1
}；
[0088]
s3、基于相干积累结果计算恒虚警检测门限t，计算公式为：
[0089][0090]
其中，pf是雷达虚警概率，sinrq是频率fq的子脉冲的信干噪比，q是雷达每个子脉冲可选频点的个数，pr是事件的概率；
[0091]
s4、基于步骤s3的恒虚警检测门限t计算检测概率，并将检测概率作为收益函数，检测概率的计算公式为：
[0092][0093]
其中，pd是雷达检测概率。
[0094]
在本实施例中，不同频率的回波信干噪比不同，这将对最终检测概率的贡献不一样，所以双方的策略会对不同动作有不同的偏好。
[0095]
再接下来，构建含同时行动的两人零和(即两个人对弈，各自收益之和为0)扩展形式博弈。
[0096]
这里，雷达和干扰机之间的交互是通过一系列脉冲来完成的，因此在时间上是有次序关系的；在每个脉冲中，雷达和干扰机同时行动，使得双方不可能知道对手的当前行动，但可以确定对手的历史行动；同时由于干扰机和雷达的严格竞争关系，干扰机的收益函数可以设置为雷达收益函数的相反数，因此，将整个博弈过程建模为含同时行动的两人零和扩展形式博弈，并构建如图3所示的博弈树，图中每个空心圆圈表示一个历史节点，在该节点上雷达和干扰机同时采取行动，设雷达和干扰机的行动表示为其中p表示阶段数，m,n是雷达和干扰机的动作个数。双方采取行动之后，到达下一个历史节点。当两个阶段的动作采取完毕之后，到达终止节点，利用上述的收益函数计算方式计算到达该终止节点的过程中双方所有动作给雷达带来的收益，附图3中只给出了雷达的收益，干扰机的收益可通过对雷达收益取相反数获得。
[0097]
步骤2、通过序贯归纳法得到雷达和干扰机的均衡策略，以确定频率捷变雷达抗主瓣干扰策略。
[0098]
在一个具体实施例中，步骤2可以包括：
[0099]
步骤2.1、初始化雷达在cpi内的脉冲数p，雷达和干扰机的动作集合分别为
[0100]
步骤2.2、对cpi内的每个脉冲，构建形状为行列的矩阵其中，矩阵初始为全零矩阵，和分别为雷达和干扰机动作的个数；
[0101]
步骤2.3、若当前脉冲为第一个脉冲，则跳转至步骤2.4，若当前脉冲不为第一个脉冲，则跳转至步骤2.5；
[0102]
步骤2.4、利用上述计算收益的方式计算雷达和干扰机对应的当前动作组合(ar,aj)的收益，并将所计算的雷达的收益结果填入矩阵直至处理完所有的动作组合，之后跳转至步骤2.9，其中，
[0103]
步骤2.5、计算某一历史动作组合的发生概率，历史动作组合的发生概率的计算公式为：
[0104][0105]
其中，p(h)是历史动作组合的发生概率，是历史动作组合所处脉冲的序号，是第个脉冲下雷达采取动作ar的概率，是第个脉冲下干扰机采取动作aj的概率，
[0106]
步骤2.6、构建形状为行列的矩阵矩阵初始为全零矩阵；
[0107]
步骤2.7、利用上述计算收益的方式计算某一历史动作组合及当前动作组合(ar,aj)(即当前需要处理的动作组合)的收益并将收益乘以对应历史动作组合的发生概率，得到u(h,ar,aj)p(h)，将得到的结果填入矩阵对应的位置，直至该历史动作组合与所有当前动作组合对应的结果均填入矩阵对应的位置，之后跳转至步骤2.5，直至所有历史动作组合均执行完毕，完成矩阵的填入；
[0108]
步骤2.8、根据步骤2.7得到的矩阵和历史动作组合的发生概率得到矩阵计算公式为：
[0109][0110]
步骤2.9、求解步骤2.4或者步骤2.8的矩阵得到当前脉冲的策略p表示第p个脉冲，σ
p
是第p个脉冲内雷达和干扰机的策略对，是第p个脉冲内雷达的策略，是第p个脉冲内干扰机的策略，具体利用下式求解：
[0111][0112][0113]
其中，是一个所有元素和为1的行向量的集合，表征雷达采取各个动作的概率，是一个所有元素和为1的行向量的集合，表征干扰机采取各个动作的概率。
[0114]
步骤2.8、判断当前脉冲是否为最后一个脉冲，若否，则跳转至步骤2.2，若是，则输出所得策略σ＝(σ1,σ2,...,σ
p
)。
[0115]
对于本发明而言，在步骤2之后，还可以包括：
[0116]
步骤3、验证步骤2所得的干扰策略的有效性。
[0117]
在一个具体实施例中，步骤3可以包括：
[0118]
步骤3.1、列举一些常见的雷达抗干扰策略以及干扰机干扰策略；
[0119]
步骤3.2、雷达和干扰机某一方采用步骤2所得的策略，另一方采用常见策略；
[0120]
步骤3.3、双方各自采取步骤3.2中的策略进行博弈，记录最终的收益g1；
[0121]
步骤3.4、雷达和干扰机均采用步骤2所得策略；
[0122]
步骤3.5：双方各自采取步骤3.4中的策略进行博弈，记录最终的收益g2；
[0123]
步骤3.6：通过比较g1和g2的大小，得出本文所提策略的有效性。
[0124]
下面通过仿真实验对上述基于序贯归纳法的雷达/干扰对抗均衡策略设计方法的效果。
[0125]
一、实验条件：
[0126]
本发明的仿真运行系统为intel(r)core(tm)i7-8700h@3.20ghz，64位windows10操作系统，仿真软件采用pycharm community edition 2020.3.3x64与matlab(r2021b)。
[0127]
实验设置雷达每个脉冲包含k＝3个子脉冲，每个子脉冲可选频点个数为q＝3，三个频点{f0,f1,f2}带来的收益依次减小。因此雷达的动作可以表示为0到26的三进制，即000，001，
…
，222，其中0，1，2分别代表f0,f1,f2。干扰机可采取四种干扰类型，分别是点频式压制干扰、宽带阻塞式压制干扰、瞄准式压制干扰、先进型瞄准式压制干扰。这里的点频式压制干扰有三种不同的信号形式，对应雷达三个不同的频点；瞄准式干扰中，干扰机将会截获雷达的一个子脉冲，然后干扰机发射以该雷达子脉冲载频为频率的噪声压制干扰信号；而在先进型瞄准式压制干扰类型下，干扰机将会截获雷达的两个子脉冲，如果两个子脉冲载频相同，则干扰机发射以该载频为频率的噪声压制干扰信号，否则，发射宽带压制干扰。因此，干扰机的动作可以表示为
[0128]
二、实验内容与结果：
[0129]
在仿真条件下，利用序贯归纳法计算雷达和干扰机学到的策略，并与常见策略进行对比，验证所得策略的有效性。
[0130]
表1为当雷达的一个cpi中包含三个脉冲时求得的雷达和干扰机的均衡策略。
[0131]
表1雷达和干扰机的策略
[0132][0133]
可以看出，虽然频点为f0的子脉冲给雷达带来的收益最大，然而具有相同智能水
平的干扰机也知道这个信息，所以雷达最终的均衡策略中采取发射以f1为单载频脉冲的动作的概率最大，这是因为相较于最低收益的频率f2而言，频率为f1的子脉冲给雷达带来的收益仍然是可观的。干扰机采用只发射频率为f0的点频压制式干扰的概率最大，这是显而易见的。
[0134]
表2为当雷达采取算法所得策略，干扰机采用一些常见的策略时双方该博弈的结果。这里干扰机采取的常见策略包括：策略1：只发射频率为f0的点频压制式干扰；策略2：只发射频率为f1的点频压制式干扰；策略3：只发射频率为f2的点频压制式干扰；策略4：只采用瞄准式压制干扰；策略5：采用扫频式压制干扰，即干扰机在不同脉冲下发射点频干扰；策略6：干扰机在每个脉冲下以等概率采取动作集合中的动作。
[0135]
表2雷达采取所得策略，干扰机采用常见策略的博弈结果
[0136][0137]
可以看出，面对同样的雷达策略，干扰机采用基于序贯归纳法求得的策略时，相较于大部分的常见策略，将使雷达检测概率达到最低，验证了基于序贯归纳法求得的干扰机策略的有效性。
[0138]
表3为当雷达采用一些常见的策略，干扰机采取算法所得策略时双方该博弈的结果。这里干扰机采取的常见策略包括：策略1：只发射频率为f0的单频信号；策略2：只发射频率为f1的单频信号；策略3：只发射频率为f2的单频信号；策略4：脉冲之间按照f0→
f1→
f2的顺序发射单频信号；策略5：雷达每个脉冲下以等概率采取动作集合中的动作。
[0139]
表3雷达采取常见策略，干扰机采用所得策略的博弈结果
[0140][0141]
可以看出，面对同样的干扰机策略，雷达采用基于序贯归纳法求得的策略时，相较于所列出的全部常见策略，将使雷达检测概率达到最高，验证了基于序贯归纳法求得的策略的有效性。
[0142]
对本发明求得的雷达和干扰机的均衡策略做进一步说明：本文所得到的雷达和干扰机的策略是一个脉冲对应一个动作概率分布，降低了雷达和干扰机的均衡策略耦合历史动作的复杂性，这意味着雷达和干扰机可以不用先估计当前状态再按照状态搜索动作概率
分布，而是可以直接在每个脉冲内按照预设的动作概率分布采取行动，这对雷达的实施决策提供了好处。
[0143]
综上所述，本发明从现有策略对状态的依赖角度出发，对雷达和干扰机同时行动以及多回合交互进行了建模，并基于序贯归纳法获得了两者的与状态解耦的均衡策略。本发明充分考虑了雷达干扰机智能化水平相当、干扰机干扰类型多样化、雷达和干扰机同时行动以及多回合决策的特点，弥补了现有技术的不足。
[0144]
在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。此外，本领域的技术人员可以将本说明书中描述的不同实施例或示例进行接合和组合。
[0145]
尽管在此结合各实施例对本技术进行了描述，然而，在实施所要求保护的本技术过程中，本领域技术人员通过查看所述附图、公开内容、以及所附权利要求书，可理解并实现所述公开实施例的其他变化。在权利要求中，“包括”(comprising)一词不排除其他组成部分或步骤，“一”或“一个”不排除多个的情况。单个处理器或其他单元可以实现权利要求中列举的若干项功能。相互不同的从属权利要求中记载了某些措施，但这并不表示这些措施不能组合起来产生良好的效果。
[0146]
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明，不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干简单推演或替换，都应当视为属于本发明的保护范围。

技术特征：
1.一种基于序贯归纳法的雷达/干扰对抗均衡策略设计方法，其特征在于，所述设计方法包括：步骤1、将雷达和干扰机定义为博弈的两个玩家，其中，在每个脉冲中，雷达和干扰机同时行动，所述博弈对应的博弈树的元素包括动作集合、博弈结束时的收益函数；步骤2、通过序贯归纳法得到所述雷达和干扰机的均衡策略，以确定频率捷变雷达抗主瓣干扰策略。2.根据权利要求1所述的基于序贯归纳法的雷达/干扰对抗均衡策略设计方法，其特征在于，所述雷达包括脉内跳频雷达，所述干扰机包括收发分时体制的干扰机。3.根据权利要求1所述的基于序贯归纳法的雷达/干扰对抗均衡策略设计方法，其特征在于，脉内跳频雷达在一个cpi内发射的信号表示为：其中，t
r
是雷达脉冲重复间隔，p是一个cpi内的脉冲数，s
p
(t)是第p个脉冲的信号，s
p
(t)表示为：其中，a(t)是复包络，rect(x)为矩形脉冲，当x属于[0,1]时为1，否则为0，是雷达第p个脉冲第k个子脉冲的载频，雷达每个子脉冲有q个可选频点，f
q-1
是雷达子脉冲第q-1个可选频点，k是一个脉冲内子脉冲的数量，t
sub
是雷达的子脉冲宽度；第p个脉冲下雷达的动作表示为：雷达的动作集合表示为：其中，
×
表示笛卡尔乘积。4.根据权利要求1所述的基于序贯归纳法的雷达/干扰对抗均衡策略设计方法，其特征在于，干扰机对应于雷达一个cpi内p个脉冲的干扰信号表示为：其中，j
p
(t)是相对于雷达第p个脉冲的干扰信号；干扰机的动作集合表示为：其中，spot是瞄准式压制干扰，band是宽带阻塞式压制干扰，sweep是扫频式压制干扰，{mcj}是多频点压制干扰的集合，advanced是先进型瞄准式压制干扰，是干扰机发射以f
q
为载频的窄带噪声压制干扰信号f
q
∈{f0,f1,...,f
q-1
}，f
q
是频率。5.根据权利要求1所述的基于序贯归纳法的雷达/干扰对抗均衡策略设计方法，其特征
在于，所述雷达的收益函数的计算方法为：s1、当雷达收到多个子脉冲回波时，将干信比大于阈值的子脉冲舍弃；s2、按照频率对剩余的子脉冲进行分组，将同一个频率的子脉冲分为一组，并对每个组内的子脉冲进行相干积累，频率为f
q
的子脉冲的相干积累结果为r
q
；s3、基于相干积累结果计算恒虚警检测门限t，计算公式为：其中，p
f
是雷达虚警概率，sinr
q
是频率f
q
的子脉冲的信干噪比，q是雷达每个子脉冲可选频点的个数，pr是事件的概率；s4、基于步骤s3的恒虚警检测门限t计算检测概率，并将检测概率作为收益函数，检测概率的计算公式为：其中，p
d
是雷达检测概率。6.根据权利要求1或5所述的基于序贯归纳法的雷达/干扰对抗均衡策略设计方法，其特征在于，所述干扰机的收益函数为所述雷达的收益函数的相反数。7.根据权利要求1或5所述的基于序贯归纳法的雷达/干扰对抗均衡策略设计方法，其特征在于，所述步骤2包括：步骤2.1、初始化雷达在cpi内的脉冲数p，雷达和干扰机的动作集合分别为步骤2.2、对cpi内的每个脉冲，构建形状为行列的矩阵其中，矩阵初始为全零矩阵，和分别为雷达和干扰机动作的个数；步骤2.3、若当前脉冲为第一个脉冲，则跳转至步骤2.4，若当前脉冲不为第一个脉冲，则跳转至步骤2.5；步骤2.4、计算雷达和干扰机对应的当前动作组合(a
r
,a
j
)的收益，并将所计算的雷达的收益结果填入矩阵直至处理完所有的动作组合，之后跳转至步骤2.9，其中，步骤2.5、计算历史动作组合的发生概率，历史动作组合的发生概率的计算公式为：其中，p(h)是历史动作组合的发生概率，是历史动作组合所处脉冲的序号，是第个脉冲下雷达采取动作a
r
的概率，是第个脉冲下干扰机采取动作a
j
的概率，步骤2.6、构建形状为行列的矩阵矩阵初始为全零矩阵；步骤2.7、计算某一历史动作组合及当前动作组合的收益，并将收益乘以对应历史动作
组合的发生概率，将得到的结果填入矩阵对应的位置，直至该历史动作组合与所有当前动作组合对应的结果均填入矩阵对应的位置，之后跳转至步骤2.5，执行下一组历史动作组合，直至所有历史动作组合均执行完毕，完成矩阵的填入；步骤2.8、根据步骤2.7得到的矩阵和历史动作组合的发生概率得到矩阵计算公式为：步骤2.9、求解步骤2.4或者步骤2.8的矩阵得到当前脉冲的策略p表示第p个脉冲，σ
p
是第p个脉冲内雷达和干扰机的策略对，是第p个脉冲内雷达的策略，是第p个脉冲内干扰机的策略；步骤2.8、判断当前脉冲是否为最后一个脉冲，若否，则跳转至步骤2.2，若是，则输出所得策略σ＝(σ1,σ2,...,σ
p
)。8.根据权利要求1所述的基于序贯归纳法的雷达/干扰对抗均衡策略设计方法，其特征在于，在步骤2之后，还包括：步骤3、验证所述步骤2所得的抗干扰策略的有效性。

技术总结
本发明公开了一种基于序贯归纳法的雷达/干扰对抗均衡策略设计方法，所述设计方法包括：步骤1、将雷达和干扰机定义为博弈的两个玩家，其中，在每个脉冲中，雷达和干扰机同时行动，所述博弈对应的博弈树的元素包括动作集合、博弈结束时的收益函数；步骤2、通过序贯归纳法得到所述雷达和干扰机的均衡策略，以确定频率捷变雷达抗主瓣干扰策略。本发明考虑的雷达和干扰机具备相同智能水平，同时干扰机具备多种干扰机类型，对干扰机的建模更加准确。对干扰机的建模更加准确。对干扰机的建模更加准确。

技术研发人员：纠博刘宏伟王超李康赵宇
受保护的技术使用者：西安电子科技大学
技术研发日：2023.03.22
技术公布日：2023/7/17

版权声明

本文仅代表作者观点，不代表航空之家立场。
本文系作者授权航家号发表，未经原创作者书面授权，任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时，须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的，航空之家将依法追究其法律责任。（航空之家官方QQ：2926969996）

飞行汽车 https://www.autovtol.com/

上一篇：适用于超高温加热下防隔热材料性能测试的隔热框组件的制作方法 下一篇：一种旋转角可变的蜗轮蜗杆减速机的制作方法

一种基于序贯归纳法的雷达/干扰对抗均衡策略设计方法

版权声明

航空之家

相关推荐

文章排行

最近发表

标签列表

一种基于序贯归纳法的雷达/干扰对抗均衡策略设计方法

版权声明

相关文章

航空之家

相关推荐

文章排行

最近发表

标签列表