基于现场可编程逻辑门阵列的自适应平台迁移防御方法
未命名
07-14
阅读:91
评论:0
1.本公开涉及计算机网络信息安全技术领域,尤其涉及基于现场可编程逻辑门阵列的自适应平台迁移防御方法。
背景技术:
2.高级持续威胁(advanced persistent threat,apt)是指攻击方对特定对象进行持续高效的网络攻击活动。攻击方根据检测到的信息不断改变入侵途径,使得基于特征匹配的入侵检测和防火墙等传统防御技术难以有效发现威胁。因此,平台动态防御(platform dynamic defense,pdd)成为了解决网络安全等实际问题的重要手段。
3.平台动态防御技术是扭转当前网络攻防中“攻强守弱”问题的有效解决方案,但传统凭条动态防御技术防御成本高昂,费效比低,并且在不完全信息条件和有限资源限制的实际网络攻防中,防御效率不高。因此,有必要改善上述相关技术方案中存在的一个或者多个问题。
4.需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现要素:
5.本公开实施例的目的在于提供一种基于现场可编程逻辑门阵列的自适应平台迁移防御方法,以提高平台的防御效率。
6.根据本公开实施例提出一种基于现场可编程逻辑门阵列的自适应平台迁移防御方法,以提高平台的防御效率,包括以下步骤:
7.基于现场可编程逻辑门阵列技术,设计不同的软件可执行文件和硬件配置数据,形成网络平台迁移所需配置变体;
8.构建平台动态防御演化博弈模型,并将所述平台动态防御演化博弈模型中的参数初始化;
9.根据所述平台动态防御演化博弈模型中博弈双方达成的纳什均衡,得到标准防御收益矩阵;并将所述标准防御收益矩阵代入复制动态方程中进行计算,得到防御方博弈信念变化率;
10.重复迭代上述所有步骤,得到防御方博弈信念变化率的集合;
11.根据所述防御方博弈信念变化率的集合,输出平台动态切换配置变体防御策略。
12.本公开的一示例性实施例中,在构建平台动态防御演化博弈模型,并将所述平台动态防御演化博弈模型中的参数初始化的步骤中,所述平台动态防御演化博弈模型包括5元组模型pddegm=(n,c,s,p,u),其中,
13.n=(na,nd),表示所述平台动态防御演化博弈模型中参与者的集合,na代表攻击方,nd代表防御方;
14.c=(c0,c1,c2…ci
),i∈n
+
,表示平台防御系统的可用配置变体的集合,c0,c1,c2…ci
表示不同的配置变体,c0表示平台防御系统预加载配置变体;
15.s={(s
ai
,s
dj
)|1≤i≤m,1≤j≤n,m,n∈n
+
},表示博弈双方策略的集合,s
ai
表示攻击方使用不同类型的入侵病毒所呈现的攻击策略;s
dj
表示防御方加载不同配置变体所呈现的防御策略;
16.p={(p
ai
,p
dj
)|1≤i≤m,1≤j≤n},表示博弈信念的集合。p
ai
表示攻击方第i个病毒的分布概率,p
ai
∈[0,1]且p
dj
表示防御方防御节点j个配置变体的概率,p
dj
∈[0,1]且
[0017]
表示博弈双方收益函数的集合;ua表示攻击方收益函数,表示当防御方采用策略s
dj
,攻击方采用策略s
ai
时的攻击方收益;ud代表防御方收益函数,表示当攻击方采用策略s
ai
,防御方采用策略s
dj
时的防御方收益。
[0018]
本公开的一示例性实施例中,所述攻击方收益的计算公式包括:
[0019][0020]
所述防御方收益的计算公式包括:
[0021][0022]
其中,表示资源重要程度;δ表示漏洞利用成功率;ε表示免疫概率;vitc表示漏洞信息变化成本。
[0023]
本公开的一示例性实施例中,根据所述平台动态防御演化博弈模型中博弈双方达成的纳什均衡,得到标准防御收益矩阵;并将所述标准防御收益矩阵代入复制动态方程中进行计算,得到防御方博弈信念变化率的步骤包括:
[0024]
分别构建攻击方收益矩阵和防御方收益矩阵;
[0025]
分别计算所述攻击方收益防御方收益攻击方平均收益和防御方平均收益
[0026]
将所述防御方收益矩阵进行标准化处理,得到标准防御收益矩阵d;
[0027]
将所述标准防御收益矩阵d代入所述复制动态方程中进行计算,得到防御方博弈信念变化率。
[0028]
本公开的一示例性实施例中,在分别构建攻击方收益矩阵和防御方收益矩阵的步骤中,
[0029]
所述攻击方收益矩阵的计算公式包括:
[0030][0031]
所述防御方收益矩阵的计算公式包括:
[0032][0033]
本公开的一示例性实施例中,在针对所述防御方收益矩阵进行标准化处理,得到标准防御收益矩阵d的步骤中,
[0034]
所述标准防御收益矩阵的计算公式包括:
[0035][0036]
其中,
[0037]
本公开的一示例性实施例中,当d1>0,d2<0时,所述纳什均衡的集合为(s
a2
,s
d2
);
[0038]
当d1>0,d2>0时,所述纳什均衡的集合为(s
a1
,s
d1
),(s
a2
,s
d2
),
[0039]
其中,表示混合策略;
[0040]
当d1<0,d2<0时,所述纳什均衡的集合为(s
a1
,s
d2
),(s
a2
,s
d1
),
[0041]
当d1<0,d2>0时,所述纳什均衡的集合为(s
a1
,s
d1
)。
[0042]
本公开的一示例性实施例中,当攻防双方为2
×
2对称博弈时,
[0043]
所述攻击方收益矩阵的计算公式转变为:
[0044][0045]
所述防御方收益矩阵的计算公式转变为:
[0046][0047]
本公开的一示例性实施例中,所述标准防御收益矩阵的计算公式转变为:
[0048][0049]
其中:
[0050]
本公开的一示例性实施例中,在将所述标准防御收益矩阵d代入所述复制动态方程中进行计算,得到防御方博弈信念变化率的步骤中,所述复制动态方程包括:
[0051][0052]
其中,表示平均收益。
[0053]
本公开提供的技术方案可以包括以下有益效果:
[0054]
本公开提出了一种基于现场可编程逻辑门阵列的自适应平台迁移防御方法,能够
在实际网络攻防的不完全信息条件和有限资源限制的条件下,提高平台的防御效果。
[0055]
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
[0056]
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见的,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0057]
图1示出本公开示例性实施例中基于现场可编程逻辑门阵列的自适应平台迁移防御方法的步骤示意图;
[0058]
图2示出本公开示例性实施例平台动态防御演化博弈模型中可重构计算的抽象模型图;
[0059]
图3示出本公开示例性实施例平台动态防御演化博弈模型中平台状态切换原理示意图;
[0060]
图4示出本公开示例性实施例中基于现场可编程逻辑门阵列的自适应平台迁移防御方法的策略选取的概率变化趋势图;
[0061]
图5示出本公开示例性实施例的仿真实验环境的示意图;
[0062]
图6示出本公开示例性实施例的仿真实验中不同初始博弈信念的演化趋势曲线图;
[0063]
图7示出本公开示例性实施例的仿真实验中不同初始博弈信念的防御策略累计收益对比图。
具体实施方式
[0064]
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。
[0065]
此外,附图仅为本公开的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
[0066]
本示例实施方式第一方面提供了基于现场可编程逻辑门阵列的自适应平台迁移防御方法,参照图1所示,包括以下步骤:
[0067]
步骤s101:基于现场可编程逻辑门阵列技术,设计不同的软件可执行文件和硬件配置数据,形成网络平台迁移所需配置变体;
[0068]
步骤s102:构建平台动态防御演化博弈模型,并将平所述平台动态防御演化博弈模型中的参数初始化;
[0069]
步骤s103:根据所述平台动态防御演化博弈模型中博弈双方达成的纳什均衡,得到标准防御收益矩阵;并将所述标准防御收益矩阵代入复制动态方程中进行计算,得到防御方博弈信念变化率;
[0070]
步骤s104:重复迭代上述所有步骤,得到防御方博弈信念变化率的集合;
[0071]
步骤s105:根据所述防御方博弈信念变化率的集合,输出平台动态切换配置变体防御策略。
[0072]
下面,将对本示例实施方式中的上述方法的各个步骤进行更详细的说明。
[0073]
平台动态防御(platform dynamic defense,pdd)是基于可重构计算的平台防御技术,通过多种软硬件任务划分和差异化逻辑电路设计,在通用处理器和现场可编程逻辑门阵列(field programmable gate array,fpga)中运行多个可执行文件和配置数据来满足应用任务。而缓冲区溢出漏洞是软件和操作系统中常见的漏洞,成为了攻击方病毒入侵的常见突破口。网络攻击者通过长时间侦察获取漏洞信息,设计针对性病毒,藉此发动网络攻击,造成用户数据、隐私等重要系信息损失。主动防御的思想关键在于打破攻击方的杀伤链,基于fpga的可重构计算技术可以在平台任务运行过程中动态地在转换配置信息,对外呈现出不规律的漏洞信息,使攻击者无法锁定攻击目标,切断攻击路径,达成防御目的。
[0074]
参照图2所示,在本示例步骤s101中,可重构系统随机选择事先生成的软件可执行文件和硬件配置数据(后统称配置变体),分别加载到cpu和fpga中运行。不同的配置变体采用的地址空间不同,所以随机变化加载在通用处理器中的配置变体,可以有效防御针对某种软件漏洞的攻击和缓冲区溢出攻击。图2中cpu包含了应用程序、调度器、布局器、加载器等。随机存取存储器(random access memory,ram)分别与cpu双向交换数据,并与fpga建立双向交流。
[0075]
对于防御节点无法预知入侵病毒的类型和特点,因此只能根据历史信息和其他防御节点的反馈信息进行不断试错、学习并调整切换配置变体的策略,直到防御节点倾向于选择防御效益最大化的策略,即为演化博弈中演化稳定策略的形成过程。
[0076]
参照图3所示,在图3中,p1,p2,p3分别是平台系统中的通用处理器及可编程逻辑器件分别加载配置变体c1,c2,c3后呈现出的平台状态;p
i1
,p
i2
,p
i3
分别表示在平台在状态p1,p2,p3下被病毒感染。平台被感染后会重置通用处理器及可编程逻辑器件,使平台恢复并加载其他可选的配置变体。由于加载不同配置变体时平台对外呈现的漏洞信息不同,新的平台状态对之前病毒具有一定的免疫概率。假设平台初始状态为p1,则平台防御系统可选择的防御策略有p
i1
→
p2和p
i1
→
p3。同理当平台初始状态为p2或p3时也分别有两种防御策略。
[0077]
平台动态防御从防御节点切换配置变体入手,不同的防御策略对应的切换概率不尽相同。因此,如何根据攻击病毒分布概率的演化情况来选择防御策略是提升防御效能的关键。与此同时,切换配置变体带来的系统额外开销也是攻防博弈中重要的影响因素。通过建立网络攻防演化博弈模型,推演防御节点的演化稳定策略,有助于平台动态防御系统对配置变体切换策略进行预测及控制。
[0078]
参照图1所示,在本示例步骤s102中,该平台动态防御演化博弈模型(platform dynamic defense evolutionary game model,pddegm)包括5元组模型pddegm=(n,c,s,p,u),其中,
[0079]
n=(na,nd),表示平台动态防御演化博弈模型中参与者的集合,na代表攻击方,nd代表防御方;
[0080]
c=(c0,c1,c2…ci
),i∈n
+
,表示平台防御系统的可用配置变体的集合,c0,c1,c2…ci
表示不同的配置变体,默认c0为该平台防御系统预加载配置变体;
[0081]
s={(s
ai
,s
dj
)|1≤i≤m,1≤j≤n,m,n∈n
+
},表示博弈双方策略的集合,s
ai
表示攻击方使用不同类型的入侵病毒所呈现的攻击策略;s
dj
表示防御方加载不同配置变体所呈现的防御策略;
[0082]
p={(p
ai
,p
dj
)|1≤i≤m,1≤j≤n},表示博弈双方信念的集合。p
ai
表示攻击方第i个病毒的分布概率,p
ai
∈[0,1]且p
dj
表示防御方防御节点j个配置变体的概率,p
dj
∈[0,1]且
[0083]
表示博弈双方收益函数的集合;ua表示攻击方收益函数,表示当防御方采用策略s
dj
,攻击方采用策略s
ai
时的攻击方收益;ud代表防御方收益函数,表示当攻击方采用策略s
ai
,防御方采用策略s
dj
时的防御方收益。
[0084]
攻击方收益的计算公式为:
[0085]
防御方收益的计算公式为:
[0086]
其中,表示资源重要程度。资源重要程度是衡量攻防双方收益的主要指标。资源越重要,则入侵成功或防守成功的收益越大。
[0087]
δ表示漏洞利用成功率。漏洞利用成功率是指攻击者转变攻击策略利用新漏洞发起攻击成功的几率。当平台切换配置变体时,平台对外呈现的漏洞信息会改变,攻击者的攻击路径也会随之改变,进而影响漏洞利用成功率。
[0088]
ε表示免疫概率。免疫概率是指平台动态防御系统切换配置变体后对原病毒的免疫概率,本示例中,ε=1-δ。
[0089]
vitc表示漏洞信息变化成本。漏洞信息变化成本(vulnerability information transfer cost,vitc),是指平台动态防御系统通过切换配置变体改变对外呈现的漏洞信息时给系统带来的额外开销,即cpu重新加载执行文件带来的时间成本开销,可编程资源的管理维护开销以及调度器调度开销的统称。
[0090]
对攻击方来讲,其收益取决于攻击成功后占取资源的重要程度和攻击时的漏洞利用成功率。对于防御方来讲,其收益取决于防御成功后资源的重要程度和防御付出的漏洞信息变化成本,以及防御后的免疫概率。
[0091]
在本示例步骤s103中,包括以下子步骤:
[0092]
步骤s1031:分别构建攻击方收益矩阵和防御方收益矩阵;
[0093]
攻击方收益矩阵的计算公式为:
[0094][0095]
防御方收益矩阵的计算公式为:
[0096][0097]
步骤s1032:分别计算所攻击方收益防御方收益攻击方平均收益和防御方平均收益
[0098]
步骤s1033:将防御方收益矩阵进行标准化处理,得到标准防御收益矩阵d;该标准防御收益矩阵的计算公式为:
[0099][0100]
其中,
[0101]
步骤s1034:将标准防御收益矩阵d代入复制动态方程中进行计算,得到防御方博弈信念变化率。该复制动态方程可以用策略选取的变化量来表示,即:
[0102][0103]
其中,表示平均收益。平均收益是指所有博弈双方参与者获得收益的平均值,代表攻击方平均收益,代表防御方平均收益。
[0104]
得到的防御方博弈信念变化率是指防御方选择策略s
dj
概率的导数。
[0105]
在步骤s104中,重复迭代上述所有步骤,得到防御方博弈信念变化率的集合;
[0106]
在步骤s105中,根据防御方博弈信念变化率的集合,输出平台动态切换配置变体防御策略。
[0107]
具体的,本示例中以攻防双方的2
×
2对称博弈为例,在静态情况下攻防攻防双方演化博弈的收益情况,并解释在不同情况下静态演化博弈将会落入何种类别。特别是在本示例中,由于没有时间态的变化,演化博弈没有选择和突变,博弈达成的纳什均衡即为演化均衡。攻击方采用的攻击策略s
a1
是使用缓冲区溢出攻击病毒进行入侵,攻击策略s
a2
是使用针对平台漏洞的病毒进行入侵。防御方采用的防御策略s
d1
是由预加载配置变体c0切换至备用配置变体c1,防御策略s
d2
是由预加载配置变体c0切换至备用配置变体c2。
[0108]
分别构建攻击方收益矩阵和防御方收益矩阵;
[0109]
攻击方收益矩阵的计算公式转变为:
[0110][0111]
防御方收益矩阵的计算公式转变为:
[0112][0113]
将防御方收益矩阵进行标准化处理,得到标准防御收益矩阵d;该标准防御收益矩阵的计算公式为:
[0114][0115]
其中:
[0116]
从公式(8)可以推出2
×
2攻防博弈可以通过标准化表示为平面中的一个点当d1,d2取值的正负不同时,博弈会落入不同的经典博弈类型,下面将分情况对博弈进行讨论:
[0117]
博弈类型ⅰ:当d1>0,d2<0时,此类博弈中攻击方策略s
a2
严格优于攻击方策略策略s
a1
,防守方策略s
d2
也严格优于防守方策略s
d1
。此时,纳什均衡的集合为(s
a2
,s
d2
)。
[0118]
博弈类型ⅱ:当d1>0,d2>0时,此类博弈中有两个对称的严格纳什均衡和一个混合策略纳什均衡,定义混合策略定义混合策略此时,纳什均衡的集合为(s
a1
,s
d1
),(s
a2
,s
d2
),
[0119]
博弈类型ⅲ:当d1<0,d2<0时,这类博弈中没有策略被占优,因此博弈中有两个不对称的严格纳什均衡和一个对称的混合策略纳什均衡。此时,纳什均衡的集合为(s
a1
,s
d2
),(s
a2
,s
d1
),
[0120]
博弈类型ⅳ:当d1<0,d2>0时,此类博弈中攻击方策略s
a1
严格优于攻击方策略策略s
a2
,防守方策略s
d1
也严格优于防守方策略s
d2
。所述纳什均衡的集合为(s
a1
,s
d1
),与博弈类型ⅰ类似。
[0121]
收益代表了博弈双方参与者适应性影响的增量效应,根据演化博弈的理论,对个体更有利的策略(即收益高的策略)会被其后代继承,同时也更容易被种群内的其他个体选择。在本示例中,借鉴演化思想,认为在持续时间态中,每种策略随时间被采用的概率与其第一次博弈的收益结果有关。也就是说,在动态演化博弈模型中,防御策略选取增长率的计算是以静态演化博弈的结果为基础。
[0122]
结合公式(8)计算得到的标准防御收益矩阵d,代入公式(9)中,可以得到:因为防御方博弈信念之和为1,即p
d1
+p
d2
=1,公式(9)可进一步表示为:
[0123]
参照图4所示,当d1,d2取值不同时,复制动态模型的策略选取变化趋势也不同,按照上面论述过的对博弈类型的四种分类,可以看出,
[0124]
当博弈类型为ⅰ时,演化后将收敛至0,即防御方的演化稳定策略是s
d2
。
[0125]
当博弈类型为ⅱ时,如果初始信念p
d1
大于采取混合策略的信念则经过演化后将收敛至1,即此时防御方的演化稳定策略是s
d1
;如果初始信念p
d1
小于采取混合策略的信念则经过演化后将收敛至0,即此时防御方的演化稳定策略是s
d2
。
[0126]
当博弈类型为ⅲ时,无论初始信念p
d1
的值大于或者小于采取混合策略的信念防御方的演化稳定策略总会收敛至混合策略
[0127]
当博弈类型为ⅳ时,经过演化后将收敛至1,即防御方的演化稳定策略是s
d1
。
[0128]
在已知静态博弈的收益结果的情况下,演化博弈模型可以精炼防御方的防御策略。在每种确定的情况下,防御方总有一个演化稳定的防御策略。在实际应用中,该模型可以根据历史经验帮助平台动态防御系统对防御策略进行有效决策,并通过不断学习随时调整,达到动态防御的效果。
[0129]
重复迭代上述所有步骤,得到防御方博弈信念变化率的集合;
[0130]
根据防御方博弈信念变化率的集合,输出平台动态切换配置变体防御策略。
[0131]
综上,平台动态防御系统的防御策略建立在标准化收益矩阵的基础上。攻防双方均有若干种初始策略可供选择,通过复制子动态演化博弈模型对防御策略进行精炼,最终得到演化稳定的动态防御策略。以此为基础设计了平台配置变体动态切换算法,为设计最优平台动态防御策略提供支撑。结合算例分析,输出的平台动态切换配置变体防御策略可能是纯策略或者是混合策略。纯策略可以直接作为最优平台动态防御策略,为系统动态防御提供理论支撑和方案参考;混合策略则需要依据不同的决策准侧进一步进行评估判断。
[0132]
仿真与分析
[0133]
针对本示例实施方式中提出的平台动态防御方法,进行了如下仿真实验,如图5所示,为验证该模型及算法的有效性和可行性,构建了如图5所示的仿真实验环境:
[0134]
由于网络安全威胁一般来自于外网,因此,在仿真实验中,在dmz(demilitarized zone)区部署堡垒主机h和web服务器。堡垒主机装载平台动态防御系统,系统内存储三个可用配置变体c0,c1,c2。web服务器是公共服务器,允许所有外网用户进行访问。防火墙的安全策略为仅允许外网用户访问进行访问web服务器的http服务和ftp服务,以及堡垒主机h上的smtp服务。利用sessus工具对仿真实验网络环境进行扫描,结合国家信息安全漏洞库(cnnvd)的漏洞信息,得到三个可配置变体的漏洞信息,定义为v0,v1,v2。在本仿真实验中,默认攻击方初始可利用漏洞信息为v0,即系统加载默认配置变体c0时对外呈现的漏洞信息。在动态博弈过程中,攻击方的攻击策略s
a1
是v0→v1
,攻击方的攻击策略s
a2
是v0→v2
。
[0135]
系统默认加载配置变体为c0时,当系统采取防御策略s
d1
时,即加载的配置变体由c0→
c1时,fpga中实现电路的逻辑要素变化率达到29%,系统需要额外付出15%的开销;当系统采取防御策略s
d2
时,即加载的配置变体由c0→
c2时,fpga中实现电路逻辑要素变化率达到51%,系统需要额外付出64%的开销。
[0136]
可重构系统实现动态防御的本质是实现地址空间的动态变化。地址空间的变化会带来攻击路径的变化(attack path variation,apv),这里引用的apv度量的计算公式为:
[0137][0138]
其中,δap
i,i-1
表示切换配置变体前后攻击路径的差异,|s|表示网络状态的总数。在本示例仿真实验中,将δap
i,i-1
量化为fpga中逻辑电路变化率,|s|=3
。
[0139]
漏洞信息利用陈功率是一种复合指标,其计算公式为:
[0140][0141]
其中,m表示一组度量参数;w表示一组权重值且σwi=1。本示例仿真实验中定义:m1为apv度量,m2为标准化cnnvd漏洞评分;w1和w2都为0.5,最终得出如下表1漏洞综合信息数据:
[0142]
表1:漏洞综合信息数据
[0143][0144]
本示例仿真实验中,定义资源重要程度为1,漏洞信息变化成本vitc为系统的额外开销。根据表1得到攻击方支付矩阵为防御方支付矩阵为得到的标准化收益矩阵为:
[0145]
将代入到公式中,得到演化稳定的混合策略
[0146]
由此,得到仿真实验结果,并对其进行具体如下分析:
[0147]
这里,采用matlab工具对实验结果进行仿真验证。分别取初始博弈信念p
d1
的值为0.33,0.50,0.97与0.99,从而观察p
d1
的变化趋势。参照图6所示,在初始博弈信念经历不同的演化代数后,无论p
d1
的取值如何,其演化稳定值都为0.9472,即混合策略中采用防御策略s
d1
的概率,动态演化模型的有效性的带了充分验证。除此之外,初始博弈信念p
d1
的值与演化稳定值差距越大,达成演化稳定所需的演化代数越多;但无论初始值为多少,博弈信念的变化速率都呈先快后慢的趋势。这意味着在在实际应用中,如果需要提高得到防御策略的速度,可以牺牲掉一部分精度为代价来减少演化代数,从而加快算法输出可用策略。由此,
本公开提出的模型和算法的有效性得到了验证。
[0148]
参照图7,传统的基于可重构计算的平台动态防御技术采用的是随机切换配置变体的防御策略,为验证本公开提出的动态演化博弈模型对平台动态防御效果的增强,将演化均衡防御策略与随机防御策略进行对比,进行了100次蒙特卡洛仿真实验,得到防御收益的累计变化趋势,如图7所示。
[0149]
从图7可以看出,采用演化均衡策略累计收益与演化次数近似呈线性关系,采用随机策略的累计收益与演化次数呈现上下波动的非线性关系。当初始博弈信念p
d1
为0.33,0.5,0.97时,达到演化均衡时的累计收益值接近2
×
104个单位值;当初始博弈信念p
d1
为0.99时,达到演化均衡的累计收益值上升到近似2.5
×
104个单位值。
[0150]
通过分析实验结果可知,无论初始博弈信念p
d1
的值为0.33,0.5,0.97或0.99,随着演化次数的增加,平台动态防御系统采用演化均衡防御策略的累计收益均逐渐大于采用随机防御策略的累计收益。达到演化稳定状态后,采用演化均衡防御策略的累计收益约为采用随机防御策略累计收益的1.43-1.67倍。同时,可以看出演化次数越多,两种防御策略选择方式的累计收益的差值越大。
[0151]
由此可以做出推断,使用动态演化模型得到的演化均衡防御策略的实际防御效果要优于采用完全随机的防御策略实际防御效果。仿真实验的结果证明,本公开提出的平台动态防御演化博弈模型可以有效提升平台动态防御系统的防御效果。
[0152]
综上所述,本公开通过构建平台动态防御演化博弈模型,分析攻击方和防御方的历史态势,预测未来的博弈策略,基于平台配置变体动态切换算法得到防御费效比最高的防御策略。该平台动态防御演化博弈模型能够在任意初始博弈信念下给出演化稳定的优势策略,为系统切换配置变体,改变对外呈现的漏洞信息,为阻断杀伤链提供参考。另外,本公开所提到的平台配置变体动态切换算法相较传统算法在相同时间内的防御收益可以提升43%-67%,能够有效提升系统动态防御的费效比,为基于可重构计算的平台动态防御技术应用提供理论支撑。
[0153]
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本技术旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由所附的权利要求指出。
技术特征:
1.基于现场可编程逻辑门阵列的自适应平台迁移防御方法,其特征在于,包括:基于现场可编程逻辑门阵列技术,设计不同的软件可执行文件和硬件配置数据,形成网络平台迁移所需配置变体;构建平台动态防御演化博弈模型,并将所述平台动态防御演化博弈模型中的参数初始化;根据所述平台动态防御演化博弈模型中博弈双方达成的纳什均衡,得到标准防御收益矩阵;并将所述标准防御收益矩阵代入复制动态方程中进行计算,得到防御方博弈信念变化率;重复迭代上述所有步骤,得到防御方博弈信念变化率的集合;根据所述防御方博弈信念变化率的集合,输出平台动态切换配置变体防御策略。2.根据权利要求1所述自适应平台迁移防御方法,其特征在于,在构建平台动态防御演化博弈模型,并将所述平台动态防御演化博弈模型中的参数初始化的步骤中,所述平台动态防御演化博弈模型包括5元组模型pddegm=(n,c,s,p,u),其中,n=(n
a
,n
d
),表示所述平台动态防御演化博弈模型中参与者的集合,n
a
代表攻击方,n
d
代表防御方;c=(c0,c1,c2…
c
i
),i∈n
+
,表示平台防御系统的可用配置变体的集合,c0,c1,c2…
c
i
表示不同的配置变体,c0表示平台防御系统预加载配置变体;s={(s
ai
,s
dj
)|1≤i≤m,1≤j≤n,m,n∈n
+
},表示博弈双方策略的集合,s
ai
表示攻击方使用不同类型的入侵病毒所呈现的攻击策略;s
dj
表示防御方加载不同配置变体所呈现的防御策略;p={(p
ai
,p
dj
)|1≤i≤m,1≤j≤n},表示博弈信念的集合;p
ai
表示攻击方第i个病毒的分布概率,p
ai
∈[0,1]且p
dj
表示防御方防御节点j个配置变体的概率,p
dj
∈[0,1]且且表示博弈双方收益函数的集合;u
a
表示攻击方收益函数,表示当防御方采用策略s
dj
,攻击方采用策略s
ai
时的攻击方收益;u
d
代表防御方收益函数,表示当攻击方采用策略s
ai
,防御方采用策略s
dj
时的防御方收益。3.根据权利要求2所述自适应平台迁移防御方法,其特征在于,所述攻击方收益的计算公式包括:所述防御方收益的计算公式包括:其中,表示资源重要程度;δ表示漏洞利用成功率;ε表示免疫概率;vitc表示漏洞信息变化成本。4.根据权利要求3所述自适应平台迁移防御方法,其特征在于,根据所述平台动态防御演化博弈模型中博弈双方达成的纳什均衡,得到标准防御收益矩阵;并将所述标准防御收
益矩阵代入复制动态方程中进行计算,得到防御方博弈信念变化率的步骤包括:分别构建攻击方收益矩阵和防御方收益矩阵;分别计算所述攻击方收益防御方收益攻击方平均收益和防御方平均收益将所述防御方收益矩阵进行标准化处理,得到标准防御收益矩阵d;将所述标准防御收益矩阵d代入所述复制动态方程中进行计算,得到防御方博弈信念变化率。5.根据权利要求4所述自适应平台迁移防御方法,其特征在于,在分别构建攻击方收益矩阵和防御方收益矩阵的步骤中,所述攻击方收益矩阵的计算公式包括:所述防御方收益矩阵的计算公式包括:6.根据权利要求5所述自适应平台迁移防御方法,其特征在于,在针对所述防御方收益矩阵进行标准化处理,得到标准防御收益矩阵d的步骤中,所述标准防御收益矩阵的计算公式包括:其中,7.根据权利要求6所述自适应平台迁移防御方法,其特征在于,当d1>0,d2<0时,所述纳什均衡的集合为(s
a2
,s
d2
);当d1>0,d2>0时,所述纳什均衡的集合为(s
a1
,s
d1
),(s
a2
,s
d2
),其中,表示混合策略;当d1<0,d2<0时,所述纳什均衡的集合为(s
a1
,s
d2
),(s
a2
,s
d1
),当d1<0,d2>0时,所述纳什均衡的集合为(s
a1
,s
d1
)。8.根据权利要求7所述自适应平台迁移防御方法,其特征在于,当攻防双方为2
×
2对称博弈时,
所述攻击方收益矩阵的计算公式转变为:所述防御方收益矩阵的计算公式转变为:9.根据权利要求8所述自适应平台迁移防御方法,其特征在于,所述标准防御收益矩阵的计算公式转变为:其中:10.根据权利要求4所述自适应平台迁移防御方法,其特征在于,在将所述标准防御收益矩阵d代入所述复制动态方程中进行计算,得到防御方博弈信念变化率的步骤中,所述复制动态方程包括:其中,表示平均收益。
技术总结
本公开是关于基于现场可编程逻辑门阵列的自适应平台迁移防御方法,包括以下步骤:基于现场可编程逻辑门阵列技术,设计不同的软件可执行文件和硬件配置数据,形成网络平台迁移所需配置变体;构建平台动态防御演化博弈模型,将平台动态防御演化博弈模型中的参数初始化;根据平台动态防御演化博弈模型中博弈双方达成的纳什均衡,得到标准防御收益矩阵;将标准防御收益矩阵代入复制动态方程中进行计算,得到防御方博弈信念变化率;重复迭代上述所有步骤,得到防御方博弈信念变化率的集合;根据防御方博弈信念变化率的集合,输出平台动态切换配置变体防御策略。本公开能够在实际网络攻防的不完全信息条件和有限资源限制的条件下,提高平台的防御效果。提高平台的防御效果。提高平台的防御效果。
技术研发人员:金恒州 王刚 马宇峰 唐雪琴 姫正洲 严丽娜
受保护的技术使用者:中国人民解放军空军工程大学
技术研发日:2022.08.09
技术公布日:2023/7/13
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
