一种电力安全的电力大数据流异常检测方法与流程
未命名
08-05
阅读:137
评论:0
1.本发明涉及电力数据异常检测技术领域,特别涉及一种电力安全的电力大数据流异常检测方法。
背景技术:
2.随着智能电网的建设与发展,电力部门在发电、输电、变电、配电、用电和调度6大环节中,安装和部署了大量数据采集传感器。这些传感器每天会产生大量来源各异、结构多样、形式不同的电力数据,是当前电力大数据的主要来源。通过对电力大数据进行有效挖掘,可以大力推动电网从传统以物理模型为核心的业务模式转向以数据为基础的业务模式。
3.然而由于数据来源不同,对相同数据的统计口径不同,操作人员录入习惯差异及缺乏统一的数据质量管理体系,经常会导致异常数据的产生。异常数据往往蕴藏着电力系统产生故障的相关信息,能够为电网技术人员深入了解电力系统运行状态,提高异常事件查处命中率等提供帮助,因此具有巨大的研究价值。早期的异常检测多采用人工巡检方式,效率低且准确率不高,无法在大量、多源、异构数据中快速、准确地实现对异常数据的检测。
技术实现要素:
4.本发明提供了一种电力安全的电力大数据流异常检测方法,提取数据的九维特征并利用相关向量机rvm选择特征构成特征向量,采用svdd分类器对特征向量进行分类,从而实现对电力大数据中异常数据检测,能够在大量、多源、异构数据中快速、准确地实现对异常数据的自动化检测。
5.本发明提供了一种电力安全的电力大数据流异常检测方法,包括:获取正常电力数据以构成训练样本集,并对所述训练样本集进行九维特征提取,以构成特征向量;采用rvm算法对所述特征向量进行特征选择,得到低维特征向量;将所述低维特征向量输入预设svdd分类器以对所述预设svdd分类器进行训练,得到训练完成的svdd分类器;获取测试数据,并对所述低维特征向量进行特征提取,得到所述测试数据的测试特征向量集合;其中,所述测试数据为正常数据或异常数据;将所述测试特征向量集合输入训练完成的svdd分类器以判定测试数据为正常数据或异常数据,得到测试完成的svdd分类器;将实时采集的电力大数据输入测试完成的svdd分类器,以判定所述电力大数据为正常数据或异常数据。
6.进一步地,所述九维特征包括极差特征、标准差特征、离散系数特征、几何平均数特征、质心特征、相关系数特征、中值差特征、波形熵特征和二阶中心距特征;其中,极差特征为:,其中,和分别为
求括号内变量最大值与最小值运算;标准差特征为:,其中,e为时间序列总长度,为时间序列的算数平均值;离散系数特征为:;几何平均数特征为:;质心特征为:;其中,;相关系数特征为:;中值差特征为:,其中,分别为前e/2个采样点的中值和后e/2个采样点的中值;波形熵特征为:;二阶中心距特征为:,其中,。
7.进一步地,所述采用rvm算法对所述特征向量进行特征选择,得到低维特征向量的步骤中,rvm算法包括:对于一个训练样本的特征向量集合,其中,,m为训练样本总数,为特征向量,为类别标号,rvm的函数为:其中,为核函数,y、w分别为模型中的待求变量,为第m个训练样本对应权重,为高斯白噪声。
8.进一步地,所述将所述低维特征向量输入预设svdd分类器以对所述预设svdd分类器进行训练,得到训练完成的svdd分类器的步骤中,预设svdd分类器包括:对于给定训练样本集,利用svdd进行处理分析表示为:,利用svdd进行处理分析表示为:其中,为第i个样本,,n为总样本数,c为惩罚因子,l为待优化值,
与一一对应,当时,对应的为最优球面上的支撑向量,为高斯核函数,利用所有支撑向量可以计算得到最优超球体的球心c和半径r
′
分别为:其中,分别为和c处对应距离;得到最优超球体后,对于任意给定位置测试样本,其决策方程为:其中,为处对应的距离,若计算得到,则为正常数据,否则为异常数据。
9.进一步地,采用kh-svdd算法对预设svdd分类器中的和参数和惩罚因子c进行优化,包括:输入训练样本集,并初始化参数;其中,参数包括kh规模参数m、最大迭代次数、最大诱导速度、米是速度、变量个数p、各变量取值的上界、下界、权值参数;令当前迭代次数h=1,在参数空间内随机选取m个位置作为kh的初始位置,计算速度矢量因子;利用svdd对训练样本集进行分析,结合当前kh群位置计算每个kh的适应度函数值fitness ,选择fitness 最小的kh作为当前的最优解并存储其位置信息;计算扰动因子,更新诱导运动、觅食运动和自身随机扩散的速度矢量,对每个kh位置进行更新:;其中,为t时刻的位置;根据更新后kh群的位置信息,再次利用svdd对训练样本集进行分析描述,计算每个样本的适应度值,同时更新最优位置kh的信息,判断当前迭代次数是否为最大迭代次数;若当前迭代次数不是最大迭代次数,则令h=h+1,并返回所述利用svdd对训练样本集进行分析,结合当前kh群位置计算每个kh的适应度函数值fitness ,选择fitness 最小的kh作为当前的最优解并存储其位置信息的步骤;若当前迭代次数是最大迭代次数,则对记录的最优位置kh fitness值进行对比分析,输出最小fitness 值对应kh位置,即得到svdd最优参数组。
10.进一步地,所述极端速度矢量因子的公式为:fitness 可表示为:
其中,为第l次试验的错分概率,,k为交叉验证试验次数;计算扰动因子为:其中,h为当前迭代次数。
11.本发明还提供了一种电力安全的电力大数据流异常检测装置,包括:获取模块,用于获取正常电力数据以构成训练样本集,并对所述训练样本集进行九维特征提取,以构成特征向量;选择模块,用于采用rvm算法对所述特征向量进行特征选择,得到低维特征向量;训练模块,用于将所述低维特征向量输入预设svdd分类器以对所述预设svdd分类器进行训练,得到训练完成的svdd分类器;提取模块,用于获取测试数据,并对所述低维特征向量进行特征提取,得到所述测试数据的测试特征向量集合;其中,所述测试数据为正常数据或异常数据;测试模块,用于将所述测试特征向量集合输入训练完成的svdd分类器以判定测试数据为正常数据或异常数据,得到测试完成的svdd分类器;判定模块,用于将实时采集的电力大数据输入测试完成的svdd分类器,以判定所述电力大数据为正常数据或异常数据。
12.本发明还提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。
13.本发明还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述方法的步骤。
14.本发明的有益效果为:本发明首先提取波动性、趋势性和变动性特征等九维特征对电力数据时间序列进行表征;然后利用相关向量机rvm自动选择特征构成特征向量,大大降低了训练阶段的运算复杂度;最后采用支撑向量数据描述svdd构造一类分类器,对特征向量进行分类,降低了数据获取难度,实现对异常数据检测,提高效率和准确率,能够在大量、多源、异构数据中快速、准确地实现对异常数据的自动化检测。
附图说明
15.图1为本发明一实施例的方法流程示意图。
16.图2为本发明一实施例的装置结构示意图。
17.图3为本发明一实施例的计算机设备内部结构示意图。
18.本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
19.应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
20.如图1所示,本发明提供了一种电力安全的电力大数据流异常检测方法,包括:s1、获取正常电力数据以构成训练样本集,并对所述训练样本集进行九维特征提取,以构成特征向量,实现原始高维数据的降维,并降低算法运算复杂度;
所述九维特征包括极差特征、标准差特征、离散系数特征、几何平均数特征、质心特征、相关系数特征、中值差特征、波形熵特征和二阶中心距特征;其中,极差特征、标准差特征、离散系数特征、几何平均数特征4为特征属于波动性特征,对电力数据的波动性进行表征,波动性描述的是时间序列相对于其算数平均值的波动程度;极差特征为:,其中,和分别为求括号内变量最大值与最小值运算;极差描述的是时间序列的最大波动范围。
21.标准差特征为:,其中,e为时间序列总长度,为时间序列的算数平均值;标准差描述了数据相对于其算术平均值的离散程度,标准差越小,数据越稳定,波动性越小。
22.离散系数特征为:;离散系数是标准差与算术平均值的比率,是用来表征数据离散程度的相对指标,离散系数越大,表明数据的波动性越大。
23.几何平均数特征为:;质心特征、相关系数特征、中值差特征3维特征为趋势性特征,对电力数据的趋势性进行表征,趋势性描述的是时间序列随时间变化的整体趋势。
24.质心特征为:;其中,;时间序列的质心能够表征序列能量随时间分布的特性。
25.相关系数特征为:;定义时间序列前e/2个采样点与后e/2个采样点的相关系数为序列的相关系数特征;相关系数描述时间序列前后变化趋势,相关系数越大表明时间序列前后变化趋势较为稳定,一致性强。
26.中值差特征为:,其中,分别为前e/2个采样点的中值和后e/2个采样点的中值;利用时间序列前e/2个采样点的中值与后e/2个采样点的中值之差对其变化趋势进行描述。
27.波形熵特征和二阶中心距特征2维特征为变动性特征,对店里数据的变动性进行表征,变动性描述的是时间序列不同采样点的整体分布特征。
28.时间序列波形熵特征为:;波形熵描述时间序列的能量分布特征,能量分布越集中,波形熵越小。
29.二阶中心距特征为:,其中,;二阶中心距描述时间序列相对于其质心的分布情况。
30.s2、采用rvm算法对所述特征向量进行特征选择,得到低维特征向量;得到九维特征后,可以直接将其作为特征向量输入到分类器中进行分类识别和异常检测,但由于采用的是人工特征提取方法,提取的特征中不可避免地会存在一些冗余特征,这些特征的存在不仅不会增加对分类识别和异常检测的有用信息,相反可能会降低检测性能的可靠性。因
此有必要进行特征选择,进一步对九维特征进行降维,选取对检测性能有重要影响的少数特征。采用rvm进一步对特征进行分析,实现最优特征组合的选择。
31.rvm算法包括:对于一个训练样本的特征向量集合,其中,,m为训练样本总数,为特征向量,为类别标号,rvm的函数为:其中,为核函数,y、w分别为模型中的待求变量,为第m个训练样本对应权重,为高斯白噪声。
32.为了对输入特征对应的目标值做出概率预测,rvm将sigmoid函数引入,并进一步对模型中参数的先验分布(伽玛分布)进行构建,模型求解通常采用变分贝叶斯期望最大vbem(variational bayes expectation maximization)算法,求解过程中伽玛分布大部分α会趋向无穷大,对应的w则趋于0,从而实现了权值向量的稀疏化,迭代终止时不为0的权值对应的特征向量即为最终要选择的最优特征组合。
33.s3、将所述低维特征向量输入预设svdd分类器以对所述预设svdd分类器进行训练,得到训练完成的svdd分类器,在剔除冗余特征的同时能够进一步降低算法运算复杂度,提升算法实时性;svdd在高维空间中生成能够包含所有训练样本的最小超球体,超求体表面上的采样点为支持向量,对于任意测试样本,如果其处于超球体内部,则判决为正常数据,否则判决为异常数据。
34.预设svdd分类器包括:通常情况下,训练样本在原始数据空间中不会呈现出球状分布,此时svdd通过引入核函数的形式将其映射到高维空间进行分析,即,高斯核函数。对于给定训练样本集,利用svdd进行处理分析表示为:,利用svdd进行处理分析表示为:其中,为第i个样本,,n为总样本数,c为惩罚因子,为核参数,其大小决定超球体边界的紧密型,j为样本标号,j=1,,
…
,m;l为待优化值,与一一对应,当时,对应的为最优球面上的支撑向量,为高斯核函数,利用所有支撑向量可以计算得到最优超球体的球心c和半径r
′
分别为:
最小的kh作为当前的最优解并存储其位置信息的步骤;t7、若当前迭代次数是最大迭代次数,则对记录的最优位置kh fitness值进行对比分析,输出最小fitness 值对应kh位置,即得到svdd最优参数组。
37.s4、获取测试数据,并对所述低维特征向量进行特征提取,得到所述测试数据的测试特征向量集合;其中,所述测试数据为正常数据或异常数据;s5、将所述测试特征向量集合输入训练完成的svdd分类器以判定测试数据为正常数据或异常数据,得到测试完成的svdd分类器;s6、将实时采集的电力大数据输入测试完成的svdd分类器,以判定所述电力大数据为正常数据或异常数据。
38.本发明首先提取波动性、趋势性和变动性特征等九维特征对电力数据时间序列进行表征;然后利用相关向量机rvm自动选择特征构成特征向量,大大降低了训练阶段的运算复杂度;最后采用支撑向量数据描述svdd构造一类分类器,对特征向量进行分类,降低了数据获取难度,实现对异常数据检测,提高效率和准确率,能够在大量、多源、异构数据中快速、准确地实现对异常数据的自动化检测。
39.如图2所示,本发明还提供了一种电力安全的电力大数据流异常检测装置,包括:获取模块1,用于获取正常电力数据以构成训练样本集,并对所述训练样本集进行九维特征提取,以构成特征向量;选择模块2,用于采用rvm算法对所述特征向量进行特征选择,得到低维特征向量;训练模块3,用于将所述低维特征向量输入预设svdd分类器以对所述预设svdd分类器进行训练,得到训练完成的svdd分类器;提取模块4,用于获取测试数据,并对所述低维特征向量进行特征提取,得到所述测试数据的测试特征向量集合;其中,所述测试数据为正常数据或异常数据;测试模块5,用于将所述测试特征向量集合输入训练完成的svdd分类器以判定测试数据为正常数据或异常数据,得到测试完成的svdd分类器;判定模块6,用于将实时采集的电力大数据输入测试完成的svdd分类器,以判定所述电力大数据为正常数据或异常数据。
40.在一个实施例中,所述九维特征包括极差特征、标准差特征、离散系数特征、几何平均数特征、质心特征、相关系数特征、中值差特征、波形熵特征和二阶中心距特征;其中,极差特征为:,其中,和分别为求括号内变量最大值与最小值运算;标准差特征为:,其中,e为时间序列总长度,为时间序列的算数平均值;离散系数特征为:;几何平均数特征为:;质心特征为:;其中,;
相关系数特征为:;中值差特征为:,其中,分别为前e/2个采样点的中值和后e/2个采样点的中值;波形熵特征为:;二阶中心距特征为:,其中,。
41.在一个实施例中,选择模块2中,rvm算法包括:对于一个训练样本的特征向量集合,其中,,m为训练样本总数,为特征向量,为类别标号,rvm的函数为:其中,为核函数,y、w分别为模型中的待求变量,为第m个训练样本对应权重,为高斯白噪声。
42.在一个实施例中,训练模块3中,预设svdd分类器包括:对于给定训练样本集,利用svdd进行处理分析表示为:,利用svdd进行处理分析表示为:其中,为第i个样本,,n为总样本数,c为惩罚因子,l为待优化值,与一一对应,当时,对应的为最优球面上的支撑向量,为高斯核函数,利用所有支撑向量可以计算得到最优超球体的球心c和半径r
′
分别为:其中,分别为和c处对应距离;得到最优超球体后,对于任意给定位置测试样本,其决策方程为:其中,为处对应的距离,若计算得到,则为正常数据,否则为
异常数据。
43.在一个实施例中,采用kh-svdd算法对预设svdd分类器中的和参数和惩罚因子c进行优化,包括:输入单元,用于输入训练样本集,并初始化参数;其中,参数包括kh规模参数m、最大迭代次数、最大诱导速度、米是速度、变量个数p、各变量取值的上界、下界、权值参数;选取单元,用于令当前迭代次数h=1,在参数空间内随机选取m个位置作为kh的初始位置,计算速度矢量因子;分析单元,用于利用svdd对训练样本集进行分析,结合当前kh群位置计算每个kh的适应度函数值fitness ,选择fitness 最小的kh作为当前的最优解并存储其位置信息;计算单元,用于计算扰动因子,更新诱导运动、觅食运动和自身随机扩散的速度矢量,对每个kh位置进行更新:;其中,为t时刻的位置;判断单元,用于根据更新后kh群的位置信息,再次利用svdd对训练样本集进行分析描述,计算每个样本的适应度值,同时更新最优位置kh的信息,判断当前迭代次数是否为最大迭代次数;返回单元,用于在当前迭代次数不是最大迭代次数时,令h=h+1,并返回所述利用svdd对训练样本集进行分析,结合当前kh群位置计算每个kh的适应度函数值fitness ,选择fitness 最小的kh作为当前的最优解并存储其位置信息的步骤;对比单元,用于在当前迭代次数是最大迭代次数时,对记录的最优位置kh fitness值进行对比分析,输出最小fitness 值对应kh位置,即得到svdd最优参数组。
44.在一个实施例中,所述极端速度矢量因子的公式为:fitness 可表示为:其中,为第l次试验的错分概率,,k为交叉验证试验次数;计算扰动因子为:其中,h为当前迭代次数。
45.上述各模块、单元均是用于对应执行上述电力安全的电力大数据流异常检测方法中的各个步骤,其具体实现方式参照上述方法实施例所述,在此不再进行赘述。
46.如图3所示,本发明还提供了一种计算机设备,该计算机设备可以是服务器,其内部结构可以如图3所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口
和数据库。其中,该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储电力安全的电力大数据流异常检测方法的过程需要的所有数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现电力安全的电力大数据流异常检测方法。
47.本领域技术人员可以理解,图3中示出的结构,仅仅是与本技术方案相关的部分结构的框图,并不构成对本技术方案所应用于其上的计算机设备的限定。
48.本技术一实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述任意一个电力安全的电力大数据流异常检测方法。
49.本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储与一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本技术所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram通过多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双速据率sdram(ssrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。
50.需要说明的是,在本文中,术语“包括”、“包含”或者其任何其它变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其它要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
51.以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
技术特征:
1.一种电力安全的电力大数据流异常检测方法,其特征在于,包括:获取正常电力数据以构成训练样本集,并对所述训练样本集进行九维特征提取,以构成特征向量;采用rvm算法对所述特征向量进行特征选择,得到低维特征向量;将所述低维特征向量输入预设svdd分类器以对所述预设svdd分类器进行训练,得到训练完成的svdd分类器;获取测试数据,并对所述低维特征向量进行特征提取,得到所述测试数据的测试特征向量集合;其中,所述测试数据为正常数据或异常数据;将所述测试特征向量集合输入训练完成的svdd分类器以判定测试数据为正常数据或异常数据,得到测试完成的svdd分类器;将实时采集的电力大数据输入测试完成的svdd分类器,以判定所述电力大数据为正常数据或异常数据。2.根据权利要求1所述的电力安全的电力大数据流异常检测方法,其特征在于,所述九维特征包括极差特征、标准差特征、离散系数特征、几何平均数特征、质心特征、相关系数特征、中值差特征、波形熵特征和二阶中心距特征;其中,极差特征为:,其中,和分别为求括号内变量最大值与最小值运算;标准差特征为:,其中,e为时间序列总长度,为时间序列的算数平均值;离散系数特征为:;几何平均数特征为:;质心特征为:;其中,;相关系数特征为:;中值差特征为:,其中,分别为前e/2个采样点的中值和后e/2个采样点的中值;波形熵特征为:;二阶中心距特征为:,其中,。3.根据权利要求1所述的电力安全的电力大数据流异常检测方法,其特征在于,所述采用rvm算法对所述特征向量进行特征选择,得到低维特征向量的步骤中,rvm算法包括:对于一个训练样本的特征向量集合,其中,,m为训练样本总数,为特征向量,为类别标号,rvm的函数为:其中,为核函数,y、w分别为模型中的待求变量,为第m个训练样本对应权重,为高斯白噪声。
4.根据权利要求1所述的电力安全的电力大数据流异常检测方法,其特征在于,所述将所述低维特征向量输入预设svdd分类器以对所述预设svdd分类器进行训练,得到训练完成的svdd分类器的步骤中,预设svdd分类器包括:对于给定训练样本集,利用svdd进行处理分析表示为:,利用svdd进行处理分析表示为:其中,为第i个样本,,n为总样本数,c为惩罚因子,l为待优化值,与一一对应,当时,对应的为最优球面上的支撑向量,为高斯核函数,利用所有支撑向量可以计算得到最优超球体的球心c和半径r
′
分别为:其中,分别为和c处对应距离;得到最优超球体后,对于任意给定位置测试样本,其决策方程为:其中,为处对应的距离,若计算得到,则为正常数据,否则为异常数据。5.根据权利要求4所述的电力安全的电力大数据流异常检测方法,其特征在于,采用kh-svdd算法对预设svdd分类器中的和参数和惩罚因子c进行优化,包括:输入训练样本集,并初始化参数;其中,参数包括kh规模参数m、最大迭代次数、最大诱导速度、米是速度、变量个数p、各变量取值的上界、下界、权值参数;令当前迭代次数h=1,在参数空间内随机选取m个位置作为kh的初始位置,计算速度矢量因子;利用svdd对训练样本集进行分析,结合当前kh群位置计算每个kh的适应度函数值fitness ,选择fitness 最小的kh作为当前的最优解并存储其位置信息;计算扰动因子,更新诱导运动、觅食运动和自身随机扩散的速度矢量,对每个kh位置进行更新:;其中,为t时刻的位置;根据更新后kh群的位置信息,再次利用svdd对训练样本集进行分析描述,计算每个样本的适应度值,同时更新最优位置kh的信息,判断当前迭代次数是否为最大迭代次数;若当前迭代次数不是最大迭代次数,则令h=h+1,并返回所述利用svdd对训练样本集进行分析,结合当前kh群位置计算每个kh的适应度
函数值fitness ,选择fitness 最小的kh作为当前的最优解并存储其位置信息的步骤;若当前迭代次数是最大迭代次数,则对记录的最优位置kh fitness值进行对比分析,输出最小fitness 值对应kh位置,即得到svdd最优参数组。6.根据权利要求5所述的电力安全的电力大数据流异常检测方法,其特征在于,所述极端速度矢量因子的公式为:fitness 可表示为:其中,为第l次试验的错分概率,,k为交叉验证试验次数;计算扰动因子为:其中,h为当前迭代次数。7.一种电力安全的电力大数据流异常检测装置,其特征在于,包括:获取模块,用于获取正常电力数据以构成训练样本集,并对所述训练样本集进行九维特征提取,以构成特征向量;选择模块,用于采用rvm算法对所述特征向量进行特征选择,得到低维特征向量;训练模块,用于将所述低维特征向量输入预设svdd分类器以对所述预设svdd分类器进行训练,得到训练完成的svdd分类器;提取模块,用于获取测试数据,并对所述低维特征向量进行特征提取,得到所述测试数据的测试特征向量集合;其中,所述测试数据为正常数据或异常数据;测试模块,用于将所述测试特征向量集合输入训练完成的svdd分类器以判定测试数据为正常数据或异常数据,得到测试完成的svdd分类器;判定模块,用于将实时采集的电力大数据输入测试完成的svdd分类器,以判定所述电力大数据为正常数据或异常数据。8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述方法的步骤。9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
技术总结
本发明涉及电力数据异常检测技术领域,公开了一种电力安全的电力大数据流异常检测方法,包括:获取正常电力数据以构成训练样本集,并进行九维特征提取构成特征向量;采用RVM算法进行特征选择,得到低维特征向量;输入预设SVDD分类器进行训练;对低维特征向量进行特征提取,得到测试数据的测试特征向量集合;将测试特征向量集合输入训练完成的SVDD分类器;将实时采集的电力大数据输入测试完成的SVDD分类器,以判定电力大数据为正常数据或异常数据。本发明提供的方法,提取数据的九维特征并利用相关向量机RVM选择特征构成特征向量,采用SVDD分类器对特征向量进行分类,从而实现对电力大数据中异常数据检测。电力大数据中异常数据检测。电力大数据中异常数据检测。
技术研发人员:丁雪 许鑫 陈宇 祝英杰 曹慧 沈鑫 黄巍 梁艾 辛颖
受保护的技术使用者:吉林省电力科学研究院有限公司
技术研发日:2023.01.04
技术公布日:2023/8/4
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
