一种电力价格数据的处理方法及装置与流程

未命名 10-19 阅读:132 评论:0


1.本技术涉及计算机领域,尤其涉及一种电力价格数据的处理方法及装置。


背景技术:

2.随着电力改革的逐步深入,在取消工商业目录销售电价后,10千伏及以上用户原则上要直接参与市场交易,而暂无法直接参与市场交易的用户可由电网企业代理购电。电网企业需要为代理购电的工商业用户提供预测电力价格的预测服务,该预测应该是基于省、市的工商业情况,和多种观测、摸底数据进行预测。目前,电力价格预测机制尚不完善,更多靠工人人员经验预测,预测结果的精度低。


技术实现要素:

3.有鉴于此,本技术的主要目的在于提供一种电力价格数据的处理方法及装置,实现提高电力价格的预测精度。
4.本技术第一方面提供了一种电力价格数据的处理方法,该方法包括:
5.获取第一电力价格数据以及电力价格影响因子数据;
6.对第一电力价格数据进行空白值检查,以得到第二电力价格数据;空白值检查包括:当第一电力价格数据中存在空白值时,对第一电力价格数据中的空白值进行插值补充;
7.按照时间序列将第二电力价格数据以及电力价格影响因子数据构建为多变量时间序列矩阵;
8.将多变量时间序列矩阵输入至时间序列矩阵聚类模型,以得到时间序列矩阵聚类模型输出的聚类结果。
9.在本技术第一方面的一些实现方式中,时间序列矩阵聚类模型通过训练图神经网络得到,将多变量时间序列矩阵输入至时间序列矩阵聚类模型,以得到时间序列矩阵聚类模型输出的聚类结果,包括:
10.对多变量时间序列矩阵进行标准化处理,得到标准化后的多变量时间序列矩阵;
11.将标准化后的多变量时间序列矩阵中构造为图结构数据;
12.将图结构数据输入至时间序列矩阵聚类模型中的图卷积模块中进行聚类,以得到图卷积模块输出的聚类结果。
13.在本技术第一方面的一些实现方式中,将标准化后的多变量时间序列矩阵中构造为图结构数据,包括:
14.确定标准后的多变量时间序列矩阵中多个时间点对应的变量所分别对应的一个节点,每个时间点对应的变量包括:每个时间点对应的第二电力价格数据以及电力价格影响因子数据;
15.通过多个时间点对应的变量所分别对应的节点间的二阶邻近度优化节点间的二阶邻近度系数,以得到图结构数据。
16.在本技术第一方面的一些实现方式中,图卷积模块包括:图卷积层和自编码器,将
图结构数据输入至时间序列矩阵聚类模型中的图卷积模块中进行聚类,以得到图卷积模块输出的聚类结果,包括:
17.将图卷积层学习到的图结构数据的图神经网络特定表征和自编码器学习到的图结构数据的特征表征进行结合;
18.根据结合后的图神经网络特定表征和特征表征进行传播学习,以得到图结构数据的结构信息;
19.根据结构信息,通过两个图卷积层对图结构数据中的节点进行聚类,以得到聚类结果。
20.在本技术第一方面的一些实现方式中,该方法还包括:
21.将聚类结果输入至电力价格预测模型,以得到电力价格预测模型输出的预测结果。
22.在本技术第一方面的一些实现方式中,聚类结果包括以下四个分类:第一上升区间、第二上升区间、正常区间以及下落区间。
23.在本技术第一方面的一些实现方式中,电力价格预测模型通过训练长短期记忆网络得到,将聚类结果输入至电力价格预测模型,以得到电力价格预测模型输出的预测结果,包括:
24.将第一上升区间、第二上升区间、正常区间以及下落区间中的电力价格数据分别输入至电力价格预测模型中的多层lstm网络模块中进行预测,以得到预测结果。
25.在本技术第一方面的一些实现方式中,该方法还包括:
26.当第一电力价格数据中存在偏离值大于第一预设阈值的电力价格数据时,将偏离值大于第一预设阈值的电力价格数据剔除;
27.当第一电力价格数据中的空白值数量大于第二预设阈值时,输出第一电力价格数据存在错误的报警信息。
28.在本技术第一方面的一些实现方式中,电力价格影响因子数据包括天气数据、企业开工数据、煤矿数据中至少一种。
29.本技术第二方面提供了一种电力价格数据的处理装置,该装置包括:
30.获取模块,用于获取第一电力价格数据以及电力价格影响因子数据;
31.检查单元,用于对第一电力价格数据进行空白值检查,以得到第二电力价格数据,空白值检查包括:当第一电力价格数据中存在空白值时,对第一电力价格数据中的空白值进行插值补充;
32.构建模块,用于按照时间序列将第二电力价格数据以及电力价格影响因子数据构建为多变量时间序列矩阵;
33.聚类模块,用于将多变量时间序列矩阵输入至时间序列矩阵聚类模型,以得到时间序列矩阵聚类模型输出的聚类结果。
34.本技术第三方面提供了一种计算机设备,设备包括存储器和处理器,处理器用于执行存储器中存储的程序,运行如本技术第一方面中提供的任一项方法。
35.本技术所提供的技术方案具有如下有益效果:
36.通过对第一电力价格数据进行空白值检查并插值补充,可以避免由于数据缺失导致的预测误差和不确定性;将第二电力价格数据以及电力价格影响因子数据构建为多变量
时间序列矩阵,并输入至时间序列矩阵聚类模型中进行聚类得到的聚类结果,该聚类结果可以辅助分析,帮助技术人员发现多变量时间序列矩阵之间存在一定的规律和差异,从而为后续的预测模型选择和建模提供有价值的信息,从而可以提高电力价格的预测精度。
附图说明
37.图1为本技术实施例提供的一种电力价格数据的处理方法的流程示意图;
38.图2为本技术实施例提供的一种数据收集、过滤和报警的流程示意图;
39.图3为本技术实施例提供的又一种电力价格数据的处理方法的流程示意图;
40.图4为本技术实施例提供的又一种电力价格数据的处理方法的流程示意图;
41.图5为本技术实施例提供的又一种电力价格数据的处理方法的流程示意图;
42.图6为本技术实施例提供的又一种电力价格数据的处理方法的流程示意图;
43.图7为本技术实施例提供的又一种电力价格数据的处理方法的流程示意图;
44.图8为本技术实施例提供的一种电力价格数据的处理装置的示意图;
45.图9为本技术实施例提供的一种计算机设备的示意图。
具体实施方式
46.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
47.本技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等,如果存在是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
48.名词解释:
49.电力改革:国家发改委主导的电力企业和电力价格改革,推动电力价格和电力销售部分的市场化的改革。
50.工商业目录销售电价:电网根据发改委要求指定的工商业电力上网结算价格,不随市场供需波动。
51.电力价格:用电用户通过电网使用电力结算的价格。
52.代理购电:工商业用户不方便通过电力市场购买电力,而是通过电网在电力市场中代买。
53.预测算法:一般是机器学习或者神经网络的算法。可以将现有数据输入算法,根据现有数据预测未来的发展趋势的算法。
54.神经网络:神经网络是一系列复杂的算法的统称,神经网络或称作连接模型,它是一种模仿动物神经网络行为特征,进行分布式并行信息处理的算法数学模型。
55.图神经网络:图神经网络(graph neural network,gnn)是指使用神经网络来学习图结构数据,提取和发掘图结构数据中的特征和模式,满足聚类、分类、预测、分割、生成等图学习任务需求的算法总称。
56.长短期记忆人工神经网络:长短期记忆网络(long short-term memory,lstm)是一种时间循环神经网络,是为了解决一般的循环神经网络存在的长期依赖问题而专门设计出来的,所有的循环神经网络都具有一种重复神经网络模块的链式形式。
57.发明人发现,电力价格波动有明显的季节、节假日影响特征,但是在没有特殊情况时基本会保持平稳。但是受特殊情况,例如极端气候、国际大宗商品价格涨跌等影响较为明显,并且单一地采用传统预测算法显然不适合在这些情况下做预测,因此一般的算法会采用处理时间序列的算法模型,将电力价格训练数据通过算法进行训练,得到预测数据。但是,电力价格的影响因素很多,并且仅在在没有特殊情况时会保持平稳,但是受特殊情况,例如极端气候、国际大宗商品价格涨跌等影响明显。算法无法预测到一个特殊情况下,数据特征改变后的价格数据。例如美国德州雪灾后电力价格陡然飙升,这种情况下,显然是无法通过传统数据预测准确。虽然国内开放后也不会出现如此极端的情况,但是随市场波动后难免会有因特殊情况的价格涨跌。因此,神经网络算法预测价格数据的情况往往不够准确,市场的情绪波动不能被算法捕捉。
58.基于这种思考,本技术考虑一种新的电力价格预测方法,虽然无法预测何时出现特殊情况,但是电力价格还是一种受供需影响的价格,价格波动依然遵循市场规则,即供大于求,或供不应求两种情况。因此,市场具有供不应求的消息,电价会处于升高区间。市场具有供大于求的消息,电价就会出于降低区间,而早正常情况,电价则按照正常情况进行波动。
59.有鉴于此,请参阅图1,图1为本技术实施例提供的一种电力价格数据的处理方法的流程示意图,本技术的实施例提供了一种电力价格数据的处理方法具体可以执行以下步骤:
60.s101:获取第一电力价格数据以及电力价格影响因子数据。
61.第一电力价格数据指的是用电用户通过电网使用电力结算的价格,具体地,该第一电力价格数据可以从电力系统的管理系统以及电力交易中心中以日、星期或者月份为长度单元进行获取。电力价格影响因子数据指的是影响电力价格的多个因素所对应的数据。
62.在本技术实施例的一些实现方式中,电力价格影响因子数据包括天气数据、企业开工数据、煤矿数据中至少一种。其中,天气数据指的是收集和记录的天气状况的数据。对于电力价格而言,天气数据可以用来预测电力价格,因为天气因素对电力需求量有着显著的影响,进而会影响电力价格。例如,在寒冷的天气条件下,人们通常会使用更多的暖气和照明设备,又例如在高温天气下,人们会使用更多的空调和冷藏设备,在上述两种情况下,电力需求量均会增加,可能导致电力价格上涨。企业开工数据指的是记录和统计的企业生产和经营活动的数据。企业生产和商业活动作为电力使用的主要来源之一,也对电力价格有较大的影响。例如,在生产旺季,企业需要增加生产规模和工作时间,从而导致电力使用量增加而推高电力价格,又例如,在工业生产和商业活动减少的情况下,电力需求量较少可能会拉低电力价格。煤矿数据指的是记录和统计煤炭生产和运输的数据。对于电力价格而言,煤炭作为主要的电力供应燃料,在煤炭供应不足或价格上涨的情况下,均可能导致电力
生产成本上涨而推高电力价格。
63.在本技术的一些实现方式中,可以通过将运行本技术实施例所提供方法的装置和电力价格发布系统之间建立用于数据采集的接口,从而实现第一电力价格数据的实时采集。
64.s102:对第一电力价格数据进行空白值检查,以得到第二电力价格数据;空白值检查包括:当第一电力价格数据中存在空白值时,对第一电力价格数据中的空白值进行插值补充。
65.第二电力价格数据指的是经过空白值检查后的电力价格数据,需要说明的是,经过空白值检查后,无论是否有对第一电力价格数据进行修改,均称为第二电力价格数据。
66.在本技术的实施例中,具体是对第一电力价格数据进行空白值检查,找出其中值为空的数据值,需要说明的是,在第一电力价格数据中,空白值可以表示为数据缺失或无法获取的值,为避免缺失数据对电力价格预测造成影响,因此需要对空白值的数据进行插值补充。在一些实现方式中,取空白值的前后两个数据的平均值进行插值补充,比如有3个数据,第1个和第3个有数据,就第2个空白,那第2个空白数据可以被插入为第1个和第3个的数据值的平均值。
67.在本技术的一些实现方式中,为了提高第二电力价格数据的数据质量,进一步提高预测精度,可以进一步增加数据质量优化的相关步骤,具体地如下:
68.当第一电力价格数据中存在偏离值大于第一预设阈值的电力价格数据时,将偏离值大于第一预设阈值的电力价格数据剔除。当第一电力价格数据中的空白值数量大于第二预设阈值时,输出第一电力价格数据存在错误的报警信息。
69.其中,偏离值指的是当前数据值相较于上一个数据值的差值,用于描述电力价格的价格浮动。当偏离值超出一定的阈值时,可能对应的是记录错误、异常情况或其他未知原因导致的,进而对后续的预测精度造成影响,因此需要剔除偏离值过大的数据。
70.此外,如果电力价格数据中空白值过多,会导致后续的预测出现较大的误差。并在,如果空白值超过第二阈值,也可以是在前期的数据准备中存在运维人员采集失误等问题造成的。具体地,可以是在空白值大于10%时,在电力系统中发出报警,以提示运维人员进行后续检查。
71.在本技术的一些实现方式中,为了进一步简要概括步骤s102中可能的实现方式,请参见图2所示,图2为本技术实施例提供的一种数据收集、过滤和报警的流程示意图。步骤s102的实现方式具体可以是:首先,采集第一电力价格数据;之后,对第一电力价格进行空白值检查,以剔除偏离值过大的数据;检查数据空白,当空白值的数量大于电力价格数据总数量的10%时,进行报警;当空白值的数量小于电力价格数据地总数的10%时,对空白值进行插值补充;最终得到用于作为模型输入参数的输入数据。
72.在图2所示的流程中,通过别除偏离值大于预设闻值的数据,可以去除异常数据对预测的干扰,提高预测结果的准确性和可靠性;通过对空白值进行插值补充可以将缺失的数据填充上,保证数据的完整性和连续性;通过设置空白值数量的预设域值,并在超过闯值时进行报警,可以及时发现数据异常情况,以便采取相应的措施进行处理,保证电力价格数据的质量和可靠性
73.s103:按照时间序列将第二电力价格数据以及电力价格影响因子数据构建为多变
量时间序列矩阵。
74.时间序列是指将同一统计指标的数值按其发生的时间先后顺序排列而成的数列;多变量时间序列矩阵是指在同一时间点上,记录了多个变量的时间序列数据,并将这些时间序列数据按照时间顺序排列形成的矩阵。在本技术的实施例中,本步骤具体可以是将第二电力数据中不同的电力价格数据和电力价格影响因子数据按照时间先后顺序排列,构建为一个矩阵,其中每一行对应一个时间点,每一列对应至少两个变量(即电力价格以及至少一种电力价格影响因子数据)。这个矩阵可以看作是一个多维数据集,其中每个时间点对应有一组电力价格和电力价格影响因子。
75.在本技术的实施例中,多变量时间序列矩阵x可以用以下公式表示:
76.x={xt1,xt2,...,xtp}
77.其中,每一个时刻t均有p个变量,例如,当电力价格影响因子数据同时采用了天气数据、企业开工数据以及煤矿数据时,此时p=4,即每一个时刻对应有一组由第二电力价格数据、天气数据、企业开工数据以及煤矿数据构成的变量。
78.s104:将多变量时间序列矩阵输入至时间序列矩阵聚类模型,以得到时间序列矩阵聚类模型输出的聚类结果。
79.在本技术的实施例中,将多变量时间序列矩阵作为输入数据,通过时间序列矩阵聚类模型得到对输入数据进行聚类的结果。其中,聚类是一种有中心的分类,是一种将相似的物理或抽象对象的集合分成由类似的对象组成的多个类的过程。由聚类所生成的簇是一组数据对象的集合,这些对象与同一个簇中的对象彼此相似,与其他簇中的对象相异。简单来说,通过聚类可以将不同的数据区分开,将相同的数据聚合。
80.在本技术的实施例中,时间序列矩阵聚类模型是通过训练图神经网络得到的。该图神经网络是一种基于图理论的神经网络。通过将数据构造成图结构,再将图结构的数据通过卷积网络的形式进行学习。其中,图结构是一种数据结构形式,一个图结构应具有顶点、边和全局三个部分组成,具体来说,顶点一般被认为是一种具有属性的实体;边是顶点和顶点之间的关系,分为有方向的关系和无方向的关系两种;全局则是一个全局的值,图神经网络将这种形式的值进入图卷积层中,图卷积模块可以整合节点以及邻居节点信息,对时间序列的潜在时空关系进行学习。
81.对于电力价格数据及各电力价格影响因子数据,可以根据数据变化趋势将其划分为不同的区间,在本技术的一些实现方式中,该聚类结果是一个四分类的聚类结果,包括第一上升区间、第二上升区间、正常区间以及下落区间。其中,第一上升区间可以是指电力价格或其他影响因子呈现上升趋势,并且还没有到达高峰或拐点的区间;第二上升区间可以是指电力价格或其他影响因子呈现上升趋势,并且已经到达高峰或拐点的区间;正常区间可以是指电力价格或电力价格影响因子在一个相对平稳的水平上波动的区间,即该正常区间内存在小幅度波动,但整体上没有呈现明显上升或下落的趋势;下落区间可以是指电力价格或其他影响因子呈现逐渐下降的趋势。需要说明的是,也可以采用其他根据数据特点进行分类方式或其他分类的数量,均不影响本技术该实施例的实现。
82.在图1所示的步骤中,首先,获取第一电力价格数据以及电力价格影响因子数据,对第一电力价格数据进行空白值检查得到第二电力价格数据,并按照时间序列将第二电力价格数据以及电力价格影响因子数据构建为多变量时间序列矩阵,由此完成前期的数据准
备;之后,将多变量时间序列矩阵输入至图神经网络中进行聚类,得到聚类结果。该聚类结果可以辅助分析,帮助技术人员发现多变量时间序列矩阵之间存在一定的规律和差异,从而为后续的预测模型选择和建模提供有价值的信息,从而可以提高电力价格的预测精度。
83.请参见图3所示,图3为本技术提供的又一种电力价格数据的处理方法的流程示意图,在图1所示的基础上,时间序列矩阵聚类模型是通过训练图神经网络得到的,步骤s104具体可以包括以下步骤:
84.s301:对多变量时间序列矩阵进行标准化处理,得到标准化后的多变量时间序列矩阵。
85.在本技术的实施例中,进行标准化处理的目的在于使多变量时间序列矩阵中的数据具有可比性,标准化处理是指将多变量时间序列矩阵中的每个变量按照一定的规则进行归一化处理,例如,将每个变量减去均值并除以标准差,使得每个变量的数据都在相同的数值范围内,具体地,矩阵的标准化处理具体可以采用以下公式进行处理:
[0086][0087][0088][0089]
其中,x(tp)指的是t时刻的p=1、2、3或4时的值,需要说明的是,此处是以变量包括电力价格数据以及三种电力价格影响因子数据为例,也就是说,当每个t时刻仅包括电力价格数据以及一种电力价格影响因子数据时,p=1或2。μ指的是某段时间内的x(tp)的均值,σ指的是标准差,n指的是x的个数,σ2指的是方差。
[0090]
s302::将标准化后的多变量时间序列矩阵中构造为图结构数据。
[0091]
在本技术实施例中,可以将标准化后的多变量时间序列矩阵中每个时间点看作是一个节点,节点之间的边代表变量之间的关系,构造出的图结构数据可以输入至时间序列矩阵聚类模型中进行聚类。参见图4所示,图4为本技术实施例提供的又一种电力价格数据的处理方法的流程示意图,步骤s302具体包括以下步骤:
[0092]
s401:确定所标准后的多变量时间序列矩阵中多个时间点对应的变量所分别对应的一个节点。
[0093]
其中,每个时间点对应的变量包括:每个时间点对应的第二电力价格数据以及电力价格影响因子数据。
[0094]
在本技术的实施例中,本步骤可以将多变量时间序列矩阵理解为一个节点集合,并且节点集合中的每个节点对应的是多变量时间序列矩阵中的一个时间点和对应的多个变量。
[0095]
s402:通过多个时间点对应的变量所分别对应的节点间的二阶邻近度优化节点间的二阶邻近度系数,以得到图结构数据。
[0096]
在本技术的实施例中,二阶邻近度指的是节点之间的二次邻居关系,即通过一个中间节点可以连接到的节点。例如,如果节点a和节点c之间没有直接连接,但是通过节点b可以连接到,则节点b是节点a和节点c的一个二阶邻居。在本技术实施例中,节点间的二阶
邻近度越高。即两个节点之间的共同邻居越多,则可以认为节点间的相似度越高。在图结构数据中,通过优化二阶邻近度系数,可以使得两个节点间的相关性或相似度更加准确,具体而言,如果二阶邻近度系数的高于预设的参数阈值,则可以认为两者有联系。此外,本步骤也可以理解为是标准化后的多变量时间序列矩阵经过图结构构造得到一个具有方向性的稀疏图邻接矩阵的过程。
[0097]
s303:将图结构数据输入至时间序列矩阵聚类模型中的图卷积模块中进行聚类,以得到图卷积模块输出的聚类结果。
[0098]
在本技术的实施例中,图卷积模块包括:图卷积层和自编码器,图卷积模块能够整合图结构数据中各节点的信息,并通过参数调节对各节点进行差异化分析。具体而言,参见图5所示,图5为本技术实施例提供的又一种电力价格数据的处理方法的流程示意图,步骤s303具体可以包括以下步骤:
[0099]
s501:将图卷积层学习到的图结构数据的图神经网络特定表征和自编码器学习到的图结构数据的特征表征进行结合。
[0100]
在本技术的实施例中,特征表征和特定表征均是用于描述图结构数据的向量表示,下文将特征表征和特定表征统称为表征向量。在图卷积网络中,每个节点会在每一图卷积层的图卷积操作中被更新,每次更新会将节点本身的特征与其邻居节点的特征进行聚合并更新,这样,节点的特征会被逐步更新和传播,形成一种图结构数据的特定表征,即图神经网络特定表征。而在自编码器中,也会学习到一种图结构数据的特征表征,自编码器的目的是将图结构数据数据通过一个编码器转换为一个低维度的编码向量,再通过一个解码器将编码向量转换回原始数据,在这个过程中,编码器和解码器都会学习到输入的图结构数据的特征表征。
[0101]
在本技术实施例的一些方式中,将图神经网络的特定表征和图结构数据的特征的特征表征进行结合的过程可以是将两种表征向量进行拼接、加权求和或其他方式进行结合,可以得到新的表征向量,即结合后的特定表征和特征表征。该新的表征向量可以用于辅助模型更好地捕捉图结构数据的结构信息。
[0102]
s502:根据结合后的图神经网络特定表征和特征表征进行传播学习,以得到图结构数据的结构信息。
[0103]
在本步骤中,将结合后的特定表征和特征表征作为输入数据,并通过传播学习的过程学习到图结构数据的结构信息,从而为后续的聚类任务提供基础。
[0104]
s503:根据结构信息,通过两个图卷积层对图结构数据中的节点进行聚类,以得到聚类结果。
[0105]
在本技术的实施例中,通过两个图卷积层相当于通过两次图结构算法增加图结构数据的数据特征,以使得数据特征增强后的图结构数据中的各节点的聚类结果更加准确。
[0106]
在图3所示的流程中,将多变量时间序列矩阵进行标准化处理,使得各个变量的数据在数值上具有可比性,有利于后续的聚类;将多变量时间序列矩阵构造为图结构数据,可以充分考虑到各变量之间的相关性;而利用图卷积模块进行聚类,将相邻的节点进行聚类,从而更加准确地分析数据之间的联系。因此,整体上可以提高数据聚类的准确性,得到的聚类结构有助于进一步优化电力价格的预测精度。
[0107]
请参见图6所示,图6为本技术提供的又一种电力价格数据的处理方法的流程示意
图,在图1所示的基础上,增加了利用聚类结果进行电力价格预测的相关步骤,具体包括:
[0108]
s601:获取第一电力价格数据以及电力价格影响因子数据。
[0109]
s602:对第一电力价格数据进行空白值检查,以得到第二电力价格数据。
[0110]
其中,空白值检查包括:当第一电力价格数据中存在空白值时,对第一电力价格数据中的空白值进行插值补充。
[0111]
s603:按照时间序列将第二电力价格数据以及电力价格影响因子数据构建为多变量时间序列矩阵。
[0112]
s604:将多变量时间序列矩阵输入至时间序列矩阵聚类模型,以得到时间序列矩阵聚类模型输出的聚类结果。
[0113]
需要说明的是,上述步骤s501至s504的具体实施方式已在步骤s101至s104中进行了说明,本技术在此方面不再赘述。
[0114]
s605:将聚类结果输入至电力价格预测模型,以得到电力价格预测模型输出的预测结果。
[0115]
在本技术的实施例中,输入电力价格预测模型的聚类结果是一个包含第一上升区间、第二上升区间、正常区间以及下落区间这四个分类的聚类结果。
[0116]
在本技术的实施例中,电力价格预测模型通过训练长短期记忆网络得到的。长短期记忆网络指的是一种循环神经网络,不同于传统的卷积算法的是,长短期记忆网络通过在循环神经网络算法中加入门结构,可以对信息进行添加和删除操作。因此,长短期记忆网络更利于将有利的信息留下,不利的信息删除,并将这种留下的信息用于增强数据的特征。长短期记忆网络包含多个重复结构,其中,每个重复结构被称为一个细胞,每个细胞都可以保留一部分信息,并选择性的增加或忘记新的信息。该重复结构具有一个sigmoid点乘、一个sigmiod和tanh函数的点乘组成的状态机,同时重复结构的输出部分由一个被sigmoid函数和tanh函数点乘的状态机组成,用于与下一个重复结构传递信息。状态机的输出部分经过sigmod门函数的选择和tanh函数的点乘组成的门,形成输出。输出时,可以通过sigmod函数对输出进行选择,具体来说,sigmod函数可以控制细胞状态中哪些部分可以被输出,通过进一步调节sigmod函数,可以进一步获取更优的预测结果。
[0117]
在本技术的实施例中,将聚类结果输入至电力价格预测模型,以得到电力价格预测模型输出的预测结果,具体包括:
[0118]
将第一上升区间、第二上升区间、正常区间以及下落区间中的电力价格数据分别输入至电力价格预测模型中的多层lstm网络模块中进行预测,以得到预测结果。
[0119]
其中,多层lstm网络模块是指由多个lstm层堆叠在一起形成的神经网络模块。在多层lstm网络模块中,每个lstm层都会接收上一层的输出作为自己的输入,通过多层lstm网络模块的堆叠,可以增加神经网络的深度,从而提高模型预测精度。作为一种可选的实施方式,可以在预测过程中调节参数,如sigmoid函数的参数,来获得最优的预测结果。
[0120]
在图6所示的流程中,将聚类结果导入至电力价格预测模型,以得到预测结果。整体上,通过图神经网络和长短期记忆网络构建了一个实现对电力价格数据进行先聚类再回归的电力价格预测,通过先聚类的方式将电力价格数据波动形态进行分类,再通过长短期记忆模型对分类后的电力价格数据进行预测,提高了电力价格的预测精度。
[0121]
参见图7所示,图7为本技术实施例提供的又一种电力价格处理方法的流程示意
图,通过简要的概括对图6所示的流程在整体上进行简要介绍。
[0122]
首先,获取第二电力价格数据以及电力价格影响因子数据,并基于电力价格数据以及电力价格影响因子数据构建多变量时间序列矩阵;然后。对多变量时间序列矩阵进行特征处理,具体可以是对矩阵进行标准化处理;接着,将处理后的多变量时间序列矩阵输入至图神经网络的图学习构造模块进行图结构构造,该图学习构造模块最终会输出一个图结构数据;之后,将图结构数据输入至图神经网络中的图卷积模块进行聚类处理;然后,聚类结果处理层将聚类结果处理成一个四分类的聚类结果,并输入至长短期记忆网络的算法层中进行预测,以得到最终的预测结果。
[0123]
参见图8所示,图8为本技术实施例提供的一种电力价格数据的处理装置的示意图,该装置包括:
[0124]
获取模块801,用于获取第一电力价格数据以及电力价格影响因子数据;
[0125]
检查单元802,用于对第一电力价格数据进行空白值检查,以得到第二电力价格数据;空白值检查包括:当第一电力价格数据中存在空白值时,对第一电力价格数据中的空白值进行插值补充;
[0126]
构建模块803,用于按照时间序列将第二电力价格数据以及电力价格影响因子数据构建为多变量时间序列矩阵;
[0127]
聚类模块804,用于将多变量时间序列矩阵输入至时间序列矩阵聚类模型,以得到时间序列矩阵聚类模型输出的聚类结果。
[0128]
在本技术的一些实现方式中,时间序列矩阵聚类模型通过训练图神经网络得到,该聚类模块具体用于:
[0129]
对多变量时间序列矩阵进行标准化处理,得到标准化后的多变量时间序列矩阵;
[0130]
将标准化后的多变量时间序列矩阵中构造为图结构数据;
[0131]
将图结构数据输入至时间序列矩阵聚类模型中的图卷积模块中进行聚类,以得到图卷积模块输出的聚类结果。
[0132]
在本技术的一些实现方式中,将标准化后的多变量时间序列矩阵中构造为图结构数据,包括:
[0133]
确定标准后的多变量时间序列矩阵中多个时间点对应的变量所分别对应的一个节点,每个时间点对应的变量包括:每个时间点对应的电力价格数据以及电力价格影响因子数据;
[0134]
通过多个时间点对应的变量所分别对应的节点间的二阶邻近度优化节点间的二阶邻近度系数,以得到图结构数据。
[0135]
在本技术的一些实现方式中,图卷积模块包括:图卷积层和自编码器,将图结构数据输入至时间序列矩阵聚类模型中的图卷积模块中进行聚类,以得到图卷积模块输出的聚类结果,包括:
[0136]
将图卷积层学习到的图结构数据的图神经网络特定表征和自编码器学习到的图结构数据的特征表征进行结合;
[0137]
根据结合后的图神经网络特定表征和特征表征进行传播学习,以得到图结构数据的结构信息;
[0138]
根据结构信息,通过两个图卷积层对图结构数据中的节点进行聚类,以得到聚类
结果。在本技术的一些实现方式中,该装置该包括:
[0139]
预测模块,用于将聚类结果输入至电力价格预测模型,以得到电力价格预测模型输出的预测结果。
[0140]
在本技术的一些实现方式中,聚类结果包括以下四个分类:第一上升区间、第二上升区间、正常区间以及下落区间。
[0141]
在本技术的一些实现方式中,预测模块具体用于:
[0142]
将第一上升区间、第二上升区间、正常区间以及下落区间中的电力价格数据分别输入至电力价格预测模型中的多层lstm网络模块中进行预测,以得到预测结果。
[0143]
在本技术的一些实现方式中,该装置该包括:
[0144]
剔除模块,用于当第一电力价格数据中存在偏离值大于第一预设阈值的电力价格数据时,将偏离值大于第一预设阈值的电力价格数据剔除;
[0145]
报警模块,用于当第一电力价格数据中的空白值数量大于第二预设阈值时,输出第一电力价格数据存在错误的报警信息。
[0146]
在本技术的一些实现方式中,电力价格影响因子数据包括天气数据、企业开工数据、煤矿数据中至少一种。
[0147]
如图9所示,本技术实施例还提供了一种计算机设备,包括:存储器901、处理器902;
[0148]
其中,存储器901用于存储程序;
[0149]
处理器902用于执行存储器中的程序,以实现本技术实施例所提供的一种电力价格数据的处理方法。
[0150]
最后,还需要说明的是,在本技术实施例中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0151]
对所公开的实施例的上述说明,使本领域技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

技术特征:
1.一种电力价格数据的处理方法,其特征在于,所述方法包括:获取第一电力价格数据以及电力价格影响因子数据;对所述第一电力价格数据进行空白值检查,以得到第二电力价格数据,所述空白值检查包括:当所述第一电力价格数据中存在空白值时,对所述第一电力价格数据中的空白值进行插值补充;按照时间序列将所述第二电力价格数据以及所述电力价格影响因子数据构建为多变量时间序列矩阵;将所述多变量时间序列矩阵输入至时间序列矩阵聚类模型,以得到所述时间序列矩阵聚类模型输出的聚类结果。2.根据权利要求1所述的方法,其特征在于,所述时间序列矩阵聚类模型通过训练图神经网络得到,所述将所述多变量时间序列矩阵输入至时间序列矩阵聚类模型,以得到所述时间序列矩阵聚类模型输出的聚类结果,包括:对所述多变量时间序列矩阵进行标准化处理,得到标准化后的多变量时间序列矩阵;将所述标准化后的多变量时间序列矩阵中构造为图结构数据;将所述图结构数据输入至所述时间序列矩阵聚类模型中的图卷积模块中进行聚类,以得到所述图卷积模块输出的聚类结果。3.根据权利要求2所述的方法,其特征在于,所述将所述标准化后的多变量时间序列矩阵中构造为图结构数据,包括:确定所述标准后的多变量时间序列矩阵中多个时间点对应的变量所分别对应的一个节点,所述每个时间点对应的变量包括:每个时间点对应的所述电力价格数据以及所述电力价格影响因子数据;通过所述多个时间点对应的变量所分别对应的节点间的二阶邻近度优化所述节点间的二阶邻近度系数,以得到所述图结构数据。4.根据权利要求2所述的方法,其特征在于,所述图卷积模块包括:图卷积层和自编码器,所述将所述图结构数据输入至所述时间序列矩阵聚类模型中的图卷积模块中进行聚类,以得到所述图卷积模块输出的聚类结果,包括:将所述图卷积层学习到的所述图结构数据的图神经网络特定表征和所述自编码器学习到的所述图结构数据的特征表征进行结合;根据结合后的图神经网络特定表征和特征表征进行传播学习,以得到所述图结构数据的结构信息;根据所述结构信息,通过两个所述图卷积层对所述图结构数据中的节点进行聚类,以得到所述聚类结果。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:将所述聚类结果输入至电力价格预测模型,以得到所述电力价格预测模型输出的预测结果。6.根据权利要求5所述的方法,其特征在于,所述聚类结果包括以下四个分类:第一上升区间、第二上升区间、正常区间以及下落区间。7.根据权利要去6所述的方法,其特征在于,所述电力价格预测模型通过训练长短期记忆网络得到,所述将所述聚类结果输入至电力价格预测模型,以得到所述电力价格预测模
型输出的预测结果,包括:将所述第一上升区间、所述第二上升区间、所述正常区间以及所述下落区间中的电力价格数据分别输入至电力价格预测模型中的多层lstm网络模块中进行预测,以得到所述预测结果。8.根据权利要求1所述的方法,其特征在于,所述方法还包括:当所述第一电力价格数据中存在偏离值大于第一预设阈值的电力价格数据时,将所述偏离值大于第一预设阈值的电力价格数据剔除;当所述第一电力价格数据中的空白值数量大于第二预设阈值时,输出所述第一电力价格数据存在错误的报警信息。9.根据权利要求1所述的方法,其特征在于,所述电力价格影响因子数据包括天气数据、企业开工数据、煤矿数据中至少一种。10.一种电力价格预测装置,其特征在于,所述装置包括:获取模块,用于获取第一电力价格数据以及电力价格影响因子数据;检查单元,用于对所述第一电力价格数据进行空白值检查,以得到第二电力价格数据,所述空白值检查包括:当所述第一电力价格数据中存在空白值时,对所述第一电力价格数据中的空白值进行插值补充;构建模块,用于按照时间序列将所述第二电力价格数据以及所述电力价格影响因子数据构建为多变量时间序列矩阵;聚类模块,用于将所述多变量时间序列矩阵输入至时间序列矩阵聚类模型,以得到所述时间序列矩阵聚类模型输出的聚类结果。11.一种计算机设备,其特征在于,所述设备包括存储器和处理器,所述处理器用于执行所述存储器中存储的程序,运行如权利要求1-9任一项所述的方法。

技术总结
本申请公开了一种电力价格数据的处理方法及装置,涉及计算机领域,该方法包括:获取第一电力价格数据以及电力价格影响因子数据;对所述第一电力价格数据进行空白值检查,以得到第二电力价格数据;所述空白值检查包括:当所述第一电力价格数据中存在空白值时,对所述第一电力价格数据中的空白值进行插值补充;按照时间序列将所述第二电力价格数据以及所述电力价格影响因子数据构建为多变量时间序列矩阵;将所述多变量时间序列矩阵输入至时间序列矩阵聚类模型,以得到所述时间序列矩阵聚类模型输出的聚类结果。该聚类结果用于辅助技术人员进行电力价格预测,以提高电力价格预测精度。度。度。


技术研发人员:程思远 石文娟 熊根鑫 江再玉 李云 杨冰 马晶 宋振世 李礼 李力 李淑贤
受保护的技术使用者:北京中电普华信息技术有限公司
技术研发日:2023.06.19
技术公布日:2023/10/15
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐