一种基于动态权重优化的电费收入预测方法与流程

未命名 07-22 阅读:216 评论:0


1.本发明属于电费收入预测领域,涉及了一种基于动态权重优化的电费收入预测方法,特别是使用权重优化的lstm方法对月度电费收入进行预测分析。


背景技术:

2.随着管理部门要求的不断提高,进一步提升排程数据质量,充分发挥现金流按日排程对电网公司精准融资的支撑作用。电费是供电企业的主营业务收入,是供电企业现金流入的重要组成部分。电费收入预测对引导供电企业提质增效、开源节流具有重要作用,是供电企业融资决策重要依据。随着精益化专业管理工作要求逐步提高,年度、每月的售电量和电费收入数据是电网公司的核心经营指标,对其预测准确性的要求越来越高,巨大现金流对公司电费与财务管理提出了更高的要求。受用户负荷、电价调整、新装该类、抄表例日等因素影响,利用传统经验预估月度电费收入预测存在较大误差。
3.长短时记忆网络,是一种改进之后的循环神经网络,可以解决rnn无法处理长距离的依赖的问题,其主要通过三个门控逻辑实现(遗忘、输入、输出)。包含三个阶段:
4.(1)忘记阶段,遗忘门。这个阶段主要是对上一个节点传进来的输入进行选择性忘记。
5.(2)输入阶段,输入门。将新的信息选择性的记录到细胞状态中。
6.(3)输出阶段,输出门。将经过筛选的数据输出到下一个过程。
7.但是受电价政策变更等因素,传统的lstm模型算法无法很好满足电费收入预测需求。


技术实现要素:

8.本发明的目的是为了提高对电费收入的精准性,设计了一种基于动态权重优化的电费收入预测方法,考虑到受电价政策频繁变更等因素影响,通过优化权重与lstm模型并用的方式对电费进行预测。
9.本发明采用的技术方案是,一种基于动态权重优化的电费收入预测方法,所述的预测方法包括如下步骤:
10.a、对电费数据与气象数据进行数据清洗与数据转换,形成样本数据;
11.b、选取影响电费收入预测的因素为:温度、节假日、降水量和电价;
12.c、利用熵权法对样本数据进行权重优化,具体为:
13.c1、经过特征工程筛选的所有指标进行数据标准化处理,其计算公式如下:
[0014][0015]
其中xi为第i个样本值,max(xi)为x特征的最大值,min(xi)为x特征的最小值;
[0016]
c2、对经过标准化的数据进行信息熵计算,其计算公式如下:
[0017][0018]
其中,
[0019]
c3、对样本数据的特征进行加权计算,获得每个特征的权重值,其计算公式如下:
[0020][0021]
其中ei为第i个特征的信息熵,k为特征个数;
[0022]
d、将带有权重的样本数据纳入lstm模型进行预测。
[0023]
所述的步骤d中,在lstm模型预测前还进行模型训练过程,具体包括:
[0024]
d1、将温度、节假日、降水量、电价作为模型的输入x,将电费收入作为模型的输出值y,对于构造出的样本集(x,y),采用训练集、验证集、测试集=6~8:2~3:1的比例进行随机抽取,构建出模型所需要的训练集、验证集、测试集;
[0025]
d2、设定lstm模型的全连接神经网络维度输入输出维度为n,n代表每个样本的特征数,采用adam优化策略对lstm模型进行优化;
[0026]
d3、将训练集的样本输入到(n*n)维度的全连接神经网络,计算方式为:
[0027]
f(x)=δ(w(ωx)+b)
[0028]
其中,δ为激活函数,x为输入数据,f(x)为模型输出值,w为神经网络权重,ω为样本特征权重,b为神经网络偏置项,训练样本经过神经网络计算后,对样本数据进行归一化处理,得到归一化后的结果向量;
[0029]
d4、将步骤d3中归一化后向量输入到lstm模型,分别经过lstm模型中的输入门、遗忘门和输出门,得到包含上下文特征信息的隐含层向量表示;
[0030]
d5、进行惩罚因子训练,提高预测错误的样本的权重,计算公式如下:
[0031][0032]
其中,f
new
(x)为输出门的数值,λ为惩罚因子,|wi|为所有参数的绝对值;
[0033]
d6、借助mse评估模型动态调整据特征权重,并重复步骤d3至d5,反复迭代lstm模型,最终输出预测值。
[0034]
所述的步骤b中,选取方法采用皮尔逊相关分析法,并对特征选择进行降维处理,其中皮尔逊相关系数的表达式如下:
[0035][0036]
其中,x、y代表两种变量,p表示相关系数。
[0037]
本发明的核心技术在于在迭代过程中尝试纠先前模型所产生的错误,迭代次数越多集成产生的错误就越少,即增大预测错误数据的权重值,动态调整样本数据权重,更加合理的进行模型训练与调参,提高模型准确率,引导供电企业提质增效、开源节流,为供电企
业发展、决策提供重要依据。
[0038]
本发明的有益效果是,1、本发明综合考虑内外部影响因素,通过相关性分析找出真正影响电费收入的影响因子,构建多层次电费收入预测模型,有效控制公司资金流入流出,同时为未来项目投资金额和投资方向提供辅助支撑,降低投资风险。2、本发明对lstm算法进行优化,引入惩罚因子,使得模型计算更加合理,大大提高了模型的泛化能力。
具体实施方式
[0039]
本发明在具体实施时,参见如下方法步骤:
[0040]
本发明主要包括数据预处理、特征工程筛选、权重优化、改进lstm模型构建四个主要步骤,具体如下:
[0041]
1、数据预处理
[0042]
数据预处理包含缺失值处理、异常值填充、重复值处理等,利用电费收入数据、气象数据等,构建样本数据宽表,具体预处理内容如下:
[0043]
(1)数据清洗:在数据清洗阶段,主要处理缺失数据、离群点、重复数据。
[0044]
缺失数据处理:主要通过自动填补、手动填补、删除数据方式进行处理。
[0045]
离群点数据处理:离群点数据是远离数据集中其余部分的数据,这部分数据可能由随机因素产生,也可能是由不同机制产生,对于离群点数据的处理,取决于离群点数据的产生原因及应用目的,若离群点数据由随机因素产生,直接忽略或者剔除离群点,若数据是由不同机制产生,则结合相应数据分布及业务特征采用oneclasssvm或isolationforest算法进行处理。
[0046]
重复数据处理:根据数据情况可直接删除或将其中一条数据做随机处理,以扩充训练样本数据量。
[0047]
(2)数据转换:数据类型可以划分为数值型和非数值型,非数值型有类别型和非类别型,其中,类别型特征中如果类别存在排序问题为定序型,若不存在排序问题则为定类型,非类别型是字符串型,以下为不同数据类型的转换方法。
[0048]
非数值型:需要进行类别转换,即将非数值型转换为数值型。
[0049]
定序型:可以使用序号编码,序号编码可以按照大小关系对定序型特征赋予一个数值id。
[0050]
定类型:使用独热编码,如天气,为晴朗,下雨、下雪,独热编码可以把其变为一个三维稀疏向量,晴朗表示为(0,0,1),下雨表示为(0,1,0),下雪表示为(1,0,0)。
[0051]
2、特征工程筛选
[0052]
为更进一步分析电费收入预测与影响因子的相关性,使用皮尔逊相关分析法分析各因素与因变量之间的相关性,并特征选择进行降维处理。其中,皮尔逊相关系数的表达式如下:
[0053][0054]
其中,x、y代表两种变量,p表示相关系数,该数越接近1或-1,则表示两个变量之间的相关性越强。
[0055]
通过相关性分析及特征选择后,最终得到的影响电费收入预测的因素为:温度、节假日、降水量、电价。
[0056]
3、权重优化
[0057]
利用熵权法优化样本数据特征权重。熵权法是对于指标体系中的某项值权重进行调整的方法,即增大预测错误数据的权重值,动态调整样本数据权重,通过熵值来判断某个指标的离散程度,其熵值越小,则说明该指标对指标体系的影响越大。
[0058]
步骤1:数据标准化。将经过特征工程筛选的k个指标进行数据标准化处理,其计算公式如下:
[0059][0060]
其中xi为第i个样本值,max(xi)为x特征的最大值,min(xi)为x特征的最小值。
[0061]
步骤2:信息熵计算。对经过标准化的数据进行信息熵计算,其计算公式如下:
[0062][0063]
其中,
[0064]
步骤3:权重优化。利用信息上对样本数据的特征进行加权计算,获得每个特征的权重值,其计算公式如下:
[0065][0066]
其中ei为第i个特征的信息熵,k为特征个数。
[0067]
最后,将带有权重的样本数据纳入lstm模型进行训练与预测。
[0068]
4、基于动态权重优化的lstm电费收入预测模型
[0069]
步骤1:利用加权样本特征数据构建训练集、验证集、测试集,将温度、节假日、降水量、电价作为模型的输入x,将电费收入作为模型的输出值y,对于构造出的样本集(x,y),采用训练集、验证集、测试集=6:3:1的比例进行随机抽取,最后构建出模型所需要的训练集、验证集、测试集。
[0070]
步骤2:初始化模型训练参数。其中,lstm全连接神经网络维度输入输出维度为n,n代表每个样本的特征数;lstm的隐含层维度设置为128;卷积核大小设置为(2,4,8),模型迭代次数设置为100;模型学习率设置为0.035;dropout率为0.03,模型训练批次数量为64,优化策略采用adam进行模型优化。
[0071]
步骤3:将所述训练样本集输入到(n*n)维度的全连接神经网络,其中n是输入和输出的维度,代表每个训练样本的特征数。该步骤的计算方式为:
[0072]
f(x)=δ(w(ωx)+b)
[0073]
其中,δ为激活函数,x为输入数据,f(x)为模型输出值,w为神经网络权重,ω为样本特征权重,b为神经网络偏置项。
[0074]
同时,训练样本经过神经网络计算后,对样本数据进行归一化处理,得到归一化后的结果向量。
[0075]
步骤4:将步骤3中将训练样本集的归一化向量输入到lstm模型,分别经过lstm中的输入门、遗忘门和输出门,最终得到包含上下文特征信息的隐含层向量表示。各个门的计算方式如下:
[0076]
遗忘门:
[0077]ft
=δ(wf*[h
t-1
,x
t
]+bf)
[0078]
输入门:
[0079]it
=δ(wi*[h
t-1
,x
t
]+bi)
[0080]
输出门:
[0081][0082][0083]ot
=δ(wo*[h
t-1
,x
t
]+bo)
[0084]
其中,代表当前时刻输入的单元状态,c
t
代表当前时刻单元状态;wf,wi,wc,wo代表权重;bf,bi,bc,bo代表偏置项;δ,tanh代表激活函数,h
t
代表当前时刻的隐含层状态,即当前时刻的输出状态,包含了与当前时刻的输入有关的所有信息。
[0085]
经过lstm后得到的隐藏层信息表示如下:
[0086][0087]
其中,表示当前时刻的前向输出,当前时刻的反向输出。
[0088]
步骤5:在lstm后加入激励门,即惩罚因子概念,增加预测错误的样本的权重,使得在训练过程中损失函数下降更快,模型泛化能力更强,惩罚因子计算如下:
[0089][0090]
其中,f
new
(x)为输出门的数值,λ为惩罚因子,|wi|为所有参数的绝对值。
[0091]
步骤6:模型训练,重复步骤3-5,并利用mse(均方误差)评估模型效果,依据模型效果动态调整数据特征权重,反复迭代lstm算法模型,最终输出预测值。均方误差计算公式如下:
[0092][0093]
其中y为真实值,yi为模型预测值,n为样本个数。
[0094]
本发明在进行电费收入预测时,不仅考虑内部电费收入、电价等因素的影响,同时整合外部温度、降水量等外部数据,构建样本数据宽表进行特征分析与提取,保证输入特征与目标特征的关联性。
[0095]
在利用lstm(长短期记忆神经网络)模型构建电费收入预测电费时,引入动态权重方法,在模型训练过程中,增大预测错误数据的权重,使得模型能够提供预测能力,同时引入惩罚因子,避免模型的过拟合,使得模型能够真正用于电费收入预测,服务电力公司经营管理决策。

技术特征:
1.一种基于动态权重优化的电费收入预测方法,其特征在于:所述的预测方法包括如下步骤:a、对电费数据与气象数据进行数据清洗与数据转换,形成样本数据;b、选取影响电费收入预测的因素为:温度、节假日、降水量和电价;c、利用熵权法对样本数据进行权重优化,具体为:c1、经过特征工程筛选的所有指标进行数据标准化处理,其计算公式如下:其中x
i
为第i个样本值,max(x
i
)为x特征的最大值,min(x
i
)为x特征的最小值;c2、对经过标准化的数据进行信息熵计算,其计算公式如下:其中,c3、对样本数据的特征进行加权计算,获得每个特征的权重值,其计算公式如下:其中e
i
为第i个特征的信息熵,k为特征个数;d、将带有权重的样本数据纳入lstm模型进行预测。2.根据权利要求1所述的一种基于动态权重优化的电费收入预测方法,其特征在于:所述的步骤d中,在lstm模型预测前还进行模型训练过程,具体包括:d1、将温度、节假日、降水量、电价作为模型的输入x,将电费收入作为模型的输出值y,对于构造出的样本集(x,y),采用训练集、验证集、测试集=6~8:2~3:1的比例进行随机抽取,构建出模型所需要的训练集、验证集、测试集;d2、设定lstm模型的全连接神经网络维度输入输出维度为n,n代表每个样本的特征数,采用adam优化策略对lstm模型进行优化;d3、将训练集的样本输入到(n*n)维度的全连接神经网络,计算方式为:f(x)=δ(w(ωx)+b)其中,δ为激活函数,x为输入数据,f(x)为模型输出值,w为神经网络权重,ω为样本特征权重,b为神经网络偏置项,训练样本经过神经网络计算后,对样本数据进行归一化处理,得到归一化后的结果向量;d4、将步骤d3中归一化后向量输入到lstm模型,分别经过lstm模型中的输入门、遗忘门和输出门,得到包含上下文特征信息的隐含层向量表示;d5、进行惩罚因子训练,提高预测错误的样本的权重,计算公式如下:
其中,f
new
(x)为输出门的数值,λ为惩罚因子,|w
i
|为所有参数的绝对值;d6、借助mse评估模型动态调整据特征权重,并重复步骤d3至d5,反复迭代lstm模型,最终输出预测值。3.根据权利要求1所述的一种基于动态权重优化的电费收入预测方法,其特征在于:所述的步骤b中,选取方法采用皮尔逊相关分析法,并对特征选择进行降维处理,其中皮尔逊相关系数的表达式如下:其中,x、y代表两种变量,p表示相关系数。

技术总结
本发明公开了一种基于动态权重优化的电费收入预测方法,属于电费收入预测领域,为了提高对电费收入的精准性。所述的预测方法包括如下步骤:a、对电费数据与气象数据进行数据清洗与数据转换,形成样本数据;b、选取影响电费收入预测的因素为:温度、节假日、降水量和电价;c、利用熵权法对样本数据进行权重优化;d、将带有权重的样本数据纳入LSTM模型进行预测。本发明在进行电费收入预测时,不仅考虑内部电费收入、电价等因素的影响,同时整合外部温度、降水量等外部数据,构建样本数据宽表进行特征分析与提取,保证输入特征与目标特征的关联性。性。


技术研发人员:高飞 张慧斌 王浩 张子兴
受保护的技术使用者:北京中恒博瑞数字电力科技有限公司
技术研发日:2023.04.13
技术公布日:2023/7/20
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐