一种结合多窗口融合方法和聚焦框架模型的建筑能耗预测方法及系统
未命名
10-18
阅读:105
评论:0
1.本发明属于新一代信息技术领域,更具体地,涉及一种结合多窗口融合方法和聚焦框架模型的建筑能耗预测方法及系统。
背景技术:
2.随着全球经济的快速发展,能源消耗问题已经成为了全球焦点问题,建筑能耗作为能耗形式的一种,正消耗着大量的能源和资源,占全球41%的能耗和21%的二氧化碳排放,其中建筑能源消耗最大的是空调系统,占总能耗的40%以上(参考文献“王寒,程清.中国公寓建筑热湿独立处理空调系统全年能耗仿真及对比分析[j].能源研究与利用,2023(01):27-30+54.”中背景介绍部分的第二段)。面对日益匮乏的资源,持续有效的能源管理成为当前社会在经济、环境和政治层面急需解决的问题。准确的建筑能耗预测有助于降低企业的用电成本,建设低碳城市。
[0003]
近些年,随着人工智能的发展,人工智能算法逐渐被引入到建筑能耗的预测模型当中,以进一步提高预测的精度。人工智能模型通过大量的的样本数据对模型进行训练,才能够得到较好的预测效果。
[0004]
本领域技术人员公知:采集到的样本数据的种类越多,对于建筑能耗的预测精度越准确。影响建筑能耗的因素有很多,主要可以分为三类:一是建筑自身因素,如建筑体型参数、遮阳系数、墙窗面积比等;二是建筑使用情况,如室内人员密度、室内温度和相对湿度、设备功率等;三是外界影响因素,如外界气候条件、海拔、节假日等。但是在实际应用中很难获取建筑体型系数、遮阳系数、墙窗比等完整数据参数,而人员密度,设备参数等都需要安装大量的设备进行采样方可以获取,采集会需要极大的成本投入,而且目前很多已建建筑,涉及到设备稳定性及老旧等原因均不具备这方面的数据采样功能。
[0005]
现有技术(专利cn111753470b)在对建筑能耗预测时采用的样本数据包括4个方面:(1)建筑外部气象条件参数包括:室外温度、相对湿度、太阳辐照度和风速;(2)建筑自身情况:分为体形参数和热工参数,体形参数包括层数、建筑朝向、建筑面积,建筑长宽比和窗墙面积比,热工参数包括外墙传热系数、屋顶传热系数和遮阳系数;(3)建筑使用情况包括:室内温度、人员密度和照明功率密度;(4)空调系统因子包括:人均新风量、送风温度、制冷机组cop、风机效率和水泵效率。现有技术(专利cn114880959b)中建筑能耗模型的输入变量有负荷相关变量和机电相关变量。本领域技术人员公知,负荷相关变量有建筑的占地面积和体积、建筑的用途和人流、建筑的保温性能、环境因素等等,机电相关变量有hvac系统的效率、照明设备的效率、设备的使用时间、建筑的维护和管理情况等等。现有技术在采集建筑能耗数据样本时需要的样本种类过多,从而导致样本数据采集困难成本高,获得的样本数据资源就更加珍贵。
[0006]
建筑能耗样本数据的采集种类多难度大、成本高,导致建筑能耗样本数据量往往较小,不足以直接支撑人工智能模型,而且采集到的样本数据经常会有所缺失,从而对于采
集到的少量的有缺失的样本数据,目前常用的方式是对样本数据进行补齐。现有技术(cn109685252b)在获取建筑能耗数据样本集时采用“多个相似时间点数据平均”法补齐个别时间点遗缺的数据。现有技术(cn114880959b)对缺失数据做如下方式的补齐:当初始数据集缺少历史能耗数据时,对根据历史能耗数据补齐关键变量后的实际建筑数据集进行关键变量的关联规则挖掘,利用挖掘出的关联规则,从初始数据集中的已知关键变量对缺失关键变量进行推测,从而获取需要输入的全部关键变量数据。然而,无论用哪种方式补齐的缺失数据,补齐的数据与真实数据之间必然存在差异,从而对模型的训练和预测均会产生不利影响。
[0007]
目前人工智能模型在对建筑能耗进行预测时,最大的问题是2种数据采集方法均存在问题:一种方法是采集种类繁多的样本数据,但这种方法采集难度大、采集成本高;另一种方法是采集少量样本数据,但是经常存在样本数据缺失的情况,这就需要对缺失部分进行数据补齐,但补齐的数据与真实数据间必然存在偏差,从而无法对模型进行有效的训练,给模型的预测带来更大的偏差。以上问题目前均没有解决方案,严重制约了人工智能模型在建筑能耗预测领域的应用及发展。
技术实现要素:
[0008]
针对人工智能模型在对建筑能耗进行预测时现有技术存在的2个技术偏见:一是采集的样本数据种类多、采集难度大、成本高;二是需要对有限的样本数据缺失部分进行补齐来获得足够多的样本数据。本发明提出了一种结合多窗口融合方法和聚焦框架模型的建筑能耗预测方法巧妙地克服了现有技术的偏见:仅仅需要三种容易获得的、真实的样本数据即可对人工智能模型进行有效的训练,从而模型取得更高的预测精度。
[0009]
本发明提出的技术方案如下:一种结合多窗口融合方法和聚焦框架模型的建筑能耗预测方法,包括以下步骤:
[0010]
步骤1,采集目标建筑的样本数据
[0011]
采集目标建筑的每日能耗数据,所述每日能耗数据是指每日用电量、当日的最高气温、当日的最低气温;
[0012]
步骤2,样本数据预处理
[0013]
将步骤1采集到的每日能耗数据进行异常值剔除和数据归一化处理;
[0014]
处理后的每日能耗数据集s={(d1,pc1,th1,tl1),......,(di,pci,thi,tli)......,(dn,pcn,thn,tln)};其中d为日期,pc为当日用电量,th为当日的最高气温,tl为当日最低气温,i表示第i个能耗样本数据,i∈n,n表示采集到的能耗数据的天数;
[0015]
步骤3,采用多窗口融合方法构造能耗-时间序列样本
[0016]
采用多窗口融合方法将步骤2获得的每日能耗数据按时间长度进行连续切分,构造出多个能耗-时间序列样本,所述的每个能耗-时间序列样本由一个主窗口能耗-时间序列样本和多个辅助窗口能耗-时间序列样本组成,所述辅助窗口能耗-时间序列样本是对主窗口能耗-时间序列样本长度的增加或减少,同一个每日能耗数据被多次利用到同一个能耗-时间序列样本的主窗口能耗-时间序列样本和辅助窗口能耗-时间序列样本中,以及不同的能耗-时间序列样本中;
[0017]
步骤4,训练聚焦框架模型
[0018]
聚焦框架模型利用训练集进行迭代训练,再利用验证集得到最终的模型权重;根据训练集与验证集的划分比例将步骤3所述的能耗-时间序列样本分成训练集与验证集,将训练集输入到聚焦框架模型进行训练,在训练的迭代次数达到设定的迭代次数后,使用验证集输入到聚焦框架模型,挑选预测值与验证集之间的均方根误差最小的模型权重作为最终的模型权重;优选地,所述划分比例介于4:1~5:1之间;优选地,所述迭代次数取值范围为[100,800],更优选地,步长为100。
[0019]
步骤5,预测建筑能耗数据
[0020]
利用步骤4获得的最终的模型权重对建筑能耗进行预测。
[0021]
本发明还提供了一种结合多窗口融合方法和聚焦框架模型的建筑能耗预测系统,包括:
[0022]
(1)数据采集模块:该模块负责采集目标建筑的每日用电量、当日的最高气温、当日的最低气温,这种数据采集机制允许模型更深入地理解建筑的能源使用情况;
[0023]
(2)数据预处理模块:在数据采集之后,该模块将进行数据的清理和规范化,会剔除异常值,包括明显的错误值和空值,并使用最大最小值归一化处理方法对数据进行归一化,以确保数据的有效性和一致性;
[0024]
(3)多窗口融合模块:该模块负责将预处理后的每日能耗数据进行连续切分,构造出多条能耗-时间序列样本,每条能耗-时间序列样本包括一个主窗口能耗-时间序列样本和多个辅助窗口能耗-时间序列样本,这有助于充分利用样本数据并且改善样本数据量少的问题;
[0025]
(4)模型训练模块:该模块利用能耗-时间序列样本对聚焦框架模型进行训练。按照预设的划分比例将能耗-时间序列样本划分为训练集和验证集,然后使用训练集进行模型训练,在训练的迭代次数达到设定的迭代次数后,使用验证集输入到聚焦框架模型,在训练过程中,会追踪均方根误差,并选择使其最小化的模型权重作为最终的模型权重;优选地,划分比例介于4:1~5:1之间;优选地,迭代次数取值范围为[100,800],更优选地,步长为100;
[0026]
(5)能耗预测模块:这个模块负责使用训练好的聚焦框架模型进行建筑能耗预测,把训练中获得的最终模型权重作为预测权重,然后基于这些权重对建筑能耗进行预测。
[0027]
与现有技术相比,本发明创新性地提出了一种结合多窗口融合方法和聚焦框架模型的建筑能耗预测方法及系统,有益效果有:
[0028]
(1)本发明克服了现有技术中的2个技术偏见:采集的样本数据种类多采集难度大采集成本高;采集到的样本数据量少,需要对有限样本数据的缺失部分进行补齐,本发明的样本数据只需要采集目标建筑的每日用电量、当日的最高气温和最低气温,这三种样本数据容易得到,采集成本极低,本发明不需要对样本的缺失数据进行补齐仅仅采用真实数据,具备巨大的创新;
[0029]
(2)本发明的各部分整体协同作用、不可拆分,仅仅利用三种容易获得的、真实的数据对模型进行训练,训练出的模型能够达到更高的预测精度。
附图说明
[0030]
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现
有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
[0031]
图1是本发明一种结合多窗口融合方法和聚焦框架的建筑能耗预测方法的流程示意图;
[0032]
图2是本发明使用的多窗口融合方法框架示意图;
[0033]
图3是本发明使用的聚焦框架模型的示意图。
具体实施方式
[0034]
下面将结合实施例和附图进一步阐述本发明。应理解,实施例仅用于说明本发明,而非限制本发明的范围。在不背离本发明构思的精神和范围下,本领域技术人员能够想到的变化和优点,都被包括在本发明中,并且以所附的权利要求书及等同内容为保护范围。
[0035]
可以理解的是,术语“一”应理解为“至少一”或“一个或多个”,即在一个实施例中,一个元件的数量可以为一个,而在另外的实施例中,该元件的数量可以为多个,术语“一”不能理解为对数量的限制。在本发明中,除发明人已经明确定义的名称和术语,其他的名称和术语为本领域的通用名称。
[0036]
在本发明的一个实施例中,提供了一种结合多窗口融合方法和聚焦框架模型的建筑能耗预测方法,如图1所示,包括以下步骤:
[0037]
步骤1,采集目标建筑的样本数据
[0038]
采集目标建筑的每日能耗数据,所述每日能耗数据是指每日用电量、当日的最高气温、当日的最低气温;
[0039]
步骤2,样本数据预处理
[0040]
将步骤1采集到的每日能耗数据进行异常值剔除和数据归一化处理;
[0041]
处理后的每日能耗数据集s={(d1,pc1,th1,tl1),......,(di,pci,thi,tli)......,(dn,pcn,thn,tln)};其中d为日期,pc为当日用电量,th为当日的最高气温,tl为当日最低气温,i表示第i个能耗样本数据,i∈n,n表示采集到的能耗数据的天数;
[0042]
步骤3,采用多窗口融合方法构造能耗-时间序列样本
[0043]
采用多窗口融合方法将步骤2获得的每日能耗数据按时间长度进行连续切分,构造出多个能耗-时间序列样本,所述的每个能耗-时间序列样本由一个主窗口能耗-时间序列样本和多个辅助窗口能耗-时间序列样本组成,所述辅助窗口能耗-时间序列样本是对主窗口能耗-时间序列样本长度的增加或减少,同一个每日能耗数据被多次利用到同一个能耗-时间序列样本的主窗口能耗-时间序列样本和辅助窗口能耗-时间序列样本中,以及不同的能耗-时间序列样本中;
[0044]
步骤4,训练聚焦框架模型
[0045]
聚焦框架模型利用训练集进行迭代训练,再利用验证集得到最终的模型权重;根据训练集与验证集的划分比例将步骤3所述的能耗-时间序列样本分成训练集与验证集,将训练集输入到聚焦框架模型进行训练,在训练的迭代次数达到设定的迭代次数后,使用验证集输入到聚焦框架模型,挑选预测值与验证集之间的均方根误差最小的模型权重作为最终的模型权重;优选地,所述划分比例介于4:1~5:1之间;优选地,所述迭代次数取值范围
为[100,800],更优选地,步长为100;参数的设定需要根据实验结果不断优化调整,得到效果最佳的一系列超参数设置。
[0046]
步骤5,预测建筑能耗数据
[0047]
利用步骤4获得的最终的模型权重对建筑能耗进行预测。
[0048]
在本发明的又一个实施例中,如图2所示,步骤3所述的多窗口融合方法的具体实现方式如下:
[0049]
3.1)设定历史能耗-时间序列长度为m;
[0050]
3.2)设定未来能耗-时间序列长度为n;
[0051]
3.3)设定在n的基础上前后的序列长度偏差为e;
[0052]
3.4)对每日能耗数据集进行连续切分,构造出若干长度为m+n+e的能耗-时间序列样本;
[0053]
所述m、n、e均为正整数,步长均为1且满足e<n;所述连续切分是指将按时间排序的每日能耗数据进行逐个滑动切分,相邻的能耗-时间序列样本只有首尾2个每日能耗数据不一样;
[0054]
所述能耗-时间序列为:
[0055]
s1={(d1,pc1,th1,tl1)......(d
m+n+e
,pc
m+n+e
,th
m+n+e
,tl
m+n+e
)};
[0056]
s2={(d2,pc2,th2,tl2)......(d
m+n+e+1
,pc
m+n+e+1
,th
m+n+e+1
,tl
m+n+e+1
)};
[0057]sx
={(d
x
,pc
x
,th
x
,tl
x
)......(d
x+m+n+e-1
,pc
x+m+n+e-1
,th
x+m+n+e-1
,tl
x+m+n+e-1
)}
[0058]
其中,x是正整数,s
x
表示第x个能耗-时间序列,x+m+n+e-1≥n,每个能耗-时间序列的长度为m+n+e,即由m+n+e条每日能耗数据组成。
[0059]
对所述第x个能耗-时间序列s
x
的划分如下:
[0060]
历史能耗-时间序列sh
x
={(d
x
,pc
x
,th
x
,tl
x
)......(d
x+m-1
,pc
x+m-1
,th
x+m-1
,tl
x+m-1
)},长度为m;
[0061]
未来能耗-时间序列sf
x
={(d
x+m
,pc
x+m
,th
x+m
,tl
x+m
)......(d
x+m+n+e-1
,pc
x+m+n+e-1
,th
x+m+n+e-1
,tl
x+m+n+e-1
)},长度为n+e;
[0062]
进一步地,对未来能耗-时间序列s
xf
进行划分:
[0063]
主窗口的未来能耗-时间序列sf
x,0
={(d
x+m
,pc
x+m
,th
x+m
,tl
x+m
)......(d
x+m+n-1
,pc
x+m+n-1
,th
x+m+n-1
,tl
x+m+n-1
)},长度为n;
[0064]
辅助窗口的第一个未来能耗-时间序列sf
x,1
={(d
x+m
,pc
x+m
,th
x+m
,tl
x+m
)......(d
x+m+n-e-1
,pc
x+m+n-e-1
,th
x+m+n-e-1
,tl
x+m+n-e-1
)},长度为n-e;
[0065]
辅助窗口的第2e个未来能耗-时间序列sf
x,(2e)
={(d
x+m
,pc
x+m
,th
x+m
,tl
x+m
)......(d
x+m+n+e-1
,pc
x+m+n+e-1
,th
x+m+n+e-1
,tl
x+m+n+e-1
)},长度为n+e;
[0066]
即长度为n+e的未来能耗-时间序列被细分成长度为(n-e),......,n,......,(n+e)的能耗-时间序列,所述主窗口能耗-时间序列样本由1个长度为m的历史能耗-时间序列sh
x
和1个长度为n的未来能耗-时间序列sf
x,0
组成;所述辅助窗口能耗-时间序列样本由1个sh
x
和2e个长度为(n-e),......,n-1,n+1,......,(n+e)的未来能耗-时间序列sf
x,1
,......,sf
x,(2e)
组成,从而有2e个辅助窗口用于辅助模型的训练和优化;所述训练集与验证集由多条连续切分的能耗-时间序列样本组成;所述训练集与验证集中的每条能耗-时间序列样本再被细分成主窗口能耗-时间序列样本和辅助窗口能耗-时间序列样本。
[0067]
通过对每日能耗数据集进行连续切分,将同一日的能耗数据划分到不同的能耗-时间序列样本中,通过序列长度偏差的设计将同一日的能耗数据划分到同一个能耗-时间序列样本的主窗口能耗-时间序列样本和辅助窗口能耗-时间序列样本中,通过此方法可以提高每日能耗数据的利用率。
[0068]
其中e=0时,该多窗口融合方法退化为只有一个主窗口的情况,未来能耗-时间序列长度固定为n,与一般的时间序列预测窗口相同,样本数量较低,满足不了人工智能模型对大量训练数据的需求。当e≠0时,除了一个主窗口还可以生成2e个辅助窗口用于辅助模型的训练,此时训练样本数量大幅增加,从原来的1次主窗口训练增加到现在的(1+2e)个窗口训练,模型在多个窗口的训练下能够取得更好的训练效果。
[0069]
在本发明的又一个实施例中,如图3所示,步骤4中所使用的聚焦框架模型的具体实现方式如下:
[0070]
所述聚焦框架模型包含了聚焦模块,所述聚焦模块包含了解析型聚焦层,所述解析型聚焦层包含了多个聚焦视角,所述聚焦视角是一个多维向量,是输入变量在不同维度上的权重,解析型聚焦层在每个聚焦视角上应用一个阈值调控器tr,tr将每个聚焦视角的权重分解成多个向量,这些向量和输入特征序列一一对应。通过lstm编码器、lstm解码器、聚焦模块和残差阈值调控器的有效组合,构建出一个用于能耗预测的聚焦框架模型,具体实现过程如下:
[0071]
主窗口能耗-时间序列样本和辅助窗口能耗-时间序列样本经过lstm编码器和lstm解码器提取出特征序列,所述特征序列称为第一输入特征序列;第一输入特征序列是日期、每日用电量、最高气温及最低气温的组合特征;所述聚焦框架模型从第一输入特征序列中提取出多角度的信息用于用电量预测,聚焦框架模型包含了所述聚焦模块,聚焦模块由解析型聚焦层组成,解析型聚焦层包含了多个聚焦视角,所述聚焦视角是一个多维向量,是输入变量在不同维度上的权重;解析型聚焦层在每个聚焦视角上应用一个阈值调控器tr,tr将每个聚焦视角的权重分解成多个向量,这些向量和输入特征一一对应,能够更好地对这些权重进行控制和调整,tr的结构如下式所示:
[0072]
tr(x)=σ(w1x+b1)
⊙
(w2x+b2)
[0073]
x是tr的输入,是第一输入特征序列,w1,w2权重参数矩阵,最初是随机矩阵,模型训练后会不断优化更新,b1,b2是相应的偏置参数,σ()是sigmoid激活函数,
⊙
是hadamard乘积,经过tr处理过的第一输入特征序列称为第二输入特征序列;
[0074]
优选地,lstm编码器和lstm解码器的层数取值范围均为[1,3],步长为1;优选地,lstm编码器和解码器的个数取值范围均为[1,+∞],步长为1,与预测任务目标对应;优选地,聚焦视角的个数取值范围为[1,16],步长为1。
[0075]
解析型聚焦层是聚焦框架模型中的特殊组件,解析型聚焦层通过将经tr处理后的第二输入特征序列映射给层内的三个不同内部矩阵变量q,k,v,得到代表模型对第二输入特征序列关注程度的解析型聚焦序列,解析型聚焦序列可由以下公式表示:
[0076]
multiangle(q,k,v)=concat(angle1,
…
,angleh)wo[0077]
其中,q,k,v分别表示多个聚焦视角的查询向量、键向量和值向量,h表示聚焦视角的数量,concat表示将多个聚焦视角级联起来,anglei是聚焦视角,wo是一个线性变换矩阵。multiangle()中间变量q,k,v使得第二输入特征序列与计算出的解析型聚焦序列一一对
应,存在可解析的关联。每个聚焦视角anglei的计算方式为:
[0078][0079]
其中,α
i,j
是聚焦视角i分配给位置j的关注度权重,表示在输入特征序列中位置j对聚焦视角i的贡献程度。vj是聚焦视角在位置j处的值向量,α
i,j
可以使用下列公式进行计算:
[0080][0081][0082]
其中,t是输入特征序列的长度,是e
i,j
通过查询向量qi和键向量kj的内积计算出来的分数,是聚焦视角i各位置分数的总和。是长度为t的输入特征序列位置j处的键向量,为了增强模型的可解析性,对于每个聚焦视角,额外引入了关注度权重矩阵αi,αi∈r
t
×
t
,αi用于解析聚焦视角i对所关注的输入特征子序列的权重,该关注度权重矩阵αi在(t,j)位置处的元素可以通过下列公式计算得到:
[0083][0084][0085]
其中,e
i,t,j
表示聚焦视角i在时间步t关注位置j处的分数,通过查询向量q
i,t
和键向量k
j,t
的内积计算得到。是聚焦视角i在时间步t上的各位置分数的总和,α
i,t,j
表示聚焦视角i在时间步t关注时间步j的关注度权重,可以通过计算αi的关注度熵hi来衡量聚焦视角i的关注度分配,从而可以对模型进行调优。具体地,hi可以表示为:
[0086][0087]
在tr的基础上,可以构建出残差阈值调控器(residual threshold regulator,rtr),根据训练结果使rtr模型能够灵活地在需要的时候应用非线性处理,rtr可由下述表达式表示:
[0088]
rtr(a)=layernorm(a+tr(η1))
[0089]
η1=w3η2+b3[0090]
η2=elu(w4a+b4)
[0091]
layernorm()是标准层规范化,a是rtr的输入,是解析型聚焦序列multiangle()和第二输入特征序列组成的新序列,elu()为指数线性单元函数,η1和η2是中间层。w3,w4是权重矩阵参数,b3,b4为η1和η2相应的偏置参数,rtr对解析型聚焦序列和第二输入特征序列进行进一步的特征提取,通过门控层实现了信息的高效流动,rtr的输出序列再进入门控和累加&标准化层,最后送入线性层输出不同分位数的预测结果。优选地,同时控制lstm编码器、lstm解码器、阈值调控器tr和残差阈值调控器rtr隐藏层个数的变量的取值范围为[8,
512],更优选地,步长为1;优选地,分位数预测的取值列表取值范围[0,1],更优选地,步长为0.1;优选地,列表长度的取值范围为[1,9],更优选地,步长为1。
[0092]
聚焦框架模型通过在每个聚焦视角上应用一个阈值调控器tr来提高学习效率,也使得聚焦框架模型中所有的输入变量序列和输出序列的长度一致,输出序列中的每个数据均可以对应到与其相关的输入变量序列中的每个数据。解析型聚焦序列、输入特征序列等与输入的时间序列一一对应,解析每个聚焦视角的关注度权重与所处理的时间序列的特征的具体关联,从而在模型训练效果不理想时可以针对性地对模型进行调优,提高了模型的可解析性。
[0093]
本发明还提供了一种结合多窗口融合方法和聚焦框架模型的建筑能耗预测系统,包括:
[0094]
(1)数据采集模块:该模块负责采集目标建筑的每日用电量、当日的最高气温、当日的最低气温,这种数据采集机制允许模型更深入地理解建筑的能源使用情况;
[0095]
(2)数据预处理模块:在数据采集之后,该模块将进行数据的清理和规范化,会剔除异常值,包括明显的错误值和空值,并使用最大最小值归一化处理方法对数据进行归一化,以确保数据的有效性和一致性;
[0096]
(3)多窗口融合模块:该模块负责将预处理后的每日能耗数据进行连续切分,构造出多条能耗-时间序列样本,每条能耗-时间序列样本包括一个主窗口能耗-时间序列样本和多个辅助窗口能耗-时间序列样本,这有助于充分利用样本数据并且改善样本数据量少的问题;
[0097]
(4)模型训练模块:该模块利用能耗-时间序列样本对聚焦框架模型进行训练。按照预设的划分比例将能耗-时间序列样本划分为训练集和验证集,然后使用训练集进行模型训练,在训练的迭代次数达到设定的迭代次数后,使用验证集输入到聚焦框架模型,在训练过程中,会追踪均方根误差,并选择使其最小化的模型权重作为最终的模型权重;优选地,划分比例介于4:1~5:1之间;优选地,迭代次数取值范围为[100,800],更优选地,步长为100;
[0098]
(5)能耗预测模块:这个模块负责使用训练好的聚焦框架模型进行建筑能耗预测,把训练中获得的最终模型权重作为预测权重,然后基于这些权重对建筑能耗进行预测。
[0099]
本发明以具体的实施例说明所述的一种结合多窗口融合方法和聚焦框架模型的建筑能耗预测方法及系统,系统采用python编程语言,基于pytorch框架在一台32gb ram和rtx 3090ti gpu的个人电脑上进行。
[0100]
步骤1中使用的数据集来自中国杭州国际博览中心(hiec)的建筑能耗数据集,hiec总建筑面积为85万平方米,截至2022年12月底,hiec已举办了7400多场会议和260多场展览,hiec作为大耗电量建筑,是一个很好的建筑能耗预测研究对象。具体而言,本发明收集了近三年(2019-09-01至2022-12-30)hiec的每日的空调耗电量,作为建筑能耗数据的每日用电量。本发明还记录了中国气象数据服务中心的历史天气信息,因为了解未来的气温范围有助于预测空调耗电量,本发明在数据集中记录了每天的最高和最低气温。
[0101]
本发明用7日的历史建筑能耗数据训练模型预测未来7日的每日用电量数据,偏差为3日,则步骤3中的历史序列长度m取值为7,未来序列长度n取值为7,偏差序列长度e取值为3。即主窗口为使用前7天的每日能耗数据预测未来7天的每日用电量,辅助窗口是用前7
天的每日能耗数据分别预测未来4、5、6、8、9、10天的每日用电量,也就是使用6(2e)个辅助窗口对模型进行辅助训练,最终模型将只用于主窗口的预测。
[0102]
[0103][0104]
表1是本实施例的采集的样本数据集的一部分,在数据集中,“每日用电量”列是空调对应日期的每日耗电量,单位为千瓦时。表2是本发明对表1中给出的部分数据集的连续切分成长度为17(7+7+3)日的能耗-时间序列,所列的数据集可以被连续切分成15条能耗-时间序列。每条能耗-时间序列再次被切分成1条历史能耗-时间序列和7条未来能耗-时间序列,每条能耗-时间序列由主窗口能耗-时间序列和辅助窗口能耗-时间序列组成,所述主窗口能耗-时间序列由1条历史能耗-时间序列和1条主窗口未来能耗-时间序列组成,所述辅助窗口能耗-时间序列由1条历史能耗-时间序列和6条辅助窗口未来能耗-时间序列组成,具体划分见表2。
[0105]
需要指出的是,表1和表2仅仅是本发明采集的样本数据集及其对应能耗-时间序列划分的一部分,是为了更方便说明本发明的技术所做的一种示例。
[0106]
步骤4中的聚焦框架模型中,lstm隐藏层的尺寸设定为10,聚焦视角的数量h取值为4。模型每次输出7个分位数预测结果,训练集与测试集的比例设为4:1,即在训练时,使用训练集中的80%作为训练集,余下的20%作为验证集,以表2为例,15条能耗-时间序列样本取前12条作为训练集,后3条作为测试集。设置聚焦框架模型的学习速率lr为0.01,迭代次
数epoch为600,批量大小batch-size为32,输入的变量将根据历史能耗-时间序列或未来能耗-时间序列类型的不同进入lstm编码器和lstm解码器进行特征提取,最终输出不同分位数的预测结果。
[0107]
为了证明本发明所述的结合多窗口融合方法和聚焦框架模型的建筑能耗预测方法相对于其他预测模型的优势,采用常用的预测模型对同一批数据进行预测,计算出不同模型对应的均方根误差(rmse)值。第一种baseline模型是使用最后一个已知的目标值进行预测,对于平稳数据具有良好的拟合效果。第二种模型为lstm模型,作为能关注历史数据的人工智能模型,应用较为广泛。第三种模型为时域融合变压器(tft)模型,该模型在多变量预测任务上具有较好的效果。本发明结合多窗口融合方法和聚焦框架模型对建筑能耗进行预测,可以充分利用输入特征序列之间的相关性,构建解析性较强的关注度模型,实现可解析的关注度机制,进而充分利用历史数据辅助模型的预测。
[0108][0109]
通过表3预测效果的对比,baseline方法简单从而取得的结果较差,rmse高达2292.52,lstm模型和tft模型的预测效果相比于baseline模型有所提升,但rmse均在1890以上,而本发明结合多窗口融合方法和聚焦框架模型的建筑能耗预测方法的rmse仅有1761.2,明显低于其他三种常用模型,取得更小的预测误差,获得了更高的预测精度。
[0110]
通过表3的参数数量对比,baseline使用的参数数量极少,几乎可以忽略不计,但是其效果也相对最差的,因而不具可比性。而本发明的参数数量明显低于lstm和tft,这样本发明的模型泛化能力更好,调参比较简单,对新鲜样本的适应能力更强。
[0111]
本发明提出了一种结合多窗口融合方法和聚焦框架模型的建筑能耗预测方法巧妙地克服了现有技术的技术偏见:仅仅需要采集三种容易获得的目标建筑的每日的用电量、当日的最高气温和最低气温,且仅仅利用真实数据。本发明的各部分整体协同作用、不可拆分,仅仅采集三种容易获得的、真实的数据对模型进行训练,训练出的模型能够达到更高的预测精度。
[0112]
需要说明的是,本实施例提供的系统用于实现前述实施例提供的方法,各单元的具体设置均以完整实现该方法为准,在此不再赘述。
[0113]
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
技术特征:
1.一种结合多窗口融合方法和聚焦框架模型的建筑能耗预测方法,其特征在于,包括以下步骤:步骤1,采集目标建筑的样本数据采集目标建筑的每日能耗数据,所述每日能耗数据是指每日用电量、当日的最高气温、当日的最低气温;步骤2,样本数据预处理将步骤1采集到的每日能耗数据进行异常值剔除和数据归一化处理;处理后的每日能耗数据集s={(d1,pc1,th1,tl1),......,(d
i
,pc
i
,th
i
,tl
i
)......,(d
n
,pc
n
,th
n
,tl
n
)};其中d为日期,pc为当日用电量,th为当日的最高气温,tl为当日最低气温,i表示第i个能耗样本数据,i∈n,n表示采集到的能耗数据的天数;步骤3,采用多窗口融合方法构造能耗-时间序列样本采用多窗口融合方法将步骤2获得的每日能耗数据按时间长度进行连续切分,构造出多个能耗-时间序列样本,所述的每个能耗-时间序列样本由一个主窗口能耗-时间序列样本和多个辅助窗口能耗-时间序列样本组成,所述辅助窗口能耗-时间序列样本是对主窗口能耗-时间序列样本长度的增加或减少,同一个每日能耗数据被多次利用到同一个能耗-时间序列样本的主窗口能耗-时间序列样本和辅助窗口能耗-时间序列样本中,以及不同的能耗-时间序列样本中;步骤4,训练聚焦框架模型聚焦框架模型利用训练集进行迭代训练,再利用验证集得到最终的模型权重;根据训练集与验证集的划分比例将步骤3所述的能耗-时间序列样本分成训练集与验证集,将训练集输入到聚焦框架模型进行训练,在训练的迭代次数达到设定的迭代次数后,使用验证集输入到聚焦框架模型,挑选预测值与验证集之间的均方根误差最小的模型权重作为最终的模型权重;优选地,所述划分比例介于4:1~5:1之间;优选地,所述迭代次数取值范围为[100,800],更优选地,步长为100;步骤5,预测建筑能耗数据利用步骤4获得的最终的模型权重对建筑能耗进行预测。2.根据权利要求1所述的方法,其特征在于,步骤3中所述的多窗口融合方法构造能耗-时间序列样本的步骤如下:3.1)设定历史能耗-时间序列长度为m;3.2)设定未来能耗-时间序列长度为n;3.3)设定在n的基础上前后的序列长度偏差为e;3.4)对每日能耗数据集进行连续切分,构造出若干长度为m+n+e的能耗-时间序列样本;所述m、n、e均为正整数,步长均为1且满足e<n;所述能耗-时间序列为:s1={(d1,pc1,th1,tl1)......(d
m+n+e
,pc
m+n+e
,th
m+n+e
,tl
m+n+e
)};s2={(d2,pc2,th2,tl2)......(d
m+n+e+1
,pc
m+n+e+1
,th
m+n+e+1
,tl
m+n+e+1
)};s
x
={(d
x
,pc
x
,th
x
,tl
x
)......(d
x+m+n+e-1
,pc
x+m+n+e-1
,th
x+m+n+e-1
,tl
x+m+n+e-1
)}其中,x是正整数,s
x
表示第x个能耗-时间序列,x+m+n+e-1≥n,每个能耗-时间序列的长
度为m+n+e,即由m+n+e条每日能耗数据组成。3.根据权利要求2所述的方法,其特征在于,模型训练时用长度为m的历史能耗-时间序列来训练预测长度为[n-e,n+e]的未来能耗-时间序列;对所述第x个能耗-时间序列s
x
的划分如下:历史能耗-时间序列sh
x
={(d
x
,pc
x
,th
x
,tl
x
)......(d
x+m-1
,pc
x+m-1
,th
x+m-1
,tl
x+m-1
)},长度为m;未来能耗-时间序列sf
x
={(d
x+m
,pc
x+m
,th
x+m
,tl
x+m
)......(d
x+m+n+e-1
,pc
x+m+n+e-1
,th
x+m+n+e-1
,tl
x+m+n+e-1
)},长度为n+e;进一步地,对未来能耗-时间序列s
xf
进行划分:主窗口的未来能耗-时间序列sf
x,0
={(d
x+m
,pc
x+m
,th
x+m
,tl
x+m
)......(d
x+m+n-1
,pc
x+m+n-1
,th
x+m+n-1
,tl
x+m+n-1
)},长度为n;辅助窗口的第一个未来能耗-时间序列sf
x,1
={(d
x+m
,pc
x+m
,th
x+m
,tl
x+m
)......(d
x+m+n-e-1
,pc
x+m+n-e-1
,th
x+m+n-e-1
,tl
x+m+n-e-1
)},长度为n-e;辅助窗口的第2e个未来能耗-时间序列sf
x,(2e)
={(d
x+m
,pc
x+m
,th
x+m
,tl
x+m
)......(d
x+m+n+e-1
,pc
x+m+n+e-1
,th
x+m+n+e-1
,tl
x+m+n+e-1
)},长度为n+e;即长度为n+e的未来能耗-时间序列被细分成长度为(n-e),......,n,......,(n+e)的能耗-时间序列,所述主窗口能耗-时间序列样本由1个长度为m的历史能耗-时间序列sh
x
和1个长度为n的未来能耗-时间序列sf
x,0
组成;所述辅助窗口能耗-时间序列样本由1个sh
x
和2e个长度为(n-e),......,n-1,n+1,......,(n+e)的未来能耗-时间序列sf
x,1
,......,sf
x,(2e)
组成,从而有2e个辅助窗口用于辅助模型的训练和优化;所述训练集与验证集由多条连续切分的能耗-时间序列样本组成;所述训练集与验证集中的每条能耗-时间序列样本再被细分成主窗口能耗-时间序列样本和辅助窗口能耗-时间序列样本。4.根据权利要求3所述的方法,其特征在于,所述主窗口能耗-时间序列样本和辅助窗口能耗-时间序列样本经过lstm编码器和lstm解码器提取出特征序列,所述特征序列称为第一输入特征序列;第一输入特征序列是日期、每日用电量、最高气温及最低气温的组合特征;所述聚焦框架模型从第一输入特征序列中提取出多角度的信息用于用电量预测,聚焦框架模型包含了所述聚焦模块,聚焦模块由解析型聚焦层组成,解析型聚焦层包含了多个聚焦视角,所述聚焦视角是一个多维向量,是输入变量在不同维度上的权重;解析型聚焦层在每个聚焦视角上应用一个阈值调控器tr,tr将每个聚焦视角的权重分解成多个向量,这些向量和输入特征一一对应,能够更好地对这些权重进行控制和调整,tr的结构如下式所示:tr(x)=σ(w1x+b1)
⊙
(w2x+b2)x是tr的输入,是第一输入特征序列,w1,w2权重参数矩阵,最初是随机矩阵,模型训练后会不断优化更新,b1,b2是相应的偏置参数,σ()是sigmoid激活函数,
⊙
是hadamard乘积,经过tr处理过的第一输入特征序列称为第二输入特征序列;优选地,lstm编码器和lstm解码器的层数取值范围均为[1,3],步长为1;优选地,lstm编码器和解码器的个数取值范围均为[1,+∞],步长为1,与预测任务目标对应;优选地,聚焦视角的个数取值范围为[1,16],步长为1。5.根据权利要求4所述方法,其特征在于,所述解析型聚焦层将经tr处理后的第二输入
特征序列映射给层内的三个不同内部矩阵变量q,k,v,得到代表对输入变量关注程度的解析型聚焦序列,确定了气温、用电量和日期之间的复杂关系,解析型聚焦序列可由以下公式表示:multiangle(q,k,v)=concat(angle1,
…
,angle
h
)w
o
其中,q,k,v分别表示多个聚焦视角的查询向量、键向量和值向量,h表示聚焦视角的数量,concat表示将多个聚焦视角级联起来,angle
i
表示聚焦视角,w
o
是一个线性变换矩阵,multiangle()使得第二输入特征序列与计算出的解析型聚焦序列一一对应,存在可解析的关联。6.根据权利要求5所述方法,聚焦视角关注能耗-时间序列不同维度的信息,如高频信息、中频信息、低频信息等,每个聚焦视角angle
i
的计算方式为:其中,α
i,j
是聚焦视角i分配给位置j的关注度权重,表示在输入序列中位置j对聚焦视角i的贡献程度,v
j
是聚焦视角在位置j处的值向量;优选地,α
i,j
可以使用下列公式进行计算:算:其中,e
i,j
是通过查询向量q
i
和键向量k
j
的内积计算出来的分数,是聚焦视角i各位置分数的总和;是长度为t的输入序列位置j处的键向量。7.根据权利要求6所述方法,不同气温下的用电量对气温和用电量赋予的权重不一样,因此引入了关注度权重矩阵α
i
,α
i
∈r
t
×
t
,α
i
用于解析聚焦视角i对所关注的输入变量的关注度权重,该关注度权重矩阵α
i
在(t,j)位置处的元素可以通过下列公式计算得到:在(t,j)位置处的元素可以通过下列公式计算得到:其中,e
i,t,j
表示聚焦视角i在时间步t关注位置j处的分数,通过查询向量q
i,t
和键向量k
j,t
的内积计算得到,是聚焦视角i在时间步t上的各位置分数的总和,α
i,t,j
表示聚焦视角i在时间步t关注时间步j的关注度权重。8.根据权利要求7所述的方法,通过计算α
i
的关注度熵来衡量聚焦视角i的关注度分配,聚焦视角i的关注度熵h
i
可以表示为:9.根据权利要求8所述方法,其特征在于,在所述tr的基础上,构建出残差阈值调控器rtr,rtr通过tr对输入变量进行下一步计算方式的调控,强化了对用电量、日期、气温之间的非线性关系的特征提取,rtr可由下述表达式表示:
rtr(a)=layernorm(a+tr(η1))η1=w3η2+b3η2=elu(w4a+b4)layernorm()是标准层规范化,将模型内部参数的取值范围标准化,提高模型稳定性,a是rtr的输入,是解析型聚焦序列multiangle()和第二输入特征序列组成的新序列,elu()为指数线性单元函数,η1和η2是中间层,w3,w4是权重矩阵参数,b3,b4为η1和η2相应的偏置参数,rtr对解析型聚焦序列和第二输入特征序列进行进一步的特征提取,rtr的输出序列再进入门控和累加&标准化层,最后送入线性层输出不同分位数的预测结果;优选地,同时控制lstm编码器、lstm解码器、阈值调控器tr和残差阈值调控器rtr隐藏层个数的变量的取值范围为[8,512],更优选地,步长为1;优选地,分位数预测的取值列表取值范围[0,1],更优选地,步长为0.1;优选地,列表长度的取值范围为[1,9],更优选地,步长为1。10.一种结合多窗口融合方法和聚焦框架模型的建筑能耗预测系统,其特征在于,能够实现如权利要求1至9任一项所述的结合多窗口融合方法和聚焦框架模型的建筑能耗预测方法,其包括数据采集模块、数据预处理模块、多窗口融合模块、模型训练模块、能耗预测模块;所述数据采集模块负责采集目标建筑的每日用电量、当日的最高气温、当日的最低气温,这种数据采集机制允许模型更深入地理解建筑的能源使用情况;所述数据预处理模块在数据采集之后进行数据的清理和规范化,剔除异常值,包括明显的错误值和空值,并使用最大最小值归一化处理方法对数据进行归一化,以确保数据的有效性和一致性;所述多窗口融合模块负责将预处理后的每日能耗数据进行连续切分,构造出多条能耗-时间序列样本,每条能耗-时间序列样本包括一个主窗口能耗-时间序列样本和多个辅助窗口能耗-时间序列样本,充分利用样本数据并且改善样本数据量少的问题;所述模型训练模块利用能耗-时间序列样本对聚焦框架模型进行训练,按照预设的划分比例将能耗-时间序列样本划分为训练集和验证集,然后使用训练集进行模型训练,在训练的迭代次数达到设定的迭代次数后,使用验证集输入到聚焦框架模型,在训练过程中追踪均方根误差,并选择使其最小化的模型权重作为最终的模型权重,优选地,划分比例介于4:1~5:1之间;优选地,迭代次数取值范围为[100,800],更优选地,步长为100;所述能耗预测模块负责使用训练好的聚焦框架模型进行建筑能耗预测,把训练中获得的最终模型权重作为预测权重,然后基于这些权重对建筑能耗进行预测。
技术总结
本发明提供了一种结合多窗口融合方法和聚焦框架模型的建筑能耗预测方法及系统。步骤1采集目标建筑的每日能耗数据,每日能耗数据是指每日用电量、当日的最高气温、当日的最低气温;步骤2对每日能耗数据进行预处理,进行异常值剔除和数据归一化处理;步骤3采用多窗口融合方法将步骤2获得的每日能耗数据构造出一系列能耗-时间序列样本;步骤4利用步骤3中的能耗-时间序列样本训练聚焦框架模型;步骤5用步骤4获得的模型的最终权重对建筑能耗进行预测。本发明提出的一种结合多窗口融合方法和聚焦框架模型的方法只需要三种容易获得的、真实的样本数据就可以达到更高的预测精度。的样本数据就可以达到更高的预测精度。的样本数据就可以达到更高的预测精度。
技术研发人员:季文献 厉小润 曹泽煜
受保护的技术使用者:浙江大学
技术研发日:2023.07.21
技术公布日:2023/10/11
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
