一种用户群体特征提取方法、系统、设备和介质与流程

未命名 10-18 阅读:114 评论:0


1.本发明属于用电负荷预测领域,具体涉及一种用户群体特征提取方法、系统、设备和介质。


背景技术:

2.负荷预测对电力系统的规划与调度以及安全性的保障都十分重要。对供给侧而言,精确的负荷预测方法可以帮助电力公司节约成本。以英国电网为例,负荷预测精度每上升1%,电力公司可以节约1000万英镑的成本;对需求侧而言,精确的负荷预测方法可以辅助用户进行用电规划,降低用户的成本。短期负荷预测的时间尺度多为分钟级或小时级,是实际生产生活中的重要辅助决策方法,也是本发明的研究对象。
3.近年来,短期电力负荷预测技术已成为学术界的重要研究热点。有研究提出了一种基于统计学的自回归滑动平均模型(arma)对短期电力负荷进行预测,通过历史数据对单个用户的用电负荷进行了预测,旨在提升负荷预测的精度。有研究提出了一种基于深度学习的长短期记忆网络对单个用户的用电负荷进行了预测,采用了黑盒模型,旨在提升负荷预测算法鲁棒性的同时实现用户用电负荷的精准预测。有学者发现了不同用户之间的用电行为存在相关性,并对用户群体进行了研究。在澳大利亚的新南威尔士地区进行的一项实验中,对6031家用户全年的用电数据进行了记录,并采用了k-means方法将这些用户聚类成了10类,说明行为习惯相似的用户之间存在很强的关系。但上述研究中,均为考虑到对多个用户以及用户群体的负荷预测,这导致用户与用户之间的相关关系特征被忽视,用户特征提取目标不精确,导致负荷预测精确度不高。


技术实现要素:

4.本发明提出一种用户群体特征提取方法、系统、设备和介质,以解决现有技术中,特征提取不准导致负载预测结果不精确的问题。
5.为达上述目的,本发明提出技术方案如下:
6.1、一种用户群体特征提取方法,其特征在于,包括如下步骤:
7.步骤1,基于皮尔逊系数构建用户图结构,所述用户图结构由顶点与连接顶点的边构成,记为其中,v代表图上的节点,ε代表节点之间的连接关系,w为邻接矩阵;
[0008][0009]wij
表示图上的i节点与j节点之间的连接关系;
[0010]
基于邻接矩阵,得到度矩阵d,具体的:
[0011][0012]
得到图拉普拉斯矩阵l,l=d-w;
[0013]
步骤2,基于邻接矩阵、度矩阵和图拉普拉斯矩阵,对用户群体进行图特征提取;
[0014]
步骤3,通过门控线性单元,提取用户的时序特征。
[0015]
优选的,所述步骤2具体为:
[0016]
基于邻接矩阵、度矩阵和图拉普拉斯矩阵,得到归一化图拉普拉斯矩阵公式:
[0017][0018]
其中in是单位矩阵,d与w分别表示度矩阵与临界矩阵,代表对角矩阵,是图傅里叶基。
[0019]
优选的,步骤2中,还包括:
[0020]
基于归一化图拉普拉斯矩阵公式,得到谱域图卷积一阶近似公式:
[0021][0022]
其中,代表图卷积操作,x为图结构上存在的信号,θ为共享参数,为归一化后的邻接矩阵,为归一化的度矩阵。
[0023]
优选的,所述归一化后的邻接矩阵计算公式为:
[0024]
式中,in是单位矩阵,w为邻接矩阵。
[0025]
优选的,所述归一化的度矩阵计算公式为:
[0026][0027]
式中,w为邻接矩阵,i与j表示图结构上的节点。
[0028]
优选的,所述步骤3具体为:
[0029]
时间序列x
t
=x0,x1,x2,

x
t-1
,x
t
作为输入,该时间序列长度为m;这条时间序列被视为长度为m、输入通道数为ci的矩阵,即x为图结构上存在的信号;
[0030]
定义采用的因果卷积的卷积核:
[0031][0032]
其中,k
t
为时间卷积核的宽度,co表示输出的通道数;
[0033]
γ卷积核内,存在两个相同输出通道数的卷积核
[0034]
得到glu公式:
[0035][0036]
其中,p,q分别是glu的输入,表示时间卷积操作,

表示哈达玛积,σ表示sigmoid函数;
[0037]
基于glu公式,得到用户的时序特征。
[0038]
优选的,每经历一次因果卷积,原有长度的为m的时间序列长度减少k
t-1。
[0039]
一种用户群体特征提取系统,包括如下模块:用户图结构构建模块、图卷积模块和因果卷积模块;
[0040]
所述用户图结构构建模块用于构建用户图结构;
[0041]
所述图卷积模块用于提取用户图特征;
[0042]
所述因果卷积模块用于提取用户时序特征。
[0043]
一种电子设备,包括存储器和处理器;
[0044]
存储器,用于存储计算机程序;
[0045]
处理器,用于执行所述计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任意一项所述的一种用户群体特征提取方法的步骤。
[0046]
一种计算机可读存储介质,所述存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现一种用户群体特征提取方法的步骤。
[0047]
本发明的有益之处在于:
[0048]
本发明提出一种用户群体特征提取方法、系统、设备和介质,将具备相似用电行为特征的用户表征为图结构,利用皮尔逊系数衡量用户之间相关关系的大小,并采用因果卷积与图卷积结合的方式来捕捉其中的时间与空间特征,对用户群体中的时空关系具备较好的捕捉能力,单个用户与用户群体的负荷预测精度均得到了提升。
附图说明
[0049]
构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
[0050]
图1为一种用户群体特征提取方法流程示意图;
[0051]
图2为一种用户群体特征提取系统结构示意图;
[0052]
图3为电子设备结构示意图;
[0053]
图4为时空图卷积方法架构示意图;
[0054]
图5为因果卷积的结构示意图;
[0055]
图6为线性门控单元结构示意图。
具体实施方式
[0056]
下面将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
[0057]
以下详细说明均是示例性的说明,旨在对本发明提供进一步的详细说明。除非另有指明,本发明所采用的所有技术术语与本发明所属领域的一般技术人员的通常理解的含义相同。本发明所使用的术语仅是为了描述具体实施方式,而并非意图限制根据本发明的示例性实施方式。
[0058]
实施例1:
[0059]
请参阅图1所示,本发明提供一种用户群体特征提取方法,具体包括如下步骤:
[0060]
步骤1,基于皮尔逊系数构建用户图结构:
[0061]
首先,将具备相似用电习惯的用户进行聚类分析。
[0062]
从目标地区选取三组用户群体,包括大型用户群体、小型用户群体与中型用户群体,所述用户群体中不同用户之间具备强相关关系,所述强相关关系使用图结构进行描述,所述图结构由顶点与连接顶点的边构成,图即顶点与边的集合。图可以记为其中,代表图上的节点,ε代表节点之间的连接关系,代表边与边之间的权重,被定义为邻接矩阵。
[0063]
公式如下:
[0064][0065]wij
表示图上的i节点与j节点之间的连接关系。同时,为了表示图上某节点与其他节点连接的密集程度,度矩阵被定义出来。定义公式如下:
[0066][0067]
可以理解的是,基于邻接矩阵和度矩阵,图拉普拉斯矩阵l可以被定义为l=d-w。邻接矩阵、度矩阵与图拉普拉斯矩阵可以提取图信息,是进行图卷积操作的基础。
[0068]
在本发明中,每个用户群体均被视为图,其中代表用户群内全部的用户,ε代表用户之间的连接关系,代表边上的权重。
[0069]
为了更好的衡量不同用户之间的相关关系强弱,在本发明中采用了皮尔逊相关系数,其公式如下所示:
[0070][0071]
其中cov(xi,xj)代表两时间序列xi和xj之间的协方差值,因此与图结构对应的邻接矩阵a可以进行如下定义:
[0072][0073]
其中ξ为控制边与边之间连接关系的阈值。采用上述方法可以将不同用户群以图的形式表征。
[0074]
步骤2,捕捉图特征:
[0075]
采用的时空图卷积方法包括对于用户群时间特征与空间特征的提取,图4说明了方法的整体框架。
[0076]
时空图卷积方法需要对用户群体的图特征与时间特征进行捕捉。其中采用图卷积的方式对图特征进行捕捉,依赖于谱域图卷积理论,其理论公式如下所示:
[0077][0078]
其中代表图卷积操作。是图傅里叶基。它是经历过归一化操作的拉普拉斯矩阵的特征向量矩阵。归一化图拉普拉斯矩阵公式如下:
[0079][0080]
其中in是单位矩阵,d与w分别表示度矩阵与临界矩阵。代表对角矩阵,它是归一化后拉普拉斯矩阵的特征值的对角矩阵。θ(λ)起到滤波作用同样为一个对角矩阵。基于上式,图上存在的信号x被卷积核θ通过卷积核θ与图傅里叶变换u
t
x相乘而滤波。按照以上公式计算,算法复杂度较高,计算成本较高。一种一阶近似方法被提出。这种近似方法将分层线性公式用图拉普拉斯的一阶近似叠加多个来定义局部图卷积层来定义。其公式如下:
[0081]
[0082]
其中θ为共享参数,起到稳定数值的性能。为归一化后的邻接矩阵。为归一化的度矩阵,这种方式也是本发明所用的方法。
[0083]
对于时间特征的捕捉主要采用因果卷积的方式,其具备较好的时间特征的提取的能力,其整体结构如图5所示。
[0084]
步骤3,捕捉时序特征:
[0085]
考虑时间序列x
t
=x0,x1,x2,

x
t-1
,x
t
,输出的y
t
只取决于当前时刻的x
t
与之前的时刻的x
t-1
,x
t-2
。采用这种结构,网络的输出只会取决于之前的时刻,因此未来的信息不会干扰网络的输出。为了进一步强化网络对于时间特征的提取能力,门控线性单元的结构也被引入,其结构如图6所示。
[0086]
可以理解的是,线性门控单元的结构相比因果卷积具备更强的时序特征的捕捉能力,被广泛应用于时序特征的捕捉上。
[0087]
考虑时间序列x
t
=x0,x1,x2,

x
t-1
,x
t
作为输入,该时间序列长度为t。这条时间序列可以被视为长度为m、输入通道数为ci的矩阵,即
[0088]
采用的因果卷积的卷积核被定义为其中k
t
代表时间卷积核的宽度,每经历一次因果卷积,原有长度的为m的时间序列长度减少k
t-1。co表示输出的通道数。
[0089]
γ卷积核内,存在两个相同输出通道数的卷积核
[0090]
glu公式定义如下:
[0091][0092]
p,q分别是glu的输入,表示时间卷积操作。

表示哈达玛积。σ表示sigmoid函数。非线性门可以有助于堆叠时间层进而输入进网络。
[0093]
实施例2:
[0094]
请参阅图2所示,本发明提供一种用户群体特征提取系统,具体包括:用户图结构构建模块、图卷积模块和因果卷积模块。
[0095]
所述用户图结构构建模块用于实现实施例1所述步骤1。
[0096]
所述图卷积模块用于实现实施例1所述步骤2。
[0097]
所述因果卷积模块用于实现实施例1所述步骤3。
[0098]
实施例3:
[0099]
请参阅图3所示,本发明还提供一种电子设备100;所述电子设备100包括存储器101、至少一个处理器102、存储在所述存储器101中并可在所述至少一个处理器102上运行的计算机程序103及至少一条通讯总线104。
[0100]
存储器101可用于存储所述计算机程序103,所述处理器102通过运行或执行存储在所述存储器101内的计算机程序,以及调用存储在存储器101内的数据,实现实施例1所述的获取停车场空位的方法的步骤。所述存储器101可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据电子设备100的使用所创建的数据(比如音频数据)等。此外,存储器101可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)、至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。
[0101]
所述至少一个处理器102可以是中央处理单元(central processing unit,cpu),还可以是其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现场可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。处理器102可以是微处理器或者该处理器102也可以是任何常规的处理器等,所述处理器102是所述电子设备100的控制中心,利用各种接口和线路连接整个电子设备100的各个部分。
[0102]
所述电子设备100中的所述存储器101存储多个指令以实现一种用户群体特征提取方法,所述处理器102可执行所述多个指令从而实现:
[0103]
步骤1,基于皮尔逊系数构建用户图结构;
[0104]
步骤2,采用图卷积的方式对图特征进行捕捉;
[0105]
步骤3,基于线性门控单元的结构进行对时序特征的捕捉。
[0106]
实施例4:
[0107]
所述电子设备100集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器及只读存储器(rom,read-only memory)。
[0108]
由技术常识可知,本发明可以通过其它的不脱离其精神实质或必要特征的实施方案来实现。因此,上述公开的实施方案,就各方面而言,都只是举例说明,并不是仅有的。所有在本发明范围内或在等同于本发明的范围内的改变均被本发明包含。
[0109]
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0110]
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0111]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0112]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0113]
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。

技术特征:
1.一种用户群体特征提取方法,其特征在于,包括如下步骤:步骤1,基于皮尔逊系数构建用户图结构,所述用户图结构由顶点与连接顶点的边构成,记为其中,代表图上的节点,ε代表节点之间的连接关系,w为邻接矩阵;w
ij
表示图上的i节点与j节点之间的连接关系;基于邻接矩阵,得到度矩阵d,具体的:得到图拉普拉斯矩阵l,l=d-w;步骤2,基于邻接矩阵、度矩阵和图拉普拉斯矩阵,对用户群体进行图特征提取;步骤3,通过门控线性单元,提取用户的时序特征。2.如权利要求1所述的一种用户群体特征提取方法,其特征在于,所述步骤2具体为:基于邻接矩阵、度矩阵和图拉普拉斯矩阵,得到归一化图拉普拉斯矩阵公式:其中i
n
是单位矩阵,d与w分别表示度矩阵与临界矩阵,代表对角矩阵,是图傅里叶基。3.如权利要求2所述的一种用户群体特征提取方法,其特征在于,步骤2中,还包括:基于归一化图拉普拉斯矩阵公式,得到谱域图卷积一阶近似公式:其中,代表图卷积操作,x为图结构上存在的信号,θ为共享参数,为归一化后的邻接矩阵,为归一化的度矩阵。4.如权利要求3所述的一种用户群体特征提取方法,其特征在于,所述归一化后的邻接矩阵计算公式为:式中,i
n
是单位矩阵,w为邻接矩阵。5.如权利要求3所述的一种用户群体特征提取方法,其特征在于,所述归一化的度矩阵计算公式为:式中,w为邻接矩阵,i与j表示图结构上的节点。6.如权利要求3所述的一种用户群体特征提取方法,其特征在于,所述步骤3具体为:时间序列x
t
=x0,x1,x2,

x
t-1
,x
t
作为输入,该时间序列长度为t;这条时间序列被视为长度为m、输入通道数为c
i
的矩阵,即x为图结构上存在的信号;定义采用的因果卷积的卷积核:
其中,k
t
为时间卷积核的宽度,c
o
表示输出的通道数;γ卷积核内,存在两个相同输出通道数的卷积核得到glu公式:其中,p,q分别是glu的输入,表示时间卷积操作,

表示哈达玛积,σ表示sigmoid函数;基于glu公式,得到用户的时序特征。7.如权利要求6所述的一种用户群体特征提取方法,其特征在于,每经历一次因果卷积,原有长度的为m的时间序列长度减少k
t-1。8.一种用户群体特征提取系统,其特征在于,包括如下模块:用户图结构构建模块、图卷积模块和因果卷积模块;所述用户图结构构建模块用于构建用户图结构;所述图卷积模块用于提取用户图特征;所述因果卷积模块用于提取用户时序特征。9.一种电子设备,其特征在于,包括存储器和处理器;存储器,用于存储计算机程序;处理器,用于执行所述计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任意一项所述的一种用户群体特征提取方法的步骤。10.一种计算机可读存储介质,其特征在于,所述存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任意一项所述的一种用户群体特征提取方法的步骤。

技术总结
本发明属于用电负荷预测领域,具体涉及一种用户群体特征提取方法、系统、设备和介质。将具备相似用电行为特征的用户表征为图结构,利用皮尔逊系数衡量用户之间相关关系的大小,并采用因果卷积与图卷积结合的方式来捕捉其中的时间与空间特征,对用户群体中的时空关系具备较好的捕捉能力,单个用户与用户群体的负荷预测精度均得到了提升,同时随着预测时间步长的提升,所提出的负荷预测方法的提升效果也会得到增强。得到增强。得到增强。


技术研发人员:何彦彬 余谦 苏彪 王天一 常媛 屈恒 晏思奇 曹增新 关涛 池建峰 高梦雅 田子健 屈珣 王子赫 李稼辰 姜山 杨二乐 闫辰 卢璐 王小峰
受保护的技术使用者:国家电网有限公司
技术研发日:2023.07.20
技术公布日:2023/10/11
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐