配电馈线统计线损率估计方法、装置及存储介质与流程
未命名
07-22
阅读:70
评论:0
1.本发明属于线损估计技术领域,具体涉及一种配电馈线统计线损率估计方法、装置及存储介质。
背景技术:
2.线损率在评价电力系统的经济运行中扮演重要的角色,线损管理是电力公司的重点管理内容之一。目前采用《线损四分管理标准》进行线损管理,具体为根据“分压、分区、分线、分台区”的原则对线损进行全面管理。为了充分掌握馈线线损情况,加强线损管理水平,首要任务是提高线损数据的完整性。随着智能电网建设的推进和智能电表的普及,电力公司积累了大量的电网和用户的历史数据,使充分分析馈线线损情况、对馈线线损率进行估计成为可能。
3.基于数据的馈线线损率估计模型可以分为两大类,第一类是机器学习估计模型,第二类是深度学习估计模型。馈线统计线损率和其相关特征构成的数据为表格型数据,机器学习模型中的决策树及以其为基础单元构成的集成树模型在处理该类数据时比其他机器学习估计模型和深度学习估计模型效果好。为此,主要对决策树和集成树模型进行研究。集成树模型分为两大类,分别为bagging和boosting,bagging集成的树模型有随机森林、extratree,boosting集成的树模型有gbdt、adaboost和xgboost。但仅采用单一的集成树模型进行估计时的效果欠佳。
技术实现要素:
4.针对上述问题,本发明提出一种配电馈线统计线损率估计方法、装置及存储介质,使用基于聚类算法和集成学习算法对配电馈线统计线损率进行估计,能够弥补单一估计模型估计精度的不足,更好地解决配电馈线统计线损率估计问题。
5.为了实现上述技术目的,达到上述技术效果,本发明通过以下技术方案实现:
6.第一方面,本发明提供了一种配电馈线统计线损率估计方法,包括:
7.获取预先训练好的统计线损率估计模型;
8.将各条馈线的实时统计线损率和影响其统计线损率的实时因素数据作为聚类特征,利用聚类算法对馈线进行聚类,将馈线划分为多个类;
9.将各个类中各条馈线的实时统计线损率和影响其统计线损率的实时因素数据,输入至所述统计线损率估计模型;
10.所述统计线损率估计模型基于集成学习算法对接收到的数据处理后,输出统计线损率估计值。
11.可选地,所述统计线损率估计模型的训练方法包括:
12.将各条馈线的历史统计线损率和影响其统计线损率的历史因素数据作为聚类特征;
13.利用聚类算法对馈线进行聚类,将馈线划分为多个类;
14.基于各个类中各条馈线的历史统计线损率和影响其统计线损率的历史因素数据,采用集成学习算法,训练得到统计线损率估计模型。
15.可选地,所述利用聚类算法对馈线进行聚类,将馈线划分为多个类,包括以下子步骤:
16.将获取到的各条馈线的历史/实时统计线损率和影响其统计线损率的历史/实时因素数据作为聚类特征;
17.基于每条馈线的聚类特征,生成特征向量;
18.计算每条馈线的特征向量间的距离,并使用k-medoids算法对馈线进行初步聚类,聚类过程中采用的损失函数为:其中,uj为第i类的第j条馈线的特征向量,ci为第i类的中心馈线的特征向量;
19.利用戴维森堡指数评估初步聚类的聚类效果,选取戴维森堡指数最小的聚类簇数作为最终的聚类个数,完成将馈线划分为多个类。
20.可选地,所述基于每条馈线的聚类特征,生成特征向量步骤之前还包括:
21.对所有馈线的历史/实时统计线损率和影响其统计线损率的历史/实时因素数据进行相关性分析,生成相关系数矩阵,并根据所述相关系数矩阵中各相关系数的大小,筛选出满足预设要求的聚类特征。
22.可选地,所述戴维森堡指数的计算公式为:
[0023][0024]
其中,k为聚类簇数,i为第i类,j为第j类,si为第i类中非中心馈线的特征向量到该类中心馈线的特征向量的平均距离,sj为第j类中非聚类中心馈线的特征向量到该类的中心馈线的特征向量的平均距离,d
ij
为第i类的中心馈线的特征向量和第j类聚类中心馈线的特征向量之间的距离。
[0025]
可选地,所述基于各个类中各条馈线的历史统计线损率和影响其统计线损率的历史因素数据,采用集成学习算法,训练得到统计线损率估计模型,包括:
[0026]
将各个类中的各条馈线的历史统计线损率和影响其统计线损率的历史因素数据划分为训练集和测试集;
[0027]
以每个类对应的训练集作为输入,分别训练对应的基估计模型;
[0028]
将各基估计模型的输出进行加权集成,得到统计线损率估计模型;
[0029]
所述利用所述统计线损率估计模型输出统计线损率估计值,包括:
[0030]
以每个类对应的测试集对所述统计线损率估计模型进行测试,输出统计线损率估计值,并基于所述统计线损率估计值与统计线损率真实值评估统计线损率估计模型的准确率,完成对所述统计线损率估计模型的测试。
[0031]
可选地,所述统计线损率估计模型的表达式为:
[0032][0033]
ym=fm(u)
[0034]
其中,k为基估计模型个数,为统计线损率估计值,ym为第m个基估计模型的估计结果,wm为第m个基估计模型的估计结果的权重,fm为第m个基估计模型抽象而成的函数,u为单条馈线对应的特征向量。
[0035]
第二方面,本发明提供了一种配电馈线统计线损率估计装置,包括:
[0036]
获取模块,被配置为用于获取预先训练好的统计线损率估计模型;
[0037]
聚类模块,被配置为用于将各条馈线的实时统计线损率和影响其统计线损率的实时因素数据作为聚类特征,利用聚类算法对馈线进行聚类,将馈线划分为多个类;
[0038]
数据输入模块,被配置为用于将各个类中各条馈线的实时统计线损率和影响其统计线损率的实时因素数据,输入至所述统计线损率估计模型;
[0039]
估计模块,被配置为用于所述统计线损率估计模型基于集成学习算法对接收到的数据处理后,输出统计线损率估计值。
[0040]
可选地,所述统计线损率估计模型的训练方法包括:
[0041]
将各条馈线的历史统计线损率和影响其统计线损率的历史因素数据作为聚类特征;
[0042]
利用聚类算法对馈线进行聚类,将馈线划分为多个类;
[0043]
基于各个类中各条馈线的历史统计线损率和影响其统计线损率的历史因素数据,采用集成学习算法,训练得到统计线损率估计模型
[0044]
可选地,所述利用聚类算法对馈线进行聚类,将馈线划分为多个类,包括以下子步骤:
[0045]
将获取到的各条馈线的历史/实时统计线损率和影响其统计线损率的历史/实时因素数据作为聚类特征;
[0046]
基于每条馈线的聚类特征,生成特征向量;
[0047]
计算每条馈线的特征向量间的距离,并使用k-medoids算法对馈线进行初步聚类,聚类过程中采用的损失函数为:其中,uj为第i类的第j条馈线的特征向量,ci为第i类的中心馈线的特征向量;
[0048]
利用戴维森堡指数评估初步聚类的聚类效果,选取戴维森堡指数最小的聚类簇数作为最终的聚类个数,完成将馈线划分为多个类。
[0049]
可选地,所述基于每条馈线的聚类特征,生成特征向量步骤之前还包括:
[0050]
对所有馈线的历史/实时统计线损率和影响其统计线损率的历史/实时因素数据进行相关性分析,生成相关系数矩阵,并根据所述相关系数矩阵中各相关系数的大小,筛选出满足预设要求的聚类特征。
[0051]
可选地,所述戴维森堡指数的计算公式为:
[0052][0053]
其中,k为聚类簇数,i为第i类,j为第j类,si为第i类中非中心馈线的特征向量到该类中心馈线的特征向量的平均距离,sj为第j类中非聚类中心馈线的特征向量到该类的中心馈线的特征向量的平均距离,d
ij
为第i类的中心馈线的特征向量和第j类聚类中心馈线
的特征向量之间的距离。
[0054]
可选地,所述基于各个类中各条馈线的历史统计线损率和影响其统计线损率的历史因素数据,采用集成学习算法,训练得到统计线损率估计模型,包括:
[0055]
将各个类中的各条馈线的历史统计线损率和影响其统计线损率的历史因素数据划分为训练集和测试集;
[0056]
以每个类对应的训练集作为输入,分别训练对应的基估计模型;
[0057]
将各基估计模型的输出进行加权集成,得到统计线损率估计模型;
[0058]
所述利用所述统计线损率估计模型输出统计线损率估计值,包括:
[0059]
以每个类对应的测试集对所述统计线损率估计模型进行测试,输出统计线损率估计值,并基于所述统计线损率估计值与统计线损率真实值评估统计线损率估计模型的准确率,完成对所述统计线损率估计模型的测试。
[0060]
可选地,所述统计线损率估计模型的表达式为:
[0061][0062]
ym=fm(u)
[0063]
其中,k为基估计模型个数,为统计线损率估计值,ym为第m个基估计模型的估计结果,wm为第m个基估计模型的估计结果的权重,fm为第m个基估计模型抽象而成的函数,u为单条馈线对应的特征向量。
[0064]
第三方面,本发明提供了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时,实现如第一方面中任一项所述的配电馈线统计线损率估计方法。
[0065]
与现有技术相比,本发明的有益效果:
[0066]
本发明克服了单一估计模型进行配电馈线统计线损率估计时估计精度不足的问题。使用聚类算法(如k-medoids)对馈线进行聚类,实现对配电馈线更精细化的管理。再使用基估计模型对每类馈线进行统计线损率估计后,使用加权集成模型对基估计模型的估计结果进行二次加权集成。与单一估计模型相比,本发明所提模型对每一类馈线进行估计时,均有更低的mse,即均有更高的估计精度。
附图说明
[0067]
为了使本发明的内容更容易被清楚地理解,下面根据具体实施例并结合附图,对本发明作进一步详细的说明,其中:
[0068]
图1为本发明一种实施例的配电馈线统计线损率估计方法的流程示意图
[0069]
图2为本发明一种实施例的相关系数矩阵的可视化示意图;
[0070]
图3为取不同聚类簇数时的dbi值;
[0071]
图4为第一类馈线线损率估计结果示意图;
[0072]
图5为第二类馈线线损率估计结果示意图;
[0073]
图6为第三类馈线线损率估计结果示意图;
[0074]
图7为每一类馈线的测试集对统计线损率估计模型进行评价的mse对比图;
[0075]
图8为本发明一种实施的采用集成学习算法训练得到所述统计线损率估计模型的
示意图。
具体实施方式
[0076]
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明的保护范围。
[0077]
下面结合附图对本发明的应用原理作详细的描述。
[0078]
实施例1
[0079]
本发明实施例中提供了一种配电馈线统计线损率估计方法,包括以下步骤:
[0080]
(1)获取预先训练好的统计线损率估计模型;
[0081]
(2)将各条馈线的实时统计线损率和影响其统计线损率的实时因素数据作为聚类特征,利用聚类算法对馈线进行聚类,将馈线划分为多个类;
[0082]
(3)将各个类中各条馈线的实时统计线损率和影响其统计线损率的实时因素数据,输入至所述统计线损率估计模型;
[0083]
(4)所述统计线损率估计模型基于集成学习算法对接收到的数据处理后,输出统计线损率估计值。
[0084]
在本发明实施例的一种具体实施方式中,所述统计线损率估计模型的训练方法包括以下步骤:
[0085]
(1.1)将各条馈线的历史统计线损率和影响其统计线损率的历史因素数据作为聚类特征;
[0086]
(1.2)利用聚类算法对馈线进行聚类,将馈线划分为多个类;
[0087]
(1.3)基于各个类中各条馈线的历史统计线损率和影响其统计线损率的历史因素数据,采用集成学习算法,训练得到统计线损率估计模型。
[0088]
在本发明实施例的一种具体实施方式中,所述利用聚类算法对馈线进行聚类,将馈线划分为多个类,包括以下子步骤:
[0089]
将获取到的各条馈线的历史/实时统计线损率和影响其统计线损率的历史/实时因素数据作为聚类特征,即:将获取到的各条馈线的历史统计线损率和影响其统计线损率的历史因素数据作为聚类特征;或者,将获取到的各条馈线的实时统计线损率和影响其统计线损率的实时因素数据作为聚类特征;在具体实施过程中,所述影响其统计线损率的因素数据包括理论线损率、线路供电量、配变额定容量、配变运行时间、线路投运时间、线路总长度等,具体可以根据实际情况进行适应性设计;
[0090]
基于每条馈线的聚类特征,生成特征向量;
[0091]
计算每条馈线的特征向量间的距离,并使用k-medoids算法对馈线进行初步聚类,聚类过程中采用的损失函数为:其中,uj为第i类的第j条馈线的特征向量,ci为第i类的中心馈线的特征向量;
[0092]
利用戴维森堡指数评估初步聚类的聚类效果,选取戴维森堡指数最小的聚类簇数作为最终的聚类个数,完成将馈线划分为多个类。
[0093]
优选地,为了提高聚类效果,所述基于每条馈线的聚类特征,生成特征向量步骤之
前还包括:
[0094]
对所有馈线的统计线损率和影响其统计线损率的因素数据进行相关性分析,生成相关系数矩阵,并根据所述相关系数矩阵中各相关系数的大小,筛选出满足预设要求的聚类特征;在具体实施过程中,具体包括以下步骤:
[0095]
基于所述配电馈线统计线损率数据,计算出pearson相关系数;
[0096]
基于pearson相关系数,生成pearson相关系数矩阵;所述pearson相关系数矩阵的表达式为:
[0097][0098]
其中,
[0099][0100][0101]
其中,ρ为相关系数矩阵,xa为第a个聚类特征向量,a=1
…
6,xi=[x
1a
,x
2a
,...,x
na
]
t
,其中x
na
为第n条馈线的第a个聚类特征;xb为第b个聚类特征向量,b=1
…
6,xj=[x
1b
,x
2b
,...,x
nb
]
t
,其中x
nb
为第n条馈线的第b个聚类特征,y为统计线损率向量,y=[y1,y2,...,yn],yn为统计线损率向量中的第n个统计线损率,为第a个聚类特征向量与统计线损率向量之间的相关系数,为第a个聚类特征向量和第b个聚类特征向量中各特征间的相关系数。在具体应用过程中,a和的b取值范围可以根据实际情况调整。
[0102]
根据pearson相关系数矩阵中pearson相关系数的大小,筛选出相关系数大于设定阈值的配电馈线统计线损率数据,获得筛选后的配电馈线统计线损率数据。
[0103]
所述戴维森堡指数的计算公式为:
[0104][0105]
其中,k为聚类簇数,i为第i类,j为第j类,si为第i类中非中心馈线的特征向量到该类中心馈线的特征向量的平均距离,sj为第j类中非聚类中心馈线的特征向量到该类的中心馈线的特征向量的平均距离,d
ij
为第i类的中心馈线的特征向量和第j类聚类中心馈线的特征向量之间的距离。
[0106]
在本发明实施例的一种具体实施方式中,如图8所示,所述基于各个类中各条馈线
的历史统计线损率和影响其统计线损率的历史因素数据,采用集成学习算法,训练得到统计线损率估计模型,包括:
[0107]
将各个类中的各条馈线的历史统计线损率和影响其统计线损率的历史因素数据划分为训练集和测试集;
[0108]
以每个类对应的训练集作为输入,分别训练对应的基估计模型,如图8中的基估计模型1、基估计模型2
……
基估计模型n;
[0109]
将各基估计模型的输出进行加权集成,得到统计线损率估计模型;所述统计线损率估计模型的表达式为:
[0110][0111]
ym=fm(u)
[0112]
其中,k为基估计模型个数,为统计线损率估计值,ym为第m个基估计模型的估计结果,wm为第m个基估计模型的估计结果的权重,fm为第m个基估计模型抽象而成的函数,u为单条馈线对应的特征向量;
[0113]
所述利用所述统计线损率估计模型输出统计线损率估计值,包括:
[0114]
以每个类对应的测试集对所述统计线损率估计模型进行测试,输出统计线损率估计值,并基于所述统计线损率估计值与统计线损率真实值评估统计线损率估计模型的准确率,完成对所述统计线损率估计模型的测试;在进行统计线损率估计模型测试时,采用均方误差作为估计误差来评估所述统计线损率估计模型的准确率;所述均方误差的计算公式为:
[0115][0116]
其中,mse为均方误差,n为测试集中馈线的数量,为统计线损率估计值,yi为配电馈线统计线损率估真实值。mse越小,表明线损率估计模型的性能就越好。
[0117]
下面以某市1117条馈线为例进一步验证本发明实施例中配电馈线统计线损率估计方法的可行性。
[0118]
对获取到的配电馈线统计线损率数据进行相关性分析,可视化相关性分析结果,如图2所示,自上而下分别为统计线损率(xsl)、理论线损率(xsl_t)、线路供电量(gdl)、配变额定容量(rated_capacity)、配变运行时间(run_date)、线路投运时间(run_date).1、线路总长度(sum_length)。可以看到线路投运时间、线路总长度与统计线损率相关性较低,因此剔除这两个特征,故最终的配电馈线统计线损率数据仅包括理论线损率、线路供电量、配变额定容量、配变运行时间和统计线损率。
[0119]
使用k-medoids聚类算法对最终的配电馈线统计线损率数据进行聚类分析,并计算出取不同聚类簇数时的dbi值。如图3所示,当聚类簇数为3时,dbi值最小,聚类效果最好。因此,选择将馈线聚为三类,第一类有588条馈线,第二类有355条馈线,第三类有174条馈线。
[0120]
对聚类结果中各类中的配电馈线统计线损率数据按照0.8:0.2的比例进行训练集和测试集划分;
[0121]
选用xgboost、adaboost和随机森林作为基估计模型,最终输出结果可表示为如下公式:
[0122]
y=y1*w1+y2*w2+y3*w3[0123]
其中为最终估计结果,y1、y2、y3分别为三个基估计模型的估计结果,w1、w2、w3分别为三个基估计模型分配的权重;
[0124]
使用各类中的测试集对统计线损率估计模型进行评价,采用mse评估统计线损率估计模型的性能,估计结果如图4~图6所示,test表示测试值,wavam表示真实值,横坐标表示测试样本数,纵坐标表示统计线损率值,mse的对比如图7所示。其中wavam_total是不聚类时的加权集成模型的mse,wavam_c1、wavam_c2、wavam_c3为聚类后各类馈线的mse。
[0125]
实施例2
[0126]
基于与实施例1相同的发明构思,本发明实施例中提供了一种配电馈线统计线损率估计装置,包括:
[0127]
获取模块,被配置为用于获取预先训练好的统计线损率估计模型;
[0128]
聚类模块,被配置为用于将各条馈线的实时统计线损率和影响其统计线损率的实时因素数据作为聚类特征,利用聚类算法对馈线进行聚类,将馈线划分为多个类;
[0129]
数据输入模块,被配置为用于将各个类中各条馈线的实时统计线损率和影响其统计线损率的实时因素数据,输入至所述统计线损率估计模型;
[0130]
估计模块,被配置为用于所述统计线损率估计模型基于集成学习算法对接收到的数据处理后,输出统计线损率估计值。
[0131]
在本发明实施例的一种具体实施方式中,所述统计线损率估计模型的训练方法包括以下步骤:
[0132]
(1.1)将各条馈线的历史统计线损率和影响其统计线损率的历史因素数据作为聚类特征;
[0133]
(1.2)利用聚类算法对馈线进行聚类,将馈线划分为多个类;
[0134]
(1.3)基于各个类中各条馈线的历史统计线损率和影响其统计线损率的历史因素数据,采用集成学习算法,训练得到统计线损率估计模型。
[0135]
在本发明实施例的一种具体实施方式中,所述利用聚类算法对馈线进行聚类,将馈线划分为多个类,包括以下子步骤:
[0136]
将获取到的各条馈线的历史/实时统计线损率和影响其统计线损率的历史/实时因素数据作为聚类特征,即:将获取到的各条馈线的历史统计线损率和影响其统计线损率的历史因素数据作为聚类特征;或者,将获取到的各条馈线的实时统计线损率和影响其统计线损率的实时因素数据作为聚类特征;在具体实施过程中,所述影响其统计线损率的因素数据包括理论线损率、线路供电量、配变额定容量、配变运行时间、线路投运时间、线路总长度等,具体可以根据实际情况进行适应性设计;
[0137]
基于每条馈线的聚类特征,生成特征向量;
[0138]
计算每条馈线的特征向量间的距离,并使用k-medoids算法对馈线进行初步聚类,聚类过程中采用的损失函数为:其中,uj为第i类的第j条馈线的特征向量,ci为第i类的中心馈线的特征向量;
[0139]
利用戴维森堡指数评估初步聚类的聚类效果,选取戴维森堡指数最小的聚类簇数作为最终的聚类个数,完成将馈线划分为多个类。
[0140]
优选地,为了提高聚类效果,所述基于每条馈线的聚类特征,生成特征向量步骤之前还包括:
[0141]
对所有馈线的统计线损率和影响其统计线损率的因素数据进行相关性分析,生成相关系数矩阵,并根据所述相关系数矩阵中各相关系数的大小,筛选出满足预设要求的聚类特征;在具体实施过程中,具体包括以下步骤:
[0142]
基于所述配电馈线统计线损率数据,计算出pearson相关系数;
[0143]
基于pearson相关系数,生成pearson相关系数矩阵;所述pearson相关系数矩阵的表达式为:
[0144][0145]
其中,
[0146][0147][0148]
其中,ρ为相关系数矩阵,xa为第a个聚类特征向量,a=1
…
6,xi=[x
1a
,x
2a
,...,x
na
]
t
,其中x
na
为第n条馈线的第a个聚类特征;xb为第b个聚类特征向量,b=1
…
6,xj=[x
1b
,x
2b
,...,x
nb
]
t
,其中x
nb
为第n条馈线的第b个聚类特征,y为统计线损率向量,y=[y1,y2,...,yn],yn为统计线损率向量中的第n个统计线损率,为第a个聚类特征向量与统计线损率向量之间的相关系数,为第a个聚类特征向量和第b个聚类特征向量中各特征间的相关系数。在具体应用过程中,a和的b取值范围可以根据实际情况调整。
[0149]
根据pearson相关系数矩阵中pearson相关系数的大小,筛选出相关系数大于设定阈值的配电馈线统计线损率数据,获得筛选后的配电馈线统计线损率数据。
[0150]
所述戴维森堡指数的计算公式为:
[0151][0152]
其中,k为聚类簇数,i为第i类,j为第j类,si为第i类中非中心馈线的特征向量到该类中心馈线的特征向量的平均距离,sj为第j类中非聚类中心馈线的特征向量到该类的
中心馈线的特征向量的平均距离,d
ij
为第i类的中心馈线的特征向量和第j类聚类中心馈线的特征向量之间的距离。
[0153]
在本发明实施例的一种具体实施方式中,如图8所示,所述基于各个类中各条馈线的历史统计线损率和影响其统计线损率的历史因素数据,采用集成学习算法,训练得到统计线损率估计模型,包括:
[0154]
将各个类中的各条馈线的历史统计线损率和影响其统计线损率的历史因素数据划分为训练集和测试集;
[0155]
以每个类对应的训练集作为输入,分别训练对应的基估计模型,如图8中的基估计模型1、基估计模型2
……
基估计模型n;
[0156]
将各基估计模型的输出进行加权集成,得到统计线损率估计模型;所述统计线损率估计模型的表达式为:
[0157][0158]
ym=fm(u)
[0159]
其中,k为基估计模型个数,为统计线损率估计值,ym为第m个基估计模型的估计结果,wm为第m个基估计模型的估计结果的权重,fm为第m个基估计模型抽象而成的函数,u为单条馈线对应的特征向量;
[0160]
所述利用所述统计线损率估计模型输出统计线损率估计值,包括:
[0161]
以每个类对应的测试集对所述统计线损率估计模型进行测试,输出统计线损率估计值,并基于所述统计线损率估计值与统计线损率真实值评估统计线损率估计模型的准确率,完成对所述统计线损率估计模型的测试;在进行统计线损率估计模型测试时,采用均方误差作为估计误差来评估所述统计线损率估计模型的准确率;所述均方误差的计算公式为:
[0162][0163]
其中,mse为均方误差,n为测试集中馈线的数量,为统计线损率估计值,yi为配电馈线统计线损率估真实值。mse越小,表明线损率估计模型的性能就越好。
[0164]
下面以某市1117条馈线为例进一步验证本发明实施例中配电馈线统计线损率估计方法的可行性。
[0165]
对获取到的配电馈线统计线损率数据进行相关性分析,可视化相关性分析结果,如图2所示,自上而下分别为统计线损率(xsl)、理论线损率(xsl_t)、线路供电量(gdl)、配变额定容量(rated_capacity)、配变运行时间(run_date)、线路投运时间(run_date).1、线路总长度(sum_length)。可以看到线路投运时间、线路总长度与统计线损率相关性较低,因此剔除这两个特征,故最终的配电馈线统计线损率数据仅包括理论线损率、线路供电量、配变额定容量、配变运行时间和统计线损率。
[0166]
使用k-medoids聚类算法对最终的配电馈线统计线损率数据进行聚类分析,并计算出取不同聚类簇数时的dbi值。如图3所示,当聚类簇数为3时,dbi值最小,聚类效果最好。因此,选择将馈线聚为三类,第一类有588条馈线,第二类有355条馈线,第三类有174条馈
线。
[0167]
对聚类结果中各类中的配电馈线统计线损率数据按照0.8:0.2的比例进行训练集和测试集划分;
[0168]
选用xgboost、adaboost和随机森林作为基估计模型,最终输出结果可表示为如下公式:
[0169]
y=y1*w1+y2*w2+y3*w3[0170]
其中为最终估计结果,y1、y2、y3分别为三个基估计模型的估计结果,w1、w2、w3分别为三个基估计模型分配的权重;
[0171]
使用各类中的测试集对统计线损率估计模型进行评价,采用mse评估统计线损率估计模型的性能,估计结果如图4~图6所示,test表示测试值,wavam表示真实值,横坐标表示测试样本数,纵坐标表示统计线损率值,mse的对比如图7所示。其中wavam_total是不聚类时的加权集成模型的mse,wavam_c1、wavam_c2、wavam_c3为聚类后各类馈线的mse。
[0172]
实施例3
[0173]
本发明提供了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时,实现如实施例1中任一项所述的配电馈线统计线损率估计方法。
[0174]
本领域内的技术人员应明白,本技术的实施例可提供为方法、系统、或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0175]
本技术是参照根据本技术实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0176]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0177]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0178]
以上结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,这些均属于本发明的保护之内。
[0179]
以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。
技术特征:
1.一种配电馈线统计线损率估计方法,其特征在于,包括:获取预先训练好的统计线损率估计模型;将各条馈线的实时统计线损率和影响其统计线损率的实时因素数据作为聚类特征,利用聚类算法对馈线进行聚类,将馈线划分为多个类;将各个类中各条馈线的实时统计线损率和影响其统计线损率的实时因素数据,输入至所述统计线损率估计模型;所述统计线损率估计模型基于集成学习算法对接收到的数据处理后,输出统计线损率估计值。2.根据权利要求1所述的一种馈线统计线损率估计方法,其特征在于,所述统计线损率估计模型的训练方法包括:将各条馈线的历史统计线损率和影响其统计线损率的历史因素数据作为聚类特征;利用聚类算法对馈线进行聚类,将馈线划分为多个类;基于各个类中各条馈线的历史统计线损率和影响其统计线损率的历史因素数据,采用集成学习算法,训练得到统计线损率估计模型。3.根据权利要求2所述的一种馈线统计线损率估计方法,其特征在于:所述利用聚类算法对馈线进行聚类,将馈线划分为多个类,包括以下子步骤:将获取到的各条馈线的历史/实时统计线损率和影响其统计线损率的历史/实时因素数据作为聚类特征;基于每条馈线的聚类特征,生成特征向量;计算每条馈线的特征向量间的距离,并使用k-medoids算法对馈线进行初步聚类,聚类过程中采用的损失函数为:其中,u
j
为第i类的第j条馈线的特征向量,c
i
为第i类的中心馈线的特征向量;利用戴维森堡指数评估初步聚类的聚类效果,选取戴维森堡指数最小的聚类簇数作为最终的聚类个数,完成将馈线划分为多个类。4.根据权利要求3所述的一种配电馈线统计线损率估计方法,其特征在于:所述基于每条馈线的聚类特征,生成特征向量步骤之前还包括:对所有馈线的历史/实时统计线损率和影响其统计线损率的历史/实时因素数据进行相关性分析,生成相关系数矩阵,并根据所述相关系数矩阵中各相关系数的大小,筛选出满足预设要求的聚类特征。5.根据权利要求3所述的一种配电馈线统计线损率估计方法,其特征在于:所述戴维森堡指数的计算公式为:其中,k为聚类簇数,i为第i类,j为第j类,s
i
为第i类中非中心馈线的特征向量到该类中心馈线的特征向量的平均距离,s
j
为第j类中非聚类中心馈线的特征向量到该类的中心馈线的特征向量的平均距离,d
ij
为第i类的中心馈线的特征向量和第j类聚类中心馈线的特征向量之间的距离。
6.根据权利要求2所述的一种配电馈线统计线损率估计方法,其特征在于:所述基于各个类中各条馈线的历史统计线损率和影响其统计线损率的历史因素数据,采用集成学习算法,训练得到统计线损率估计模型,包括:将各个类中的各条馈线的历史统计线损率和影响其统计线损率的历史因素数据划分为训练集和测试集;以每个类对应的训练集作为输入,分别训练对应的基估计模型;将各基估计模型的输出进行加权集成,得到统计线损率估计模型;所述利用所述统计线损率估计模型输出统计线损率估计值,包括:以每个类对应的测试集对所述统计线损率估计模型进行测试,输出统计线损率估计值,并基于所述统计线损率估计值与统计线损率真实值评估统计线损率估计模型的准确率,完成对所述统计线损率估计模型的测试。7.根据权利要求6所述的一种配电馈线统计线损率估计方法,其特征在于:所述统计线损率估计模型的表达式为:损率估计模型的表达式为:其中,k为基估计模型个数,为统计线损率估计值,y
m
为第m个基估计模型的估计结果,w
m
为第m个基估计模型的估计结果的权重,f
m
为第m个基估计模型抽象而成的函数,u为单条馈线对应的特征向量。8.一种配电馈线统计线损率估计装置,其特征在于,包括:获取模块,被配置为用于获取预先训练好的统计线损率估计模型;聚类模块,被配置为用于将各条馈线的实时统计线损率和影响其统计线损率的实时因素数据作为聚类特征,利用聚类算法对馈线进行聚类,将馈线划分为多个类;数据输入模块,被配置为用于将各个类中各条馈线的实时统计线损率和影响其统计线损率的实时因素数据,输入至所述统计线损率估计模型;估计模块,被配置为用于所述统计线损率估计模型基于集成学习算法对接收到的数据处理后,输出统计线损率估计值。9.根据权利要求8所述的一种配电馈线统计线损率估计装置,其特征在于,所述统计线损率估计模型的训练方法包括:将各条馈线的历史统计线损率和影响其统计线损率的历史因素数据作为聚类特征;利用聚类算法对馈线进行聚类,将馈线划分为多个类;基于各个类中各条馈线的历史统计线损率和影响其统计线损率的历史因素数据,采用集成学习算法,训练得到统计线损率估计模型。10.根据权利要求8所述的一种配电馈线统计线损率估计装置,其特征在于,所述利用聚类算法对馈线进行聚类,将馈线划分为多个类,包括以下子步骤:将获取到的各条馈线的历史/实时统计线损率和影响其统计线损率的历史/实时因素数据作为聚类特征;基于每条馈线的聚类特征,生成特征向量;计算每条馈线的特征向量间的距离,并使用k-medoids算法对馈线进行初步聚类,聚类
过程中采用的损失函数为:其中,u
j
为第i类的第j条馈线的特征向量,c
i
为第i类的中心馈线的特征向量;利用戴维森堡指数评估初步聚类的聚类效果,选取戴维森堡指数最小的聚类簇数作为最终的聚类个数,完成将馈线划分为多个类。11.根据权利要求10所述的一种配电馈线统计线损率估计装置,其特征在于,所述基于每条馈线的聚类特征,生成特征向量步骤之前还包括:对所有馈线的历史/实时统计线损率和影响其统计线损率的历史/实时因素数据进行相关性分析,生成相关系数矩阵,并根据所述相关系数矩阵中各相关系数的大小,筛选出满足预设要求的聚类特征。12.根据权利要求10所述的一种配电馈线统计线损率估计装置,其特征在于,所述戴维森堡指数的计算公式为:其中,k为聚类簇数,i为第i类,j为第j类,s
i
为第i类中非中心馈线的特征向量到该类中心馈线的特征向量的平均距离,s
j
为第j类中非聚类中心馈线的特征向量到该类的中心馈线的特征向量的平均距离,d
ij
为第i类的中心馈线的特征向量和第j类聚类中心馈线的特征向量之间的距离。13.根据权利要求9所述的一种配电馈线统计线损率估计装置,其特征在于,所述基于各个类中各条馈线的历史统计线损率和影响其统计线损率的历史因素数据,采用集成学习算法,训练得到统计线损率估计模型,包括:将各个类中的各条馈线的历史统计线损率和影响其统计线损率的历史因素数据划分为训练集和测试集;以每个类对应的训练集作为输入,分别训练对应的基估计模型;将各基估计模型的输出进行加权集成,得到统计线损率估计模型;所述利用所述统计线损率估计模型输出统计线损率估计值,包括:以每个类对应的测试集对所述统计线损率估计模型进行测试,输出统计线损率估计值,并基于所述统计线损率估计值与统计线损率真实值评估统计线损率估计模型的准确率,完成对所述统计线损率估计模型的测试。14.根据权利要求13所述的一种配电馈线统计线损率估计装置,其特征在于,所述统计线损率估计模型的表达式为:y
m
=f
m
(u)其中,k为基估计模型个数,为统计线损率估计值,y
m
为第m个基估计模型的估计结果,w
m
为第m个基估计模型的估计结果的权重,f
m
为第m个基估计模型抽象而成的函数,u为单条馈线对应的特征向量。15.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被
处理器执行时,实现如权利要求1-7中任一项所述的配电馈线统计线损率估计方法。
技术总结
本发明公开了一种配电馈线统计线损率估计方法、装置及存储介质,所述方法包括获取预先训练好的统计线损率估计模型;将各条馈线的实时统计线损率和影响其统计线损率的实时因素数据作为聚类特征,利用聚类算法对馈线进行聚类,将馈线划分为多个类;将各个类中各条馈线的实时统计线损率和影响其统计线损率的实时因素数据,输入至所述统计线损率估计模型;所述统计线损率估计模型基于集成学习算法对接收到的数据处理后,输出统计线损率估计值。本发明使用基于聚类算法和集成学习算法对配电馈线统计线损率进行估计,能够弥补单一估计模型估计精度不足的问题,从而更精确地进行配电馈线统计线损率估计。电馈线统计线损率估计。电馈线统计线损率估计。
技术研发人员:付慧 王守相 史明明 赵倩宇 李双伟 费骏韬 韩亮 王靓 陈静 方鑫 罗珊珊
受保护的技术使用者:国网江苏省电力有限公司
技术研发日:2023.04.06
技术公布日:2023/7/20
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
