一种基于聚类算法的公变台区供电质量异常监控方法与流程

未命名 07-27 阅读:125 评论:0


1.本发明属于供电技术领域,具体涉及一种基于聚类算法的公变台区供电质量异常监控方法。


背景技术:

2.针对主动配电网供电质量进行复合感知与评估,是衡量供电质量水平、制定电价与供电策略、控制提升电能质量的重要依据。主动配电网结构复杂、涉及面广,以及大量的分布式能源与可控负荷接入,对供电质量产生严重的影响,传统的电能质量评估标准难以适应供电质量需求的日益增长。
3.特别的,由于电网结构制约、季节性用电量突增等因素,老旧台区由于受到供电线路截面积小、供电半径长、三相负荷不平衡等技术因素影响,易出现供电电压质量问题,尤其在用电高峰时段,随着用电负荷增加、在供电线路末端易出现供电电压偏低现象,影响用户正常用电,造成客户诉求。


技术实现要素:

4.为了解决上述现有技术中存在的问题,提供了一种基于聚类算法的公变台区供电质量异常监控方法。
5.本发明解决其技术问题所采用的技术方案是:
6.本技术方案提出了一种基于聚类算法的公变台区供电质量异常监控方法,包括:
7.s1:获取公变台区的用电数据,并根据用电数据选取相应的特征分析,特征分析包括缺失值填充、数据转换、归一化、特征抽取,获得可用于聚类分析的有效特征;
8.s2:基于特征分析得到的有效特征,进行两阶段的并行化的聚类分析,首先聚类分析出公变台区对应的用电类型,然后,对同一用电类型的公变台区的用户进行聚类,细分出精细的用户群体;
9.s3:针对聚类分析得到的不同用户群体设定相应的阈值,当检测到用户群体的用电信息超出或者低于阈值时,传递相应的信号给用电信息处理系统,用电信息处理系统发出警报。
10.优选的,s1中,用电数据的特征包括负荷量x
i1
、负荷率x
i2
、峰电系数x
i3
和谷电系数x
i4
,聚类分析的每一个样本xk均为一个四维向量。
11.优选的,s1中,对公变台区的用电数据进行量化表示:
[0012][0013]
式中,xs和x(t)分别为公变台区的实际运行数据和采样结果数据,n为待测配网中的线路数量,t和ts表示数据挖掘时间和周期,对初始挖掘的数据进行缺失补齐、噪声滤波
及融合处理,从而得出任意时刻公变台区运行数据的自动收集结果。
[0014]
优选的,数据缺失处理方法包括:
[0015]
整体数据缺失:部分采集数据仅包含电表资产号、采集时间信息,用于聚类的特征值整体缺失,对这些数据执行删除操作;
[0016]
部分特征值缺失:对此类数据使用众数对缺失值进行填充,通过并行化的众数计算算法,以资源的方式进行保存,以供数据预处理时调用;
[0017]
在完成缺失值处理之后,对特征量进行归一化处理,以消除特征的量纲对聚类算法性能的影响,表达形式如下:
[0018][0019]
优选的,s2中,通过求解jm(u,p)的极小值解min{jm(u,p)},从而获得最佳的划分矩阵和聚类中心矩阵,对于模式空间中包含n个成员的待分类对象集合x={x1,x2,

,xn}而言,划分矩阵u可以表示为:
[0020][0021]
其中,μ
ik
=μxi(xk)表示样本xk与子集xi(1≤i≤c)之间的隶属关系,μ
ik
的取值范围为[0,1],即每个样本与子集xi之间的隶属关系由一个0~1之间的实数模糊表示;
[0022]
p={pi,1≤i≤c}表示第i类子集xi的聚类中心矩阵,优化目标表示为:
[0023][0024]
其中,m为平滑因子,m控制模式在类子集之间的分享程度,m越大,得到的聚类结果越模糊,m设为2;d
ik
表示样本k到第i个聚类中心pi之间的距离,使用欧氏距离表示为:
[0025][0026]
通过迭代不断更新隶属度μ
ik
和聚类中心pi,当迭代收敛时,获得的隶属度和聚类中心用于对数据集进行分类,并确定数据对象与分类之间的隶属关系,迭代过程通过在停止域和迭代次数b的控制下,对下式进行求解:
[0027][0028][0029]
根据公式(6)和公式(7)在迭代过程中不断更新隶属度和聚类中心,直到满足设定的停止域条件||u
(b)-u
(b+1)
||<ε为止,此时,输出的聚类中心即为用电行为特征,而隶属度
矩阵决定了每个样本与用电行为特征的接近程度。
[0030]
优选的,聚类有效性验证方法包括v
xie
,采用紧凑度和分离度衡量不同划分的聚类质量,通过获取公式(8)的最小值完成对聚类有效性的验证:
[0031][0032]
优选的,s1中,归一化处理方法包括:
[0033][0034]
式中,xi为采集的每点数据,x
min
为整体数据的最小值,x
max
为整体数据的最大值,x
′i为归一化后的值。
[0035]
与现有技术相比,本发明具有以下优点:
[0036]
本发明基于聚类算法建立了对台区供电电压质量监控的方法,利用用电信息采集系统的数据分析能力,对可实现高频电压曲线数据采集能力的台区,开展低电压监测,通过分析比对输出需治理的案例,辅助相关部门精准治理,有效减少客户诉求。
附图说明
[0037]
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
[0038]
图1是本发明整体流程图;
[0039]
图2是本发明中聚类分析流程图。
具体实施方式
[0040]
下面详细描述本发明的实施例,实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
[0041]
如图1-2所示,本实施例提出了一种基于聚类算法的公变台区供电质量异常监控方法,包括:
[0042]
s1:获取公变台区的用电数据,并根据用电数据选取相应的特征分析,特征分析包括缺失值填充、数据转换、归一化、特征抽取,获得可用于聚类分析的有效特征;
[0043]
s2:基于特征分析得到的有效特征,进行两阶段的并行化的聚类分析,首先聚类分析出公变台区对应的用电类型,然后,对同一用电类型的公变台区的用户进行聚类,细分出精细的用户群体;
[0044]
s3:针对聚类分析得到的不同用户群体设定相应的阈值,当检测到用户群体的用电信息超出或者低于阈值时,传递相应的信号给用电信息处理系统,用电信息处理系统发出警报。
[0045]
用电信息采集依托于采集终端,包括双向智能电表、转变采集终端、负荷控制终端和分布式能源监控终端等,实现电能数据的采集、数据管理、数据双向传输以及控制命令执行。采集终端从不同类型的用户处以一定频率采集用电数据,包括电压、电流、功率、电能质
量和异常事件等,并通过plc、无线网络等数据通道保存在用电信息采集系统中,可作为用电行为分析的基础数据。
[0046]
用电信息采集系统收集的数据仅包含用户大类的标签信息,对同一公变台区的用户用电数据不具备标签,因此,适合采用聚类的方法进行分析。通过将用电行为数据构建多维特征并进行聚类,可以对公变台区内部的用户进行细分,进一步获取用户的用电特性以及群体用电共性,有助于实现用电用户细分,提升电网公司服务广度和深度,为新型智能用电解决方案奠定基础。
[0047]
原始的用电数据从用电信息采集系统导出后,以文本文件方式存储于本地文件系统,创建表的操作使用sql ddl语句完成,使用tunnel工具进行数据上传。基于graph框架设计实现并行化的聚类算法。算法的输入和输出均使用max-compute表。
[0048]
从数据源中筛选出有剩余价值的数据,对其进行验证建立一个临时数据库,将数据中的相关信息提取出来,以便进行下一阶段的数据转化。依据数据类型的差异,采用数据规范化、聚类等转化技术,将数据类型转化为离散数据和连续性数据,并利用决策树对数据内部的剩余知识进行挖掘。
[0049]
s1中,用电数据的特征包括负荷量x
i1
、负荷率x
i2
、峰电系数x
i3
和谷电系数x
i4
,聚类分析的每一个样本xk均为一个四维向量。
[0050]
另外,还可选取用电信息数据中的三相电压、三相电流、三相功率因素以及有功功率、无功功率、用电量构建多维用电数据特征。
[0051]
s1中,对公变台区的用电数据进行量化表示:
[0052][0053]
式中,xs和x(t)分别为公变台区的实际运行数据和采样结果数据,n为待测配网中的线路数量,t和ts表示数据挖掘时间和周期,对初始挖掘的数据进行缺失补齐、噪声滤波及融合处理,从而得出任意时刻公变台区运行数据的自动收集结果。
[0054]
在对用电数据进行聚类分析之前,为了保证结果的可靠性,需要使用数据清洗等数据预处理手段对不完整数据、错误数据和重复数据进行补充、修正和删除,常见数据清洗的方法包括忽略缺失数据、删除负值、用整体均值填充、用最可能值填充、回归方法填充。
[0055]
通过对原始采集数据的观测发现,存在多种类型的数据缺失情况,需要进行针对性的处理,其中数据缺失处理方法包括:
[0056]
整体数据缺失:部分采集数据仅包含电表资产号、采集时间信息,用于聚类的特征值整体缺失,对这些数据执行删除操作;
[0057]
部分特征值缺失:对此类数据使用众数对缺失值进行填充,通过并行化的众数计算算法,以资源的方式进行保存,以供数据预处理时调用;
[0058]
在完成缺失值处理之后,对特征量进行归一化处理,以消除特征的量纲对聚类算法性能的影响,表达形式如下:
[0059]
[0060]
模糊聚类算法考虑到了真实数据的不确定性,并且与硬划分相比,模糊聚类算法允许一个数据对象属于多个不同的聚类,数据对象与每个聚类中心的接近程度可以使用隶属度来衡量,因此其应用方式更为灵活。通过聚类算法进行用电行为分析,基于目标函数的聚类算法适用于处理大量数据,而且算法过程简单,因此易于在计算机上实现,适合对基于时间序列的复杂数据集进行划分,这一特性与用电数据的特性吻合。
[0061]
s2中,通过求解jm(u,p)的极小值解min{jm(u,p)},从而获得最佳的划分矩阵和聚类中心矩阵,对于模式空间中包含n个成员的待分类对象集合x={x1,x2,

,xn}而言,划分矩阵u可以表示为:
[0062][0063]
其中,μ
ik
=μxi(xk)表示样本xk与子集xi(1≤i≤c)之间的隶属关系,μ
ik
的取值范围为[0,1],即每个样本与子集xi之间的隶属关系由一个0~1之间的实数模糊表示;
[0064]
p={pi,1≤i≤c}表示第i类子集xi的聚类中心矩阵,优化目标表示为:
[0065][0066]
其中,m为平滑因子,m控制模式在类子集之间的分享程度,m越大,得到的聚类结果越模糊,m设为2;d
ik
表示样本k到第i个聚类中心pi之间的距离,使用欧氏距离表示为:
[0067][0068]
通过迭代不断更新隶属度μ
ik
和聚类中心pi,当迭代收敛时,获得的隶属度和聚类中心用于对数据集进行分类,并确定数据对象与分类之间的隶属关系,迭代过程通过在停止域和迭代次数b的控制下,对下式进行求解:
[0069][0070][0071]
在数据预处理阶段,需要对缺失数据利用差值算法进行补齐处理,对于超出阈值的数据进行修正。接下来,对聚类算法进行初始化,包括设置聚类类别c,迭代停止域ε和迭代步数b=0,以及隶属度矩阵u0,可根据用电历史数据进行初始用户分群并计算u0。
[0072]
根据公式(6)和公式(7)在迭代过程中不断更新隶属度和聚类中心,直到满足设定的停止域条件||u
(b)-u
(b+1)
||<ε为止,此时,输出的聚类中心即为用电行为特征,而隶属度矩阵决定了每个样本与用电行为特征的接近程度。
[0073]
聚类是一个无监督的学习过程,对于聚类算法对一个数据集产生某种划分结果
后,通常难以直观评价一个特定聚类划分的优劣,因此需要引入聚类有效性验证算法对聚类结果进行有效评价。评价的内容包括量化聚类的簇内紧凑度和簇间分离度。
[0074]
聚类有效性验证方法包括v
xie
,采用紧凑度和分离度衡量不同划分的聚类质量,通过获取公式(8)的最小值完成对聚类有效性的验证:
[0075][0076]
s1中,归一化处理方法包括:
[0077][0078]
式中,xi为采集的每点数据,x
min
为整体数据的最小值,x
max
为整体数据的最大值,x
′i为归一化后的值。
[0079]
本发明基于聚类算法建立了对台区供电电压质量监控的方法,利用用电信息采集系统的数据分析能力,对可实现高频电压曲线数据采集能力的台区,开展低电压监测,通过分析比对输出需治理的案例,辅助相关部门精准治理,有效减少客户诉求。
[0080]
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。

技术特征:
1.一种基于聚类算法的公变台区供电质量异常监控方法,其特征在于,包括:s1:获取公变台区的用电数据,并根据用电数据选取相应的特征分析,特征分析包括缺失值填充、数据转换、归一化、特征抽取,获得可用于聚类分析的有效特征;s2:基于特征分析得到的有效特征,进行两阶段的并行化的聚类分析,首先聚类分析出公变台区对应的用电类型,然后,对同一用电类型的公变台区的用户进行聚类,细分出精细的用户群体;s3:针对聚类分析得到的不同用户群体设定相应的阈值,当检测到用户群体的用电信息超出或者低于阈值时,传递相应的信号给用电信息处理系统,用电信息处理系统发出警报。2.根据权利要求1的一种基于聚类算法的公变台区供电质量异常监控方法,其特征在于,s1中,用电数据的特征包括负荷量x
i1
、负荷率x
i2
、峰电系数x
i3
和谷电系数x
i4
,聚类分析的每一个样本x
k
均为一个四维向量。3.根据权利要求1的一种基于聚类算法的公变台区供电质量异常监控方法,其特征在于,s1中,对公变台区的用电数据进行量化表示:式中,x
s
和x(t)分别为公变台区的实际运行数据和采样结果数据,n为待测配网中的线路数量,t和t
s
表示数据挖掘时间和周期,对初始挖掘的数据进行缺失补齐、噪声滤波及融合处理,从而得出任意时刻公变台区运行数据的自动收集结果。4.根据权利要求3的一种基于聚类算法的公变台区供电质量异常监控方法,其特征在于,数据缺失处理方法包括:整体数据缺失:部分采集数据仅包含电表资产号、采集时间信息,用于聚类的特征值整体缺失,对这些数据执行删除操作;部分特征值缺失:对此类数据使用众数对缺失值进行填充,通过并行化的众数计算算法,以资源的方式进行保存,以供数据预处理时调用;在完成缺失值处理之后,对特征量进行归一化处理,以消除特征的量纲对聚类算法性能的影响,表达形式如下:5.根据权利要求1的一种基于聚类算法的公变台区供电质量异常监控方法,其特征在于,s2中,通过求解j
m
(u,p)的极小值解min{j
m
(u,p)},从而获得最佳的划分矩阵和聚类中心矩阵,对于模式空间中包含n个成员的待分类对象集合x={x1,x2,

,xn}而言,划分矩阵u可以表示为:
其中,μ
ik
=μx
i
(x
k
)表示样本x
k
与子集x
i
(1≤i≤c)之间的隶属关系,μ
ik
的取值范围为[0,1],即每个样本与子集x
i
之间的隶属关系由一个0~1之间的实数模糊表示;p={p
i
,1≤i≤c}表示第i类子集x
i
的聚类中心矩阵,优化目标表示为:其中,m为平滑因子,m控制模式在类子集之间的分享程度,m越大,得到的聚类结果越模糊,m设为2;d
ik
表示样本k到第i个聚类中心p
i
之间的距离,使用欧氏距离表示为:通过迭代不断更新隶属度μ
ik
和聚类中心p
i
,当迭代收敛时,获得的隶属度和聚类中心用于对数据集进行分类,并确定数据对象与分类之间的隶属关系,迭代过程通过在停止域和迭代次数b的控制下,对下式进行求解:和迭代次数b的控制下,对下式进行求解:根据公式(6)和公式(7)在迭代过程中不断更新隶属度和聚类中心,直到满足设定的停止域条件||u
(b)-u
(b+1)
||<ε为止,此时,输出的聚类中心即为用电行为特征,而隶属度矩阵决定了每个样本与用电行为特征的接近程度。6.根据权利要求5的一种基于聚类算法的公变台区供电质量异常监控方法,其特征在于,聚类有效性验证方法包括v
xie
,采用紧凑度和分离度衡量不同划分的聚类质量,通过获取公式(8)的最小值完成对聚类有效性的验证:7.根据权利要求1的一种基于聚类算法的公变台区供电质量异常监控方法,其特征在于,s1中,归一化处理方法包括:式中,x
i
为采集的每点数据,x
min
为整体数据的最小值,x
max
为整体数据的最大值,x

i
为归一化后的值。

技术总结
本发明提出了一种基于聚类算法的公变台区供电质量异常监控方法,包括S1:获取公变台区的用电数据,并根据用电数据选取相应的特征分析;S2:基于特征分析得到的有效特征,进行两阶段的并行化的聚类分析;S3:针对聚类分析得到的不同用户群体设定相应的阈值,当检测到用户群体的用电信息超出或者低于阈值时,传递相应的信号给用电信息处理系统,用电信息处理系统发出警报。本发明基于聚类算法建立了对台区供电电压质量监控的方法,利用用电信息采集系统的数据分析能力,对可实现高频电压曲线数据采集能力的台区,开展低电压监测,通过分析比对输出需治理的案例,辅助相关部门精准治理,有效减少客户诉求。有效减少客户诉求。有效减少客户诉求。


技术研发人员:朱铮 俞钧 王婧骅 赵婉茹 段玉玮 蒋超 许堉坤 刘畅 俞磊 陈海宾 甄昊涵 沈华 童涛 闫景瑞 张静峰
受保护的技术使用者:朗新科技集团股份有限公司
技术研发日:2023.04.21
技术公布日:2023/7/25
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐