一种针对污水处理过程的在线监测方法、装置和存储介质

未命名 07-27 阅读:96 评论:0


1.本发明涉及故障在线监测技术领域,尤其涉及一种针对污水处理过程的在线监测方法、装置和存储介质。


背景技术:

2.随着城镇化速度日益加快,城市污水的排放量显著增加。为了应对日益增加的城市污水,建设自动化程度高的污水处理厂已经成为社会发展的需要之一。在这样的背景下,需要对污水处理厂工作状态进行有效的监测,保证其正常运转,使污水达到规定的排放标准。
3.然而,污水处理过程受到著多物理、生物和化学因素的影响,具有较强的非线性、动态性、强耦合等特点,建模困难。因此,无需先验生化知识的数据驱动模型支持向量机得到了应用。但在污水处理过程中采集到的数据缺乏标签信息,数据具有强烈的不平衡特征,需要使用无监督学习方法一类支持向量机。然而由于低效的特征工程和优化的复杂性,一类支持向量机最大的问题是无法处理大型和高维数据集,导致一类支持向量机在高维度故障检测场景的应用中并不理想。为了保证污水处理过程操作系统的安全性和稳定性,建立一种有效的过程监控方案来及时地监测异常现象是十分有必要的。


技术实现要素:

4.为至少一定程度上解决现有技术中存在的技术问题之一,本发明的目的在于提供一种针对污水处理过程的在线监测方法、装置和存储介质。
5.本发明所采用的技术方案是:
6.一种针对污水处理过程的在线监测方法,
7.包括以下步骤:
8.确定观测变量并设定采样间隔,将采集正常工况时的观测数据作为训练集,对训练集进行预处理,得到预处理后的训练集;
9.根据训练集特征确定自编码器网络结构,并设置损失函数;
10.使用预处理后的训练集训练自编码器,得到网络的最优参数,再利用自编码器中的编码器提取训练集特征,得到训练集的稀疏特征集合;
11.根据稀疏特征集合特点,确定一类支持向量机的核函数类型及相应超参数,使用稀疏特征集合训练一类支持向量机,并得到稀疏特征对应样本的预测分数;
12.使用箱线图分析预测分数集合的数据分布特征,以确定故障监测的控制限;
13.采集实时观测数据作为测试样本,对测试集预处理后,使用自编码器提取测试样本的稀疏特征,并使用一类支持向量机对稀疏特征进行分数预测;
14.判断污水处理过程是否发生故障:将该时刻的观测样本的预测分数值与由箱线图得到的控制限做差;若预测分数值未超出控制限,则判定工况正常,进行下一次采样;若预测分数值超过控制限,则判定该观测时刻发生故障,发出报警。超出控制限的值越大,则说
明故障越严重。
15.进一步地,所述对训练集进行预处理,包括:
16.采用标准差标准化法,将从污水处理厂观测到的数据矩阵按照下式进行数据预处理:
[0017][0018]
其中,x∈rm×n是原始的观测数据矩阵,rm×n表示m行n列的实矩阵,x的每一行代表一个观测样本,每一列代表一个观测变量,μ
x
和σ
x
表示x中各观测变量的样本均值和样本标准差,x'表示预处理后的训练集。
[0019]
进一步地,所述对训练集进行预处理,包括:
[0020]
采用极差标准化法,将从污水处理厂观测到的数据矩阵按照下式进行数据预处理:
[0021][0022]
其中,x∈rm×n是原始的观测数据矩阵,rm×n表示m行n列的实矩阵,x的每一行代表一个观测样本,每一列代表一个观测变量,x'表示预处理后的训练集,x(i,j)、x'(i,j)分别表示x和x'的第i行第j列位置上的元素,x(j)
max
、x(j)
min
分别表示x的第j列中的最大值和最小值。
[0023]
进一步地,所述根据训练集特征确定自编码器网络结构,并设置损失函数,包括:
[0024]
根据预处理后的训练集x'确定栈式自编码器隐藏层层数,以及输入层、隐藏层和输出层神经元个数;对于低维度及小样本类型的数据集,采用较少的隐藏层层数,既能减少计算量也能很好地重构输入。特别地,对于高维度及大样本类型的数据集,可以适当堆叠隐藏层层数,以扩展自编码器模型对于数据的重构能力。
[0025]
根据预处理后的训练集x'选择损失函数以及收敛模型,其中训练过程中,自编码器损失函数选择为l1正则损失函数,表示为:
[0026][0027]
其中x'
i,j
代表预处理后的训练集中某个观测样本的某个变量,x
*i,j
代表自编码器根据输入所重构的输出,m为训练集观测样本的总个数,n为观测样本的变量总个数。
[0028]
进一步地,自编码器的结构取决于预处理后的训练集x'。对于预处理后的数据集x',通过编码器(基于wh的线性变换),输出隐藏特征特s,再通过解码器(基于w
x
的线性变换),重构出x
*
,自编码器网络通过如下表示:
[0029]
s=f(whx'+bn)
[0030]
x
*
=g(w
x
s+bs)
[0031]
本发明中的自编码器特指栈式自编码器,由多个自编码器堆叠而成,是一个由多层自编码器组成的神经网络,其前一层自编码器的输出作为其后一层自编码器的输入。对于低维度及小样本类型的数据集,采用较少的隐藏层层数,既能减少计算量也能很好地重构输入。特别地,对于高维度及大样本类型的数据集,可以适当堆叠隐藏层层数,以扩展自
编码器模型对于数据的重构能力。
[0032]
进一步地,所述一类支持向量机的表达式为:
[0033]
f(x)=w
t
φ(x)-ρ
[0034]
所述一类支持向量机的目标方程为:
[0035][0036]wt
φ(xi)≥ρ-ξi,ξi》0
[0037]
其中,φ是将输入向量投影到高维特征空间的特征投影函数;w是垂直于超片面的决策超平面一般向量,ρ是截距项,ξi表示松弛变量,v是为异常值分数设定的上限超参数,n表示向量维度。
[0038]
进一步地,对目标方程使用拉格朗日变换,并对其中的点乘运算使用核函数技巧,决策函数变为下式:
[0039][0040]
其中,αi是拉格朗日乘子,k(xi,x)=φ(xi)
t
φ(x)是核函数,核函数可以优先选择为径向基核函数,也可选择为线性核函数:
[0041][0042]
k(x,z)=x
·z[0043]
其中,γ表示一个自由参数,x和z分别表示两个向量。
[0044]
进一步地,所述使用箱线图分析预测分数集合的数据分布特征,以确定故障监测的控制限,包括:
[0045]
假设预测分数集合的上下四分位数分别为q3和q
1`
,则控制限表示为:
[0046]
l=2.5q
3-1.5q1。
[0047][0048]
进一步地,所述判断污水处理过程是否发生故障,包括:
[0049]
在线监测阶段,将一类支持向量机的预测分数值p与箱线图确定的控制限l作差值:
[0050]
e=p-l
[0051]
根据箱线图的理论,当p小于1.5(q
3-q1),判定发生轻微故障,当p大于3(q
3-q1),判定发生严重故障。
[0052]
进一步地,将自编码器中编码过程输出的稀疏特征s设置为一类支持向量机的输入。离线训练阶段,需要使用预处理后的训练集训练模型,得到自编码器的最优参数,再使用模型提取训练集的紧密特征,送入一类支持向量机。在线监测阶段,自编码器仅对实时采集的单个数据样本提取紧密特征,提取过程发生在自编码器的编码过程,并不涉及解码过程。
[0053]
进一步地,实时采集的单个观测数据样本预处理方式与训练集预处理方式保持一致;当训练集使用标准差标准化法时,单个数据样本使用训练集的均值和方差进行标准化;当训练集使用极差标准化法时,如果单个数据样本某变量值大于或小于极值,则应该将变
量值相应置1或置0。
[0054]
本发明所采用的另一技术方案是:
[0055]
一种针对污水处理过程的在线监测装置,包括:
[0056]
至少一个处理器;
[0057]
至少一个存储器,用于存储至少一个程序;
[0058]
当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现上所述方法。
[0059]
本发明所采用的另一技术方案是:
[0060]
一种计算机可读存储介质,其中存储有处理器可执行的程序,所述处理器可执行的程序在由处理器执行时用于执行如上所述方法。
[0061]
本发明的有益效果是:本发明充分考虑到污水处理过程观测变量繁多的特点,通过特征提取技术自编码器获取观测变量稀疏特征,解决了基于一类支持向量机的在线监测方法无法处理高维度数据的问题。同时,一类支持向量机的应用很好地解决了污水处理过程中数据样本不平衡的问题。
附图说明
[0062]
为了更清楚地说明本发明实施例或者现有技术中的技术方案,下面对本发明实施例或者现有技术中的相关技术方案附图作以下介绍,应当理解的是,下面介绍中的附图仅仅为了方便清晰表述本发明的技术方案中的部分实施例,对于本领域的技术人员而言,在无需付出创造性劳动的前提下,还可以根据这些附图获取到其他附图。
[0063]
图1是本发明实施例中一种针对污水处理过程的自编码器一类支持向量机在线监测方法的流程图;
[0064]
图2是本发明实施例一的随机25个观测变量故障检测图;
[0065]
图3是本发明实施例二的随机25个观测变量故障检测图;
[0066]
图4是本发明实施例三的随机25个观测变量故障检测图;
[0067]
图5是本发明实施例四的全部38个观测变量故障检测图。
具体实施方式
[0068]
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。对于以下实施例中的步骤编号,其仅为了便于阐述说明而设置,对步骤之间的顺序不做任何限定,实施例中的各步骤的执行顺序均可根据本领域技术人员的理解来进行适应性调整。
[0069]
在本发明的描述中,需要理解的是,涉及到方位描述,例如上、下、前、后、左、右等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
[0070]
在本发明的描述中,若干的含义是一个或者多个,多个的含义是两个以上,大于、小于、超过等理解为不包括本数,以上、以下、以内等理解为包括本数。如果有描述到第一、
第二只是用于区分技术特征为目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量或者隐含指明所指示的技术特征的先后关系。
[0071]
本发明的描述中,除非另有明确的限定,设置、安装、连接等词语应做广义理解,所属技术领域技术人员可以结合技术方案的具体内容合理确定上述词语在本发明中的具体含义。
[0072]
实施例一
[0073]
如图1所示,本实施例提供一种针对污水处理过程的自编码器一类支持向量机在线监测方法。该方法首先利用污水厂正常工况时的数据即离线数据训练自编码器一类支持向量机监测模型(所述监测模型是自编码器连接一类支持向量机的故障在线监测模型),然后对采集到的实时现场数据进行预处理,再使用自编码器提取出每个实时观测样本的紧密特征,送入一类支持向量机得到预测分数值,如果预测分数值超出控制限则可判定发生了故障。具体包括以下步骤:
[0074]
a1、确定观测变量并设定相同的采样间隔,将从污水处理厂采集到的正常运行工况时的数据矩阵作为训练集,并按照下式进行数据预处理:
[0075][0076]
其中,x∈rm×n是原始的观测数据矩阵,rm×n表示m行n列的实矩阵,x的每一行代表一个观测样本,每一列代表一个观测变量,观测变量包括输入总流量、ph值等。μ
x
和σ
x
表示x中各观测变量的样本均值和样本标准差,x'表示预处理后的训练集。
[0077]
a2、构建自编码器网络结构,并将自编码器训练时损失函数为:
[0078][0079]
a3、使用预处理后的训练集合x'训练自编码器,并使用编码器将预处理后的训练集x'被分解为一个低维特征s:
[0080]
s=f(whx'+bn)
[0081]
a4、设置一类支持向量机的超参数v,核函数选择为:
[0082][0083]
使用自编码器中编码得到的紧密特征s训练一类支持向量机,得到最优参数。
[0084]
a5、使用箱线图分析预测分数数据分布特征,由此确定故障监测的控制限:
[0085]
l=2.5q
3-1.5q1[0086]
a6、采集实时观测数据作为测试样本,对测试集预处理后,使用自编码器提取测试样本的稀疏特征,并使用一类支持向量机对稀疏特征进行分数预测;
[0087]
a7、判断污水处理过程是否发生故障,将该时刻的观测样本的预测分数值p与由箱线图得到的控制限l作差:
[0088]
e=p-l
[0089]
如果预测分数值未超出控制限则说明工况正常,继续采集新样本;相反,如预测分数值超过控制限则判定该观测时刻发生故障,发出报警。超出控制限的值越大,则说明故障越严重。
[0090]
在本实施例中,以某污水厂提供的污水处理过程数据对其进行验证。数据集由加州大学欧文分校(uci)机器学习库提供,它包含527个以天为采样间隔的样本。其中,84个进水样本和72个出水样本中部分传感器数据缺失。观测变量一共38个,各观测变量的含义如表1所示。在527个样本中,一共有14个故障样本,9种故障类型,其余样本均可视为正常样本。
[0091]
表1实验数据观测变量
[0092][0093][0094]
如图1所示,上述的污水厂故障监测方法的大致过程为:随机选取25个观测变量,并将观测数据分为两部分,前263天的样本作为训练集,用来构建模型,后264天的样本作为测试集,用来验证所提方法的有效性。具体步骤如下:
[0095]
b1、将训练数据按照标准差标准化法进行预处理;
[0096]
b2、构建自编码器网络结构,输入层神经元个数为25,五层隐藏层神经元分别为32、16、8、16、32,输出层神经元个数为25,其中编码器部分输出特征维度设置8维。设定1000个训练周期,并将自编码器训练时损失函数为:
[0097][0098]
b3、使用预处理后的训练集合x'训练自编码器,并使用编码器将预处理后的训练集x'被分解为8维特征s:
[0099]
s=f(whx'+bn)
[0100]
b4、设置一类支持向量机的超参数v=0.1,核函数选择为:
[0101][0102]
使用自编码器中编码得到的紧密特征s训练一类支持向量机,得到最优参数υ的取值。
[0103]
b5、使用箱线图分析预测分数数据分布特征,由此确定故障监测的控制限;
[0104]
l=2.5q
3-1.5q1=1.0007115
[0105]
b6、采集实时观测数据作为测试样本,对测试集预处理后,使用自编码器提取测试样本的稀疏特征,并使用一类支持向量机对稀疏特征进行分数预测;
[0106]
b7、判断污水处理过程是否发生故障,将该时刻的观测样本的预测分数值p与由箱线图得到的控制限l作差:
[0107]
e=p-l
[0108]
如果预测分数值未超出控制限则说明工况正常,继续采集新样本;相反,如预测分数值超过控制限则判定该观测时刻发生故障,发出报警。超出控制限的值越大,则说明故障越严重。
[0109]
自编码器提取特征的优势在于很好地利用了正常数据点隐藏信息,它被训练为最小化重建误差。因此在测试阶段,它可以对正常数据点进行重构,错误率应该非常小。但是自编码器无法识别故障,无法正常重建。在这种情况下,重建误差高于正常值,因此提取到的稀疏特征可以用于一类支持向量机进行故障监测。
[0110]
从图2的实验结果来看,该方案对污水处理厂中各种故障都具有很好的监测效果。在线监测阶段,污水处理过程陆续出现二沉池沉降、固体过载、暴雨天气引起的故障,训练好的模型都能一一检测,故障召回率达到96%。同时,由于对正常数据进行了很好了特征表示,该方案的误报率仅为4.4%,故障诊断准确率为95.45%。计算时间是评估分类器性能的一个重要因素,减少计算时间也非常重要。由于使用自编码器提取稀疏特征,能显著减少一类支持向量机的计算量,极大地提高了在线监测的速度。对比不同类型的故障,暴雨天气类型故障与控制限的差值明显小于其他两种类型的故障,符合暴雨类型故障严重程度小于其他类型故障的经验,为工作人员判断故障严重程度提供了依据。
[0111]
实施例二
[0112]
采用与实施例一中不同的实验数据,另外随机选取不完全相同的25个变量,建模过程中设置的参数与实施例一中相同,所不同的是,计算出来的控制限变为0.61。
[0113]
从图3的实验结果来看,该方案对污水处理厂中各种故障都具有很好的监测效果。在线监测阶段,污水处理过程陆续出现二沉池沉降、固体过载、暴雨天气引起的故障,训练好的模型都能一一检测,故障召回率达到96%。同时,由于对正常数据进行了很好了特征表示,该方案的误报率仅为5.2%,故障诊断准确率为94.7%。对比不同类型的故障,暴雨天气类型故障与控制限的差值明显小于其他两种类型的故障,符合暴雨类型故障严重程度小于其他类型故障的经验,为工作人员判断故障严重程度提供了依据。
[0114]
实施例三
[0115]
采用与实施例一中不同的实验数据,另外随机选取不完全相同的25个变量,建模过程中设置的参数与实施例一中相同,所不同的是,计算出来的控制限变为0.61。
[0116]
从图4的实验结果来看,该方案对污水处理厂中各种故障都具有很好的监测效果。在线监测阶段,污水处理过程陆续出现二沉池沉降、固体过载、暴雨天气引起的故障,训练好的模型都能一一检测,故障召回率达到100%。同时,由于对正常数据进行了很好了特征表示,上述方案的误报率为13.2%,故障诊断准确率为87.5%。对比不同类型的故障,暴雨天气类型故障与控制限的差值明显小于其他两种类型的故障,符合暴雨类型故障严重程度
小于其他类型故障的经验,为工作人员判断故障严重程度提供了依据。
[0117]
实施例四
[0118]
采用不同于上述三个实施例不同的实验数据,将38个观测变量全部作为实验数据,输入输出神经元变为38个,建模过程中设置的参数与实施例一中相同,所不同的是,计算出来的控制限变为1.20。
[0119]
从图5的实验结果来看,上述方案对污水处理厂中各种故障都具有很好的监测效果。在线监测阶段,污水处理过程陆续出现二沉池沉降、固体过载、暴雨天气引起的故障,训练好的模型都能一一检测,故障召回率达到100%。同时,由于对正常数据进行了很好了特征表示,上述方案的误报率较低2.4%,故障诊断准确率为97.73%。对比不同类型的故障,暴雨天气类型故障与控制限的差值明显小于其他两种类型的故障,符合暴雨类型故障严重程度小于其他类型故障的经验,为工作人员判断故障严重程度提供了依据。
[0120]
通过以上实施例可以看出本发明开发的基于自编码器一类支持向量机的在线故障监测模型相比于传统的在线故障监测模型更为令人满意的性能。表2列出了本发明开发的自编码器一类支持向量机对不同数目、类型输入变量的在线监测效果,从表2的统计结果可以发现,使用全部观测变量作为训练数据具有一定的优势,能够使模型得到更低的误报率、更高的监测准确率。然而单独使用一类支持向量机并不能很好地对高维度训练数据进行建模,这就需要使用到自编码器这一种特征提取技术。比较表2中得到的结果,自编码器一类支持向量机在线监测模型具有更好的性能。
[0121]
表2主成分分析与特征提取主成分分析的故障检测结果对比
[0122][0123]
综上所述,本发明与现有的技术相比,至少具有如下优点与有益效果:
[0124]
1、本发明通过特征提取方法有效地降低故障监测过程计算量的同时,找出并细化了数据样本中蕴含的故障信息。
[0125]
2、本发明通过利用正常工作的数据样本学习一类支持向量机的分类超平面,有效解决了污水处理过程中故障数据较少、标签数据不平衡的问题,实现了污水处理过程的故障监测。
[0126]
3、本发明在检测污水处理厂污水处理过程发生故障时能够明显降低误报率和漏报率,因此能够减轻污水处理厂工作人员的工作负担,同时又能及时发现故障,为污水厂设备的维护预留足够的时间,节省维护费用。
[0127]
4、本发明所采用的一类支持向量机的预测分数值会随着不同类型的故障、故障严重程度而变化,因此能够通过预测分数值与控制限的差值反映出故障的严重程度,从而为现场的工作人员做出维护策略提供了参考信息。
[0128]
本实施例提供一种针对污水处理过程的在线监测装置,包括:
[0129]
至少一个处理器;
[0130]
至少一个存储器,用于存储至少一个程序;
[0131]
当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现图1所示方法。
[0132]
本实施例的一种针对污水处理过程的在线监测装置,可执行本发明方法实施例所提供的一种针对污水处理过程的在线监测方法,可执行方法实施例的任意组合实施步骤,具备该方法相应的功能和有益效果。
[0133]
本技术实施例还公开了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存介质中。计算机设备的处理器可以从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行图1所示的方法。
[0134]
本实施例还提供了一种存储介质,存储有可执行本发明方法实施例所提供的一种针对污水处理过程的在线监测方法的指令或程序,当运行该指令或程序时,可执行方法实施例的任意组合实施步骤,具备该方法相应的功能和有益效果。
[0135]
在一些可选择的实施例中,在方框图中提到的功能/操作可以不按照操作示图提到的顺序发生。例如,取决于所涉及的功能/操作,连续示出的两个方框实际上可以被大体上同时地执行或所述方框有时能以相反顺序被执行。此外,在本发明的流程图中所呈现和描述的实施例以示例的方式被提供,目的在于提供对技术更全面的理解。所公开的方法不限于本文所呈现的操作和逻辑流程。可选择的实施例是可预期的,其中各种操作的顺序被改变以及其中被描述为较大操作的一部分的子操作被独立地执行。
[0136]
此外,虽然在功能性模块的背景下描述了本发明,但应当理解的是,除非另有相反说明,所述的功能和/或特征中的一个或多个可以被集成在单个物理装置和/或软件模块中,或者一个或多个功能和/或特征可以在单独的物理装置或软件模块中被实现。还可以理解的是,有关每个模块的实际实现的详细讨论对于理解本发明是不必要的。更确切地说,考虑到在本文中公开的装置中各种功能模块的属性、功能和内部关系的情况下,在工程师的常规技术内将会了解该模块的实际实现。因此,本领域技术人员运用普通技术就能够在无需过度试验的情况下实现在权利要求书中所阐明的本发明。还可以理解的是,所公开的特定概念仅仅是说明性的,并不意在限制本发明的范围,本发明的范围由所附权利要求书及其等同方案的全部范围来决定。
[0137]
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0138]
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设
备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。
[0139]
计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(ram),只读存储器(rom),可擦除可编辑只读存储器(eprom或闪速存储器),光纤装置,以及便携式光盘只读存储器(cdrom)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
[0140]
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(pga),现场可编程门阵列(fpga)等。
[0141]
在本说明书的上述描述中,参考术语“一个实施方式/实施例”、“另一实施方式/实施例”或“某些实施方式/实施例”等的描述意指结合实施方式或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施方式或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施方式或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施方式或示例中以合适的方式结合。
[0142]
尽管已经示出和描述了本发明的实施方式,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施方式进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。
[0143]
以上是对本发明的较佳实施进行了具体说明,但本发明并不限于上述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做作出种种的等同变形或替换,这些等同的变形或替换均包含在本技术权利要求所限定的范围内。

技术特征:
1.一种针对污水处理过程的在线监测方法,其特征在于,包括以下步骤:确定观测变量并设定采样间隔,将采集正常工况时的观测数据作为训练集,对训练集进行预处理,得到预处理后的训练集;根据训练集特征确定自编码器网络结构,并设置损失函数;使用预处理后的训练集训练自编码器,得到网络的最优参数,再利用自编码器中的编码器提取训练集特征,得到训练集的稀疏特征集合;根据稀疏特征集合特点,确定一类支持向量机的核函数类型及相应超参数,使用稀疏特征集合训练一类支持向量机,并得到稀疏特征对应样本的预测分数;使用箱线图分析预测分数集合的数据分布特征,以确定故障监测的控制限;判断污水处理过程是否发生故障:将该时刻的观测样本的预测分数值与由箱线图得到的控制限做差;若预测分数值未超出控制限,则判定工况正常,进行下一次采样;若预测分数值超过控制限,则判定该观测时刻发生故障,发出报警。2.根据权利要求1所述的一种针对污水处理过程的在线监测方法,其特征在于,所述对训练集进行预处理,包括:采用标准差标准化法,将从污水处理厂观测到的数据矩阵按照下式进行数据预处理:其中,x∈r
m
×
n
是原始的观测数据矩阵,r
m
×
n
表示m行n列的实矩阵,x的每一行代表一个观测样本,每一列代表一个观测变量,μ
x
和σ
x
表示x中各观测变量的样本均值和样本标准差,x'表示预处理后的训练集。3.根据权利要求1所述的一种针对污水处理过程的在线监测方法,其特征在于,所述对训练集进行预处理,包括:采用极差标准化法,将从污水处理厂观测到的数据矩阵按照下式进行数据预处理:其中,x∈r
m
×
n
是原始的观测数据矩阵,r
m
×
n
表示m行n列的实矩阵,x的每一行代表一个观测样本,每一列代表一个观测变量,x'表示预处理后的训练集,x(i,j)、x'(i,j)分别表示x和x'的第i行第j列位置上的元素,x(j)
max
、x(j)
min
分别表示x的第j列中的最大值和最小值。4.根据权利要求1所述的一种针对污水处理过程的在线监测方法,其特征在于,所述根据训练集特征确定自编码器网络结构,并设置损失函数,包括:根据预处理后的训练集x'确定栈式自编码器隐藏层层数,以及输入层、隐藏层和输出层神经元个数;根据预处理后的训练集x'选择损失函数以及收敛模型,其中训练过程中,自编码器损失函数选择为l1正则损失函数,表示为:其中x'
i,j
代表预处理后的训练集中某个观测样本的某个变量,x
*i,j
代表自编码器根据输入所重构的输出,m为训练集观测样本的总个数,n为观测样本的变量总个数。
5.根据权利要求1所述的一种针对污水处理过程的在线监测方法,其特征在于,所述一类支持向量机的表达式为:f(x)=w
t
φ(x)-ρ所述一类支持向量机的目标方程为:w
t
φ(x
i
)≥ρ-ξ
i

i
>0其中,φ是将输入向量投影到高维特征空间的特征投影函数;
w
是垂直于超片面的决策超平面一般向量,ρ是截距项,ξ
i
表示松弛变量,
v
是为异常值分数设定的上限超参数,
n
表示向量维度。6.根据权利要求1所述的一种针对污水处理过程的在线监测方法,其特征在于,所述控制限表示为:l=2.5q
3-1.5q1其中,q3和q
1`
分别为预测分数集合的上四分位数和下四分位数。7.根据权利要求6所述的一种针对污水处理过程的在线监测方法,其特征在于,所述判断污水处理过程是否发生故障,包括:在线监测阶段,将一类支持向量机的预测分数值p与箱线图确定的控制限l作差值:e=p-l根据箱线图的理论,当p小于1.5(q
3-q1),判定发生轻微故障,当p大于3(q
3-q1),判定发生严重故障。8.根据权利要求7所述的一种针对污水处理过程的在线监测方法,其特征在于,实时采集的单个观测数据样本预处理方式与训练集预处理方式保持一致;当训练集使用标准差标准化法时,单个数据样本使用训练集的均值和方差进行标准化;当训练集使用极差标准化法时,如果单个数据样本某变量值大于或小于极值,则应该将变量值相应置1或置0。9.一种针对污水处理过程的在线监测装置,其特征在于,包括:至少一个处理器;至少一个存储器,用于存储至少一个程序;当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现权利要求1-8任一项所述方法。10.一种计算机可读存储介质,其中存储有处理器可执行的程序,其特征在于,所述处理器可执行的程序在由处理器执行时用于执行如权利要求1-8任一项所述方法。

技术总结
本发明公开了一种针对污水处理过程的在线监测方法、装置和存储介质,利用离线数据建立自编码器一类支持向量机模型,然后对采集到的现场数据进行预处理,再计算出每个实时观测样本的预测分数,与预设定的阈值进行比较。如果预测分数值未超出控制限则说明工况正常;相反,如果预测分数值超过控制限则可判定该观测时刻污水处理过程发生了故障。本发明充分考虑到污水处理过程观测变量繁多的特点,通过特征提取技术自编码器获取观测变量稀疏特征,解决了基于一类支持向量机的在线监测方法无法处理高维度数据的问题。同时,一类支持向量机的应用很好地解决了污水处理过程中数据样本不平衡的问题。本发明可广泛应用于故障在线监测技术领域。技术领域。技术领域。


技术研发人员:刘乙奇 李志 于广平 刘坚
受保护的技术使用者:华南理工大学
技术研发日:2023.02.28
技术公布日:2023/7/25
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐