试验室设备预警系统的制作方法
未命名
07-17
阅读:119
评论:0
1.本发明涉及工业控制领域,特别是涉及一种基于机器学习的试验室设备的大数据专家预警信息系统。
背景技术:
2.在现有的试验室设备中,设备提供方为了设备的正常运行和使用寿命的考虑,会为客户提供当设备运行状态异常时进行预警提醒以延长试验室设备的使用寿命。而提供设备预警的判断基准一般基于以下几个部分:
3.1、工程经验,对设备某些参数的绝对值进行判断,如果高于或者低于某个值,则产生对于这个设备的预警。
4.2、工程经验,对设备某些参数的方差值或者平均值进行判断,如果高于或者低于某个值,则产生对于这个设备的预警。
5.这些预警提示信息通常集成于试验室软件中,以提示框的形式告知使用者,以让使用者提前介入而延长设备的使用寿命。
6.在实际使用中,现有的技术方案存在以下几方面缺陷,而使得现有的方案并不能达到满意的效果:
7.(1)试验室的设备运行状态数据都是孤立的,难以对这些设备的数据进行统一分析和处理,因而设备提供方只能依据工程经验为设备提供一个定性和粗略的预警范围,难以保证预警的准确性和实际效果。
8.(2)现有的判断方式大多是以人工的经验为主,辅以一些方差值、时序判断等数学方式,对设备的预警状态进行判断。其预警策略受限于人工总结经验而难以有进一步的变动与发展。
9.中国专利cn202211012175.5公开了一种基于工业互联网的生产故障预警系统,属于工业互联网领域,用于解决在现有生产中的故障预警方式没有细化到某一区域,且没有结合实际设定对应的故障预警力度的问题,包括区间界定模块、区域分析模块、预警分级模块、设备分析模块和智能预警模块,所述区间界定模块用于将生产车间进行区间界定,所述区域分析模块用于对生产区域的区域情况进行分析,所述设备分析模块用于对生产区域的设备情况进行分析,所述预警分级模块用于对生产区域的生产故障进行预警分级,所述智能预警模块用于对生产区域进行智能预警。该方案无法满足准确预警的需求。
10.中国专利cn202210882602.9公开了一种基于神经网络的电厂设备运行参数监测方法,包括步骤:获取电厂设备无故障运行的历史运行参数数据;进行预处理得到训练样本数据;训练神经网络模型,输出参数的预测值及与历史数据的残差范围;每间隔预设周期获取实时运行参数,通过神经网络模型输出预测值,判断实时数据与预测值的差值超出残差范围的总时长是否超过预设时间阈值,判断是否存在异常并发出预警信息;本发明提供的方法可用以解决现有监控设备对异常数据灵敏度不足的缺陷,对异常数据及时给出预警,在参数明确已偏离正常情况却还未达到系统设定的报警值时也能给出预警信号,有利于尽
早消除数据隐患。该方案虽然采用了神经网络的方案,但没有解决数据孤岛的问题,仍无法满足准确预警的需求。
技术实现要素:
11.本发明要解决的技术问题是提供一种能克服传统工业领域设备预警数据股孤立万体,能避免依赖专家经验的试验室设备预警系统。
12.为解决上述技术问题,本发明提供的试验室设备预警系统,包括:
13.存储模块,其形成基于分布式文件存储的数据库,采用非结构化形式以文档的方式存储数据;
14.数据处理模块,其用于对所述数据库中的数据进行持续地分析处理和机器学习工作,使数据能被预警算法不断利用并学习;
15.预警分析模块,其预警算法。
16.优选的,存储模块采用mongodb,数据处理模块采用spark集群。
17.mongodb是一个基于分布式文件存储的数据库,采用非结构化形式以文档的方式存储数据,对于试验室数据,能够方便地按照设备型号、采集传感器类型等特点进行标签化存储,便于后续地数据处理。
18.spark是一个通用且使用与大规模数据地处理引擎,通过其与mongodb数据库进行对接,便能做到对采集上来地数据进行持续地分析处理和机器学习工作,保证数据能够被后台算法所不断的利用并学习,持续提升预警算法的预测准确度和效率。
19.可选择的,预警算法由快速傅里叶变换和随机森林决策树组成。
20.优选的,数据处理模块采用flink流式处理。
21.优选的,预警算法由基于人工经验的随机森林机器学习算法与bp神经网络算法组成。
22.现有的技术仅仅是依靠以往的工程经验去粗略的预测设备的运行状态来给使用者发出预警告知,其准确性和有效性都难以满足使用者的使用需要,因而往往被使用者忽略处理。本发明通过数据存储、数据处理和预警算法三方面改进能大大提升了设备预警的可靠性和准确性,能让使用者及时介入,提升设备的使用寿命。
23.现有的技术不准确的原因主要是因为存在数据孤岛的问题,不同试验室的设备数据都是孤立存在的,难以统一分析处理,对长效提升预警的准确性和有效行难以保证。采用该系统,能充分发挥大数据的优势,将理论模型和工程经验充分结合,不断迭代。
附图说明
24.本发明附图旨在示出根据本发明的特定示例性实施例中所使用的方法、结构和/或材料的一般特性,对说明书中的描述进行补充。然而,本发明附图是未按比例绘制的示意图,因而可能未能够准确反映任何所给出的实施例的精确结构或性能特点,本发明附图不应当被解释为限定或限制由根据本发明的示例性实施例所涵盖的数值或属性的范围。下面结合附图与具体实施方式对本发明作进一步详细的说明:
25.图1是mongodb+spark的混合架构示意图。
26.图2是试验室设备数据的频域数据分析示意图。
27.图3是排气压力对压缩机组状态的决策树示意图。
具体实施方式
28.以下通过特定的具体实施例说明本发明的实施方式,本领域技术人员可由本说明书所公开的内容充分地了解本发明的其他优点与技术效果。本发明还可以通过不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点加以应用,在没有背离发明总的设计思路下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。本发明下述示例性实施例可以多种不同的形式来实施,并且不应当被解释为只限于这里所阐述的具体实施例。应当理解的是,提供这些实施例是为了使得本发明的公开彻底且完整,并且将这些示例性具体实施例的技术方案充分传达给本领域技术人员。应当理解的是,当元件被称作“连接”或“结合”到另一元件时,该元件可以直接连接或结合到另一元件,或者可以存在中间元件。不同的是,当元件被称作“直接连接”或“直接结合”到另一元件时,不存在中间元件。
29.实施例
30.本发明提供的一种试验室设备预警系统,包括:
31.存储模块,存储模块采用mongodb,其形成基于分布式文件存储的数据库,采用非结构化形式以文档的方式存储数据;
32.数据处理模块,数据处理模块采用spark集群,其用于对所述数据库中的数据进行持续地分析处理和机器学习工作,使数据能被预警算法不断利用并学习;
33.预警分析模块,其预警算法。
34.为了解决不同试验设备之间的数据孤岛问题,本发明采用了mongodb+spark大数据集群来解决该问题。其中mongodb是一个基于分布式文件存储的数据库,采用非结构化形式以文档的方式存储数据,对于试验室数据,能够方便地按照设备型号、采集传感器类型等特点进行标签化存储,便于后续地数据处理。spark是一个通用且使用与大规模数据地处理引擎,通过其与mongodb数据库进行对接,便能做到对采集上来地数据进行持续地分析处理和机器学习工作,保证数据能够被后台算法所不断的利用并学习,持续提升预警算法的预测准确度和效率。
35.参考图1所示,是其mongodb+spark的混合架构图,利用spark本身所提供的接口,可以在上层编写复杂的预警处理算法,上层通过spark提供的driver进行调用,spark会通过master节点将任务分配给具体的worker节点上,worker节点会执行具体的数据分析和处理工作。此处的spark节点数量和mongodb数据库节点数量可以根据实际需求进行扩容和缩减。
36.可选择的,预警算法由快速傅里叶变换和随机森林决策树组成。
37.以快速傅里叶变换和随机森林决策树为核心的预警处理算法,通过将人工经验结合的方式对设备的状态进行预测。
38.针对试验室设备进行预测,需要的是在一个较长周期内对数据的时间序列进行分析和处理,这样才能判断设备的运行状态趋势,而一个设备的运行参数的时间序列中,其数据的波动是十分复杂的。传统方法以时域数据的均方根、平均值或者峰值检测这种简单的手段作为预警算法的依据,难以分析实际工业设备中产生的复杂数据,而采用快速傅里叶
变换的方式能够将时域的数据映射到频域中,便于分析不同因素所造成的设备参数变化的影响趋势。
39.参考图2所示,典型的试验室设备数据的频域数据分析,试验室设备通常为长时间连续运行的往复式设备,虽然其结构组成复杂,但通过对其时域数据进行频域分解,便可将时域上看似杂乱无章的数据分解为有规律可循的频域数据,以用于后续的预警算法处理。参考图2,对于试验室中常见的设备,原始数据为杂乱的波动数据,经过傅里叶变换后得到了a、b、c不同频域下的数据,其中c为低频的长周期波动,往往是外部的环境波动所造成的工作状态的波动,a为高频的短周期波动,往往代表了设备中机械结构的运动所反映的状态波动,b为中频的波动,可以反映整个试验室系统中其它设备对该设备所带来的影响。通过频域的数据,能够找出更加直接反映设备机械运行状态的数据,去除外部干扰因素,使得设备的预警能够更加准确。
40.在对数据进行预警分析上,采用了随机森林的机器学习算法。随机森林是基于决策树的集成算法,其基本单元是决策树,而每一个决策树本质上都是一个自学习的分类器。针对试验室设备,以常见的压缩机组为例,我们需要基于工程经验,判断出哪些参数是用于判断其设备运行状态的重要参数,对于一个典型的压缩机组,基于工程经验,我们认为排气压力、排气温度、吸气过热度、冷凝器进出水温差是影响压缩机运行状态的重要参数。这些参数中,每一个参数都可以组成一个决策树,以排气压力为例,参考图3所示,为排气压力对压缩机组状态的决策树示例,其中的参数a1,a2,b1,b2通过决策树算法中的cart分类树算法进行非定量预测而得到。
41.在基于决策树的基础上,以每一个影响参数为基准作为一支决策树,组成决策树集合,通过施加随机扰动使所有的树去相关,便是随机森林算法。由多个决策树组成的随机森林,在对数据进行分析运算时,其结果由每个决策树的投票数决定。比如,对于测试数据a,随机森林的运算结果如下:
[0042][0043]
其中,h(a)为组合树模型,hi为单个决策树模型,y为输出变量,i为示性函数
[0044]
通过随机森林算法,可以获得多变量对于压缩机组状态的组合预测模型,实现对设备预警状态的精确预测实现。
[0045]
可选择的,改进上述实施例,数据处理模块采用flink流式处理。
[0046]
可选择的,改进上述实施例,预警算法由基于人工经验的随机森林机器学习算法与bp神经网络算法组成。
[0047]
除非另有定义,否则这里所使用的全部术语(包括技术术语和科学术语)都具有与本发明所属领域的普通技术人员通常理解的意思相同的意思。还将理解的是,除非这里明确定义,否则诸如在通用字典中定义的术语这类术语应当被解释为具有与它们在相关领域语境中的意思相一致的意思,而不以理想的或过于正式的含义加以解释。
[0048]
以上通过具体实施方式和实施例对本发明进行了详细的说明,但这些并非构成对本发明的限制。在不脱离本发明原理的情况下,本领域的技术人员还可做出许多变形和改进,这些也应视为本发明的保护范围。
技术特征:
1.一种试验室设备预警系统,其特征在于,包括:存储模块,其形成基于分布式文件存储的数据库,采用非结构化形式以文档的方式存储数据;数据处理模块,其用于对所述数据库中的数据进行持续地分析处理和机器学习工作,使数据能被预警算法不断利用并学习;预警分析模块,其预警算法。2.如权利要求1所述的试验室设备预警系统,其特征在于:存储模块采用mongodb。3.如权利要求1所述的试验室设备预警系统,其特征在于:数据处理模块采用spark集群。4.如权利要求1所述的试验室设备预警系统,其特征在于:数据处理模块采用flink流式处理。5.如权利要求1所述的试验室设备预警系统,其特征在于:预警算法由快速傅里叶变换和随机森林决策树组成。6.如权利要求1所述的试验室设备预警系统,其特征在于:预警算法由基于人工经验的随机森林机器学习算法与bp神经网络算法组成。
技术总结
本发明公开了一种试验室设备预警系统,包括:存储模块形成基于分布式文件存储的数据库,采用非结构化形式以文档的方式存储数据;数据处理模块用于对所述数据库中的数据进行持续地分析处理和机器学习工作,使数据能被预警算法不断利用并学习;预警分析模块,其预警算法。本发明通过数据存储、数据处理和预警算法三方面改进能大大提升了设备预警的可靠性和准确性,能让使用者及时介入,提升设备的使用寿命。用寿命。用寿命。
技术研发人员:张泽宇 周建
受保护的技术使用者:上海佐竹冷热控制技术有限公司
技术研发日:2023.03.30
技术公布日:2023/7/4
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
