一种快速修复信息系统的故障和风险的告警的系统的制作方法
未命名
10-18
阅读:100
评论:0
一种快速修复信息系统的故障和风险的告警的系统
1.本技术是申请号为“201910874195.5”、申请日为2019年09月17日、发明名称为“一种快速修复信息系统的故障和风险的方法”的发明专利申请的分案申请。
技术领域
2.本发明涉及计算机技术领域,尤其涉及一种快速修复信息系统的故障和风险的方法。
背景技术:
3.目前,我们正处在信息化时代,很多行业的业务都依赖于信息系统。信息系统(information system)是指由计算机硬件、网络和通信设备、计算机软件、信息资源、信息用户和规章制度组成的以处理信息流为目的的人机一体化系统。为了保障信息系统的正常运行,需要运维人员和运维系统。当运维系统检测到信息系统的故障和风险时会生成告警,并以声光、网页、短信、邮件、即时通讯工具和印刷体工单等方式通知运维人员,告警的内容通常包括:故障和风险发生的时间、发生故障和风险的设备地址、故障和风险的原因等。运维人员通常需要依靠工作经验去查询技术手册、互联网网页和咨询他人等方式寻找告警的解决方案,再实施告警修复。这种修复方式存在以下问题,包括严重依赖运维人员经验、查询技术手册和手工输入告警信息效率低、需要选择互联网搜索的网页结果,往往导致修复不正确和不及时,影响企业信息系统的正常运行,严重时给企业带来巨大的经济损失和负面影响。
4.为解决上述问题,本发明提出了一种快速修复信息系统的故障和风险的方法。
技术实现要素:
5.为实现本发明之目的,采用以下技术方案予以实现:
6.一种快速修复信息系统的故障和风险的告警的方法,包括以下步骤:
7.步骤1.获取信息系统的故障和风险的告警信息的文字图像信息;
8.步骤2.识别文字图像信息中的告警信息,生成文字告警信息,并进行展示;
9.步骤3.检索告警描述信息,生成相似告警记录和历史告警记录及其修复方案并发送;
10.步骤4.向用户展示相似告警记录和历史告警记录及其修复方案;
11.步骤5.根据相似告警和/或历史告警的修复方案修复设备告警;
12.步骤6.记录信息系统告警信息和修复方案。
13.所述的方法,其中步骤1中通过如下方式获取包含告警信息的文字图像信息:通过电子设备对告警设备上的告警文字信息进行扫描或拍照来获取图像信息;或者通过电子设备对其上显示的文字信息进行截屏处理来获得图像信息;或者通过电子设备从与其通信连接的其他设备来获取图像信息。
14.所述的方法,其中步骤2中识别图像信息中的告警信息生成告警描述信息并进行
展示包括:电子设备对步骤1中获取的图像信息进行分析,确定其中的文字信息并对文字信息进行识别,生成展示数据,所述展示数据包括文字信息的识别结果。
15.所述的方法,其中:电子设备利用光学字符识别方法对文字信息进行识别,生成初级识别结果;然后通过语义分析提取初级识别结果中的告警发生时间,发生告警的设备地址和告警原因生成文字信息的识别结果,以生成展示数据。
16.所述的方法,其中步骤3中检索告警描述信息,生成相似告警记录和历史告警记录包括:电子设备通过网络将步骤2中生成的告警信息发送给服务器;服务器通过查询知识库获取相似的告警记录和该告警设备历史告警记录及其告警修复方案,然后,服务器通过网络发送相似的告警记录和该告警设备的历史告警记录及其告警修复方案给电子设备。
17.所述的方法,其中:查询相似告警记录包括:首先对告警原因进行分词和过滤无效词,然后查询知识库中错误码字典检查告警原因里是否包含信息系统的错误码,分两种情况处理:1)如果包含信息系统的错误码,就根据错误码检索知识库;2)否则,查询知识库中设备类型字典检查告警原因里是否包含设备类型;针对告警原因中包含信息系统的错误码情况,分两种情况处理:1)如果有检索结果,就根据结果满意度降序反馈给用户,结果满意度是根据搜索结果点击查看次数和其中的修复方案被应用次数拟合计算获得;2)否则,查询知识库中设备类型字典检查告警原因里是否包含设备类型。
18.所述的方法,其中:针对查询知识库中设备类型字典检查告警原因里是否包含设备类型情况,分两种情况处理:1)如果包含设备类型,就根据设备类型遍历知识库,计算告警原因的相似度;2)否则,遍历全量的知识库,计算与告警原因信息的相似度;针对包含设备类型的情况,分两种情况处理:1)如果有检索结果,就根据告警原因相似度降序反馈给用户;2)否则,遍历全量的知识库,计算告警原因的相似度;然后在知识库中查询告警原因和告警修复方案里包含一个或多个分词结果的已经修复的告警,然后根据文本相似度算法计算告警的相似度值,设置一个相似度阈值,将高于该阈值的告警记录及其告警修复方案发送给电子设备;其中,告警原因相似度采用语义余弦相似度算法。
19.所述的方法,其中步骤4中:电子设备响应于检测到用户对当前呈现的相似告警记录的操作指令,判断是否存在对相似告警记录有点击操作;响应于判断结果为是时将呈现相似告警的详情,其中,相似告警的详情包括:告警发生的时间、发生告警的设备地址、告警原因、告警修复人的名称和联系方式、告警修复时间、告警修复方案。
20.所述的方法,其中步骤4中:电子设备响应于检测到用户对当前呈现的历史告警记录的操作指令,判断是否存在对历史告警记录有点击操作;响应于判断结果为是时将呈现历史告警的详情,历史告警的详情包括:告警发生的时间、发生告警的设备地址、告警原因、告警修复人的名称和联系方式、告警修复时间、告警修复方案。
21.所述的方法,其中步骤5中:用户根据相似度高的相似告警修复方案和/或历史告警修复方案实施告警修复,用户在修复告警后录入解决方案和修复时间并发送给服务器。
22.所述的方法,其中步骤6中:服务器在数据库中记录当前设备告警的信息,包括:当前告警的文字图像信息、识别出来的告警发生时间、发生告警的设备地址、告警原因,以及用户修复告警后录入的解决方案和修复时间。
23.所述的方法,其中告警原因相似度采用基于语义的余弦相似度算法进行计算,具体计算过程如下:
24.1)告警原因文本分词,对待查询的告警告警原因和知识库中多个告警原因进行分词;
25.2)构建分词结果集合,将待查询的告警原因和知识库的告警原因分词结果分别取并集;
26.3)统计词频向量,分别遍历待查询的告警原因分词集合和知识库里告警原因分词集合,如果分词在两者的并集里则设置为1,否则,设置为0,得到待查询的告警原因和知识库的告警原因分词结果的分词向量;
27.4)计算向量余弦夹角值,通过计算待查询的待查询的告警原
28.因和知识库的每个告警原因两个向量的夹角的余弦值来评估它们的相似度。13.根据权利要求12之一所述的方法,其特征在于采用基于语义的余弦相似度算法进行计算还包括:
29.5)计算语义相似度:设语义相似度符号为r,定义为:反义、不确定、近义,取值为:r=-1,反义;r=1,不确定;r=2,近义。计算过程为:提取告警原因分词结果里的动词、形容词,然后查询近义词字典和反义词典,如果同时出现在近义词字典里,那么是近义语义;如果同时出现在反义词字典是,那么是反义语义;否则,是不确定语义;
30.计算告警相似度,计算公式为:sim=r
×
cos(θ),其中r定义为语义相似度,其中,cos(θ)定义为向量余弦夹角值。
31.所述的方法,其中:
[0032][0033]
其中,x和y表示向量,||x||和||y||表示向量x和y的模,xi和yi表示向量x和y的分量。
附图说明
[0034]
附图1为本发明的系统框图;
[0035]
附图2为本发明的告警修复流程图;
[0036]
附图3为本发明的告警信息图像;
[0037]
附图4为本发明的告警信息识别结果;
[0038]
附图5为本发明的相似告警详情;
[0039]
附图6为本发明的历史告警信息;
[0040]
附图7为本发明的告警相似度计算过程示意图。
具体实施方式
[0041]
下面结合附图和实施例对本技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
[0042]
需要说明的是,在不冲突的情况下,本技术中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本技术。
[0043]
图1示出了可以应用本技术的快速修复信息系统的故障和风险的告警的方法的系
统架构100。
[0044]
如图1所示,系统架构100可以包括终端101、102、103,网络104和服务器105。网络104用于在终端101、102、103与服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
[0045]
用户可以使用终端101、102、103通过网络与服务器105进行交互,以接收和发送消息。终端101、102、103可以安装各种客户端应用,例如网页浏览器、即时通讯工具、文字图像识别类应用和购物类应用等。此外,终端101、102、103可以对用户通过其获取的文字图像信息中所包含的文字信息进行识别分析,并将分析结果(例如生成的展示数据)反馈给用户。
[0046]
终端101、102、103可以是各种电子设备,例如具有图像获取装置(如摄像头)、电子屏中的一种或多种的电子设备。电子设备可以包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
[0047]
后台服务器可以对终端101、102、103上的应用所发送的请求指令进行分析处理,并且可以将处理结果(如与请求指令相关的响应信息)发送给终端101、102、103。
[0048]
服务器105可以是提供各种服务的服务器,例如对终端101、102、103上的应用提供文字图像识别服务。
[0049]
需要说明的是,本技术实施例所提供的告警信息修复方法一般由终端101、102、103和服务器105执行,相应地,告警信息修复装置一般设置于终端101、102、103和服务器105中。
[0050]
应该理解,图1中的终端、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端、网络和服务器。
[0051]
继续参考图2,示出了根据本技术的告警信息修复方法的一个实施例的流程200。该方法可以包括以下步骤:
[0052]
步骤201获取信息系统的故障和风险的文字图像信息。
[0053]
在本实施例中,告警信息修复方法运行在其上的电子设备上,(例如图1所示的终端101、102、103)可以通过多种方法来获取包含文字信息的图像信息。例如电子设备可以通过安装其上的图像获取装置(如摄像头)对文字信息(如信息系统的监控平台产生的告警信息)进行扫描或拍照来获取图像信息;又例如电子设备可以从与其通信连接的其他设备来获取图像信息,如其他设备通过聊天工具发送的图像信息,又如从远端数据库里获取的图像信息。这样可以方便用户在各种场景(如线上或线下)中获取包含文字信息的图像信息。
[0054]
图文版面上排列的文字,通常称为“印刷字”。各种印刷字的大小与形体各有不同,一般分别用字级(或字号、点数)和字体表示,例如纸媒、广告牌等上的文字信息。非印刷文字通常为除上述印刷文字以外的文字,例如电子屏幕上显示的文字信息或者手写的文字信息。这样可以降低图像信息的局限性,有助于提高适用范围。此外,文字信息的内容可以包含数字、字母、符号、汉字等中的一种或多种字符。
[0055]
在本实施例中,步骤201获取的图像信息300如图3所示,图像包含并且不限于只包含301所示的内容,包括:告警发生的时间、发生告警的设备地址和告警的原因。
[0056]
步骤202,识别图像信息中的告警信息,生成告警描述信息,并用于展示。
[0057]
在本实施例中,首先,电子设备可以对步骤201中获取的图像信息进行分析,确定其中的文字信息。然后,可以利用常用的文字识别方法来对文字信息进行识别,生成展示数
据。其中,展示数据可以包括文字信息的识别结果。
[0058]
在本实施例的一些可选的实现方式中,首先,电子设备可以利用光学字符识别(ocr,optical character recognition)方法对文字信息进行识别,生成初级识别结果;然后,可以通过语义分析(如正则表达式、词汇词典、错误码词典等)提取初级识别结果中的告警发生时间,发生告警的设备地址和告警原因生成文字信息的识别结果,以生成展示数据。
[0059]
步骤203,检索告警描述信息,生成相似告警记录和历史告警记录,并用于展示。
[0060]
在本实施例中,电子设备通过网络将步骤202中生成的告警信息发送给服务器105。然后,服务器105通过查询知识库获取相似的告警记录和该告警设备的历史告警记录。然后,服务器通过网络发送相似的告警记录和该告警设备的历史告警记录及其告警解决方案给电子设备。
[0061]
在本实施例的一些可选的实现方式中,查询相似告警记录可以是,首先对告警原因进行分词和过滤无效词,例如“oracle缓冲区命中率超标”的分词结果[oracle,缓冲区,命中率,超标],然后在数据库中查询告警原因和告警修复方案里包含一个或多个分词结果的已经修复的告警,然后根据告警相似度算法计算告警的相似度值。最后按照相似度降序。为了减少展示的相似告警记录数量,可以设置一个相似度阈值,小于该阈值的告警记录将被舍弃而不会发送给电子设备。在这里,分词,即word segmentation,通常指的是将一个字符序列切分成一个一个单独的词。分词是文本挖掘的基础,对于输入的一段文字,成功的进行分词,可以达到电脑自动识别语句含义的效果。
[0062]
在本实施例中,查询相似告警记录过程如图7所示,首先对告警原因进行分词和过滤无效词,然后查询知识库中错误码字典检查告警原因里是否包含信息系统的错误码,分两种情况处理:1)如果包含信息系统的错误码,就根据错误码检索知识库;2)否则,查询知识库中设备类型字典检查告警原因里是否包含设备类型。针对告警原因中包含信息系统的错误码情况,分两种情况处理:1)如果有检索结果即在知识库中找到包括有相同错误码警原因的知识记录,就根据结果满意度降序反馈给用户,结果满意度是根据搜索结果点击查看次数和其中的修复方案被应用次数拟合计算获得;2)否则,查询知识库中设备类型字典检查告警原因里是否包含设备类型。针对查询知识库中设备类型字典检查告警原因里是否包含设备类型情况,分两种情况处理:1)如果包含设备类型,就根据设备类型遍历知识库,计算告警原因的相似度;2)否则,遍历知识库,计算与告警原因信息的相似度;针对根据设备类型遍历知识库的情况,分两种情况处理:1)如果有检索结果即在知识库中找到包括有相同设备类型的告警原因的知识记录,就根据告警原因相似度降序反馈给用户;2)否则,遍历知识库,计算告警原因的相似度。然后在知识库中查询告警原因和告警修复方案里包含一个或多个分词结果的已经修复的告警,然后根据文本相似度算法计算告警的相似度值,设置一个相似度阈值,将高于该阈值的告警记录及其告警修复方案发送给电子设备。
[0063]
在本实施例中,告警原因相似度采用基于语义的余弦相似度算法,具体算法如下:
[0064]
1)告警原因文本分词,例如告警原因a是待查询的告警,告警原因b和c是知识库的数据,它们的分词结果如下:
[0065]
告警原因a:“oracle缓冲区命中率超标”的分词结果为“oracle”、“缓冲区”、“命中率”、“超标”。
[0066]
告警原因b:“oracle缓冲区命中率超过阈值80%”的分词结果为:“oracle”、“缓冲
区”、“命中率”、“超过”、“阈值”、“80%”。
[0067]
告警原因c:“oracle缓冲区命中率低于阈值50%”的分词结果为:“oracle”、“缓冲区”、“命中率”、“低于”、“阈值”、“50%”。
[0068]
2)构建分词结果集合,将待查询的告警原因和知识库的告警原因分词结果分别取并集,例如告警原因a和b的分词结果集合为:[“oracle”、“缓冲区”、“命中率”、“超标”“超过”、“阈值”、“80%”],告警原因a和c的分词结果集合为:[“oracle”、“缓冲区”、“命中率”、“超标”“低于”、“阈值”、“50%”]
[0069]
3)统计词频向量,分别遍历待查询的告警原因分词集合和知识库里告警原因分词集合,如果分词在两者的并集里则设置为1,否则,设置为0。例如告警原因a和b比较时的分词向量为:
[0070]
告警原因a分词向量:[1,1,1,1,0,0,0]
[0071]
告警原因b分词向量:[1,1,1,0,1,1,1]
[0072]
告警原因a和c比较时的词频向量为:
[0073]
告警原因a分词向量:[1,1,1,1,0,0,0]
[0074]
告警原因c分词向量:[1,1,1,0,1,1,1]
[0075]
4)计算向量余弦夹角值,通过计算两个向量的夹角的余弦值来评估它们的相似度。余弦值越接近1表示两个向量越相似。反之,余弦值越接近0,则表示两个向量越不相似。
[0076]
公式:
[0077]
(其中,x和y表示向量,||x||和||y||表示向量x和y的模,xi和yi表示向量x和y的分量)。
[0078]
例如告警原因a和b的余弦夹角为0.6124,告警原因a和c的余弦夹角为0.6124。
[0079]
5)计算语义相似度。因为向量余弦夹角值只是根据字符串特征判断相似性,缺少语义特征的判断,容易导致语义相反的告警有高的相似度。例如:告警原因a和b的余弦夹角值与告警原因a和c的余弦夹角值相同,但是告警原因a和c是反义的语义关系。因此,需要根据语义特征去判断相似度。语义相似度符号为r,定义为:反义、不确定、近义,取值为:r=-1,反义;r=1,不确定;r=2,近义。计算过程为:提取告警原因分词结果里的动词、形容词,然后查询近义词字典和反义词典,如果同时出现在近义词字典里,那么是近义语义;如果同时出现在反义词字典是,那么是反义语义;否则,是不确定语义。例如:告警原因a和告警b的语义相似度r=2,告警原因a和告警c的语义相似度r=-1。
[0080]
计算告警相似度,计算公式为:sim=r
×
cos(θ),其中r定义为语义相似度。其中,cos(θ)定义为向量余弦夹角值。例如:告警原因a和b的相似度等于sim=2
×
0.6124=1.2248,告警原因a和c的相似度等于sim=-1
×
0.6124=-0.6124。告警原因b比告警原因c更相似于告警原因a。
[0081]
在本实施例的一些可选的实现方式中,查询该告警设备的历史告警记录可以是,从数据库中查询发生告警的设备地址与当前告警设备地址一样,并且已经修复,并且按照时间降序的告警记录。为了减少展示的历史告警记录,可以设置一个时间阈值(例如可设置一个与故障时间相接近的时间点作为时间阈值),小于该阈值的告警记录将被舍弃不会发送给电子设备。。
[0082]
步骤204,将展示数据反馈给用户。
[0083]
在本实施例中,电子设备以屏幕显示的方式向用户反馈202和203生成的展示数据。
[0084]
在本实施例中,给用户的展示数据400如图4所示,包含:401、402和403三个展示区域。其中,401表示当前告警信息区域,包含:发生告警的设备地址和告警的原因。402表示相似告警列表。403表示当前告警设备的历史告警列表。
[0085]
在本实施例中,电子设备响应于检测到用户对当前呈现的相似告警记录的操作指令,判断是否存在对相似告警记录有点击操作;响应于判断结果为是,将呈现相似告警的详情500,如图5所示,其中,相似告警的详情包括:告警发生的时间、发生告警的设备地址、告警原因、告警修复人的名称和联系方式、告警修复时间、告警修复方案,其中,告警原因包括:告警的文字图像信息和告警的文字描述,告警修复人联系方式包括:移动电话、固定电话和电子邮件,告警修复方案包括:文字形式的告警修复方案、图片形式的告警修复方案和代码形式的告警修复方案。
[0086]
在本实施例中,该方法还包括:电子设备响应于检测到用户对当前呈现的历史告警记录的操作指令,判断是否存在对历史告警记录有点击操作;响应于判断结果为是,将呈现历史告警的详情600,如图6所示,其中,历史告警的详情包括:告警发生的时间、发生告警的设备地址、告警原因、告警修复人的名称和联系方式、告警修复时间、告警修复方案,其中,告警原因包括:告警的文字图像信息和告警的文字描述,告警修复人联系方式包括:移动电话、固定电话和电子邮件,告警修复方案包括:文字形式的告警修复方案、图片形式的告警修复方案和代码形式的告警修复方案。
[0087]
步骤205,用户借鉴相似告警和历史告警的修复方案修复设备告警。在本实施例中,用户借鉴相似度高的相似告警修复方案和历史告警修复方案实施告警修复,从而提高告警修复的正确率和降低告警修复的时间。用户在修复告警后录入的解决方案和修复时间并发送给服务器。
[0088]
步骤206,记录告警信息和解决方案。
[0089]
在本实施例中,服务器105将在数据库中记录当前设备告警的信息,包括:当前告警的文字图像信息、识别出来的告警发生时间、发生告警的设备地址、告警原因,以及用户修复告警后录入的解决方案和修复时间,从而扩充告警数据库的记录,为以后的告警修复提供参数数据。
[0090]
通过本发明,运维人员可方便的获知系统发生的是哪种故障、风险,并能够快速的获得相同或相似问题的解决方案,为快速解决系统故障、风险提供了良好的解决方案。
技术特征:
1.一种快速修复信息系统的故障和风险的告警的系统,包括电子设备和服务器,其特征在于:步骤1.电子设备获取信息系统的故障和风险的告警信息的文字图像信息;步骤2.电子设备识别文字图像信息中的告警信息,生成文字告警信息,并发送给服务器;步骤3.服务器检索告警描述信息,生成相似告警记录和历史告警记录及其修复方案并发送给电子设备;步骤4.电子设备展示相似告警记录和历史告警记录及其修复方案;步骤5.根据相似告警和/或历史告警的修复方案修复设备告警后,电子设备将解决方案和修复时间发送给服务器;步骤6.服务器记录信息系统告警信息和修复方案。2.根据权利要求1所述的系统,其特征在于通过如下方式获取包含告警信息的文字图像信息:通过电子设备对告警设备上的告警文字信息进行扫描或拍照来获取图像信息;或者通过电子设备对其上显示的文字信息进行截屏处理来获得图像信息;或者通过电子设备从与其通信连接的其他设备来获取图像信息。3.根据权利要求1所述的系统,其特征在于识别图像信息中的告警信息生成告警描述信息并进行展示包括:电子设备对步骤1中获取的图像信息进行分析,确定其中的文字信息并对文字信息进行识别,生成展示数据,所述展示数据包括文字信息的识别结果。
技术总结
本发明公开了一种快速修复信息系统的故障和风险的告警系统,包括电子设备和服务器,其中:电子设备获取信息系统的故障和风险的告警信息的文字图像信息;电子设备识别文字图像信息中的告警信息,生成文字告警信息,并发送给服务器;服务器检索告警描述信息,生成相似告警记录和历史告警记录及其修复方案并发送给电子设备;电子设备展示相似告警记录和历史告警记录及其修复方案;根据相似告警和/或历史告警的修复方案修复设备告警后,电子设备将解决方案和修复时间发送给服务器;服务器记录信息系统告警信息和修复方案。信息系统告警信息和修复方案。信息系统告警信息和修复方案。
技术研发人员:何泽松
受保护的技术使用者:北京西骏数据科技股份有限公司
技术研发日:2019.09.17
技术公布日:2023/10/11
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
