信息系统的监控方法、系统、存储介质及电子设备与流程

未命名 10-19 阅读:93 评论:0


1.本发明涉及云计算技术领域,具体而言,涉及一种信息系统的监控方法、系统、存储介质及电子设备。


背景技术:

2.自动化监控报警系统是信息系统健康状态监控的眼睛,是保障生产作业、提高系统可用性必不可少的手段。现有重要的系统大多不同层度部署了监控系统,各大平台厂商以及软件开发商也都推出了各自的商业或开源监控产品。现有监控系统提供的监控模态主要为首次创建和定时调整。首次创建:监控系统首次建立或者被监控主体新增时创建各种监控指标;定时调整:在信息负载变化时运维人员依赖监控系统对指标进行修改以适应新的监控需要。
3.相关技术中的监控系统的监控模态存在以下问题:
4.1.配置复杂。监控系统大多包含采集项配置、报警规则配置、看板配置、信息推送配置以及存储配置等,需要的配置内容较多。以核心配置采集以及报警规则配置举例,通常可配置项在上百个,而且随着采集对象的增多、分级报警的细化其配置项更成倍数增长,增加运维人员的工作量;
5.2.特定场景下有所不足。在外界负载以及系统计算单元双向波动较大的情况下,因初始配置不适应新的负载模式而调整配置过程相对较长,并且运维人员通常不会及时更新指标,监控系统呈现的监控效果给与运维值守人员的帮助有所下降(例如:因负载模式变化较大,运维人员可能放弃从监控系统看板监控,改为临时补充大量人力通过命令和半自动脚本进行重保期间的手动监控);
6.3.监控模态调整不灵活。由于信息系统通常包括不同负载模式下,而现有的监控系统的监控模态单一,难以适应信息系统的多负载模式情况。
7.也即是相关技术中的监控系统在面向大规模、分布式、高并发、负载波动不规律的场景时经常会面临两个问题,一是配置复杂,需要运维人员投入较多精力去初始配置和定期进行监控优化;二是当负载波动等因素导致当前配置项不适用时需要花费较多精力去调整适配。
8.针对上述的问题,目前尚未提出有效的解决方案。


技术实现要素:

9.本发明实施例提供了一种信息系统的监控方法、系统、存储介质及电子设备,以至少解决监控系统难以依据信息系统的监控需求进行调整,且识别信息系统的健康状态的识别效率低的技术问题。
10.根据本发明实施例的一个方面,提供了一种信息系统的监控方法,包括:采集第一监测数据,其中,所述第一监测数据至少包括:信息系统的负载数据、所述信息系统的计算资源的数据,所述第一监测数据是指在当前监控模态下对所述信息系统进行监控,得到的
数据;基于目标阈值集合和所述第一监测数据,判断是否切换监控系统的监控模态,得到目标判断结果;在所述目标判断结果指示切换所述监控系统的监控模态的情况下,基于所述第一监测数据,确定目标监控模态;将所述监控系统的当前监控模态切换为所述目标监控模态,并在所述目标监控模态下对所述信息系统进行监控。
11.进一步地,对所述信息系统进行监控还包括:采集n个第二监测数据,其中,所述n个第二监测数据至少包括:与所述信息系统的基本组成部分关联的数据,n为大于1的整数;对所述n个第二监测数据进行分类聚合,得到m个数据集合,其中,m为大于1的整数;基于所述m个数据集合、预设权重集合以及所述监控系统的监控模态,计算所述信息系统的综合健康度,其中,所述监控系统的监控模态为所述当前监控模态或者所述目标监控模态。
12.进一步地,基于所述m个数据集合、预设权重集合以及所述监控系统的监控模态,计算所述信息系统的综合健康度,包括:基于所述预设权重集合和所述m个数据集合以及所述监控系统的监控模态,计算k个监控节点的节点健康度,其中,所述k个监控节点至少包括:数据库节点,所述数据库节点至少包括:多个数据库,k为大于1的正整数;基于所述k个监控节点的节点健康度,计算所述综合健康度,并在所述综合健康度超过目标预设阈值的情况下,发出报警提示,其中,所述目标预设阈值由所述监控系统的监控模态确定。
13.进一步地,基于所述预设权重集合和所述m个数据集合以及所述监控系统的监控模态,计算k个监控节点的节点健康度,包括:基于所述预设权重集合,对每个数据集合中的多个第二监测数据进行加权计算,得到每个监控节点的多个监控模块的模块健康度;基于所述监控系统的监控模态,确定每个与所述监控模块的所述模块健康度对应的权重值;基于每个所述监控模块的所述模块健康度以及对应的权重值确定每个监控节点的节点健康度,得到所述k个监控节点的节点健康度。
14.进一步地,所述信息系统的负载数据包括下述至少之一:网络连接数据、中央处理器的利用率、内存使用率。
15.进一步地,在所述目标判断结果指示切换所述监控系统的监控模态的情况下,基于所述第一监测数据,确定目标监控模态,包括:判断所述监控系统的多个监控模态中是否存在与所述第一监测数据匹配的监控模态;在所述多个监控模态中存在与所述第一监测数据匹配的监控模态的情况下,将匹配成功的监控模态确定为所述目标监控模态;在所述多个监控模态中不存在与所述第一监测数据匹配的监控模态的情况下,基于所述第一监测数据,建立所述目标监控模态。
16.进一步地,所述目标阈值集合至少包括:预设负载阈值,预设资源阈值,基于目标阈值集合和所述第一监测数据,判断是否切换所述监控系统的监控模态,得到目标判断结果,包括:判断所述第一监测数据中的负载数据是否超过所述预设负载阈值,得到第一判断结果;判断所述第一监测数据中的计算资源的数据是否超过所述资源负载阈值,得到第二判断结果。基于所述第一判断结果和所述第二判断结果,确定所述目标判断结果。
17.根据本发明实施例的另一方面,还提供了一种信息系统的监控装置,包括:采集单元,用于采集第一监测数据,其中,所述第一监测数据至少包括:信息系统的负载数据、所述信息系统的计算资源的数据,所述第一监测数据是指在当前监控模态下对所述信息系统进行监控,得到的数据;判断单元,用于基于目标阈值集合和所述第一监测数据,判断是否切换监控系统的监控模态,得到目标判断结果;确定单元,用于在所述目标判断结果指示切换
所述监控系统的监控模态的情况下,基于所述第一监测数据,确定目标监控模态;监控单元,用于将所述监控系统的当前监控模态切换为所述目标监控模态,并在所述目标监控模态下对所述信息系统进行监控。
18.进一步地,在信息系统的监控装置中,对所述信息系统进行监控,包括:采集子单元,用于采集n个第二监测数据,其中,所述n个第二监测数据至少包括:与所述信息系统的基本组成部分关联的数据,n为大于1的整数;分类聚合子单元,用于对所述n个第二监测数据进行分类聚合,得到m个数据集合,其中,m为大于1的整数;计算子单元,用于基于所述m个数据集合、预设权重集合以及所述监控系统的监控模态,计算所述信息系统的综合健康度,其中,所述监控系统的监控模态为所述当前监控模态或者所述目标监控模态。
19.进一步地,计算子单元包括:计算模块,用于基于所述预设权重集合和所述m个数据集合以及所述监控系统的监控模态,计算k个监控节点的节点健康度,其中,所述k个监控节点至少包括:数据库节点,所述数据库节点至少包括:多个数据库,k为大于1的正整数;处理模块,用于基于所述k个监控节点的节点健康度,计算所述综合健康度,并在所述综合健康度超过目标预设阈值的情况下,发出报警提示,其中,所述目标预设阈值由所述监控系统的监控模态确定。
20.进一步地,计算模块包括:加权计算子模块,用于基于所述预设权重集合,对每个数据集合中的多个第二监测数据进行加权计算,得到每个监控节点的多个监控模块的模块健康度;确定子模块,用于基于所述监控系统的监控模态,确定每个与所述监控模块的所述模块健康度对应的权重值;处理子模块,用于基于每个所述监控模块的所述模块健康度以及对应的权重值确定每个监控节点的节点健康度,得到所述k个监控节点的节点健康度。
21.进一步地,所述信息系统的负载数据包括下述至少之一:网络连接数据、中央处理器的利用率、内存使用率。
22.进一步地,确定单元包括:第一判断子单元,用于判断所述监控系统的多个监控模态中是否存在与所述第一监测数据匹配的监控模态;第一确定子单元,用于在所述多个监控模态中存在与所述第一监测数据匹配的监控模态的情况下,将匹配成功的监控模态确定为所述目标监控模态;建立子单元,用于在所述多个监控模态中不存在与所述第一监测数据匹配的监控模态的情况下,基于所述第一监测数据,建立所述目标监控模态。
23.进一步地,所述目标阈值集合至少包括:预设负载阈值,预设资源阈值,判断单元包括:第二判断子单元,用于判断所述第一监测数据中的负载数据是否超过所述预设负载阈值,得到第一判断结果;第三判断子单元,用于判断所述第一监测数据中的计算资源的数据是否超过所述预设资源阈值,得到第二判断结果。第二确定子单元,用于基于所述第一判断结果和所述第二判断结果,确定所述目标判断结果。
24.根据本发明实施例的另一方面,还提供了一种电子设备,包括:处理器;以及存储器,用于存储处理器的可执行指令;其中,处理器配置为经由执行可执行指令来执行上述任意一项的信息系统的监控方法。
25.根据本发明实施例的另一方面,还提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,其中,在计算机程序运行时控制计算机可读存储介质所在设备执行上述任意一项的信息系统的监控方法。
26.在本发明中,采集第一监测数据,其中,第一监测数据至少包括:信息系统的负载
数据、信息系统的计算资源的数据,第一监测数据是指在当前监控模态下对信息系统进行监控,得到的数据;基于目标阈值集合和第一监测数据,判断是否切换监控系统的监控模态,得到目标判断结果;在目标判断结果指示切换监控系统的监控模态的情况下,基于第一监测数据,确定目标监控模态;将监控系统的当前监控模态切换为目标监控模态,并在目标监控模态下对信息系统进行监控。进而解决了监控系统难以依据信息系统的监控需求进行调整,且识别信息系统的健康状态的识别效率低的技术问题,在本发明中,基于负载数据和计算资源数据对监控系统的监控模态进行切换,并在监控模态下对信息系统进行监控,避免了相关技术中通过运维人员花费大量的时间精力调整监控配置的情况,从而实现了提高监控系统的监控灵活性以及提高信息系统的健康识别的识别效率的技术效果。
附图说明
27.此处所说明的附图用来提供对本发明的进一步理解,构成本技术的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
28.图1是根据本发明实施例的一种可选的信息系统的监控方法的流程图;
29.图2是根据本发明实施例的一种可选的负载变化识别与模态切换的流程图;
30.图3是根据本发明实施例的一种可选的日常模态的负载变化的示意图;
31.图4是根据本发明实施例的一种可选的集中检测模态下的防疫模式下的负载变化示意图;
32.图5是根据本发明实施例的一种可选的监控模态的示意图;
33.图6是根据本发明实施例的一种可选的健康监测指标的分层的示意图;
34.图7是根据本发明实施例的一种可选的多模态监控的信息系统的相关服务的交互流程图;
35.图8是根据本发明实施例的一种可选的信息系统的监控装置的示意图;
36.图9是根据本发明实施例的一种电子设备的示意图。
具体实施方式
37.为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
38.需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
39.需要说明的是,本技术所涉及的用户信息(包括但不限于用户设备信息、用户个人
信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据、监测的数据),均为经用户授权或者经过各方充分授权的信息和数据,并且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准,并提供有相应的操作入口,供用户选择授权或者拒绝。
40.为了便于描述,下面对本发明各实施例中涉及的部分术语或名词进行解释:
41.信息系统健康状态:根据业务需要,以系统负载、生产资源配置作为输入变量,结合各层生产资源的系统负载、各服务节点的响应指标计算出的整体系统的综合稳定指标;
42.模态:为适应某种外界负载压力变化以及生产资源的缩扩容双向变化,按照特定健康检测指标、数据采集规则、报警规则、看板展示模式等规则运行的监控系统状态;
43.多模态模式:借鉴软件开发中面向对象语言中多态的设计思路,为监控系统设置多种模态、以及不同模态在不同负载场景下的切转方法。
44.实施例一
45.根据本发明实施例,提供了一种可选的信息系统的监控方法的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
46.图1是根据本发明实施例的一种可选的信息系统的监控方法的流程图,如图1所示,该方法包括如下步骤:
47.步骤s101,采集第一监测数据,其中,第一监测数据至少包括:信息系统的负载数据、信息系统的计算资源的数据,第一监测数据是指在当前监控模态下对信息系统进行监控,得到的数据。
48.上述的第一监测数据可以包括但不限于、信息系统的负载数据、信息系统的计算资源的数据,上述的负载数据还可以包括:负载量、负载趋势数据(如负载的变化情况数据),
49.上述的负载量可以包括:但不限于信息系统的网络连接数据(如:服务器的连接数)、cpu负载参数(如:中央处理器的利用率)、内存使用率等负载情况。
50.步骤s102,基于目标阈值集合和第一监测数据,判断是否切换监控系统的监控模态,得到目标判断结果。
51.监控系统用于对信息系统进行监控,上述的目标阈值集合可以包括多个阈值,不同的监控模态下的阈值设置可以不同,以适应信息系统的不同负载模态,在当前监控模态下,可以依据上述的目标阈值集合中的多个阈值和第一监测数据,判断第一监测数据中的多个数据是否超出对应的阈值,以确定是否需要切换监控系统的监控模态。
52.例如:负载变化识别是识别负载以及计算资源的变化,进而触发判断其变化后的结果是否已不适用当前监控模态。监控系统可以按照一定的模态运行,同时另一服务“模态监控”监视负载的变化情况,当负载变化超过设定阈值或者计算资源的变化超过阈值时,可以触发后续的模态识别与模态装载服务。
53.图2是根据本发明实施例的一种可选的负载变化识别与模态切换的流程图,如图2所示,通过模态监控,可以基于模态偏差监控判断负载趋势是否与正常情况下偏差过大、基于负载监控,监控信息系统的负载情况,判断负载变化是否超过对应的阈值,以及基于计算
资源监控,监控信息系统的计算资源是否超过对应的阈值,进行模态识别,判断是否需要进行模态切换或者是否创建新模态。
54.负载模式趋势监控。此处的系统负载不仅只是来自信息系统外界入口(或网络接口)的负载,也包含各层级的负载。负载变化以web层连接数负载为例,日常模态下与集中检测模态下对应模块的web层接入负载。图3是根据本发明实施例的一种可选的日常模态的负载变化的示意图,如图3所示,在日常模态下每日单台web层服务器其连接数日常峰值在600左右,图4是根据本发明实施例的一种可选的集中检测模态下的负载变化示意图,如图4所示,web层连接数负载在防疫模式下峰值数值在6000+左右,与日常模态下可以相差十倍。日常模式下每日出现2~3峰,防疫模式下双峰的趋势更为明显,某些日期下午峰值甚至高于上午。
55.负载阈值的设定与各层级密切相关,比如slb(服务器负载平衡)入口可按照最大并发数、上行流量、下行流量进行设定,web层可按照连接数、cpu负载、内存使用率计算,支撑层如缓存数据库可按照每秒命令执行数、缓存命中率、节点内存使用率等计算。
56.计算资源变化趋势监控。计算资源的变化依赖cmdb配置管理系统,监控系统定时采集cmdb系统的计算资源变化,也可基于运维人员调整完配置后手动推送变化至监控系统。
57.步骤s103,在目标判断结果指示切换监控系统的监控模态的情况下,基于第一监测数据,确定目标监控模态。
58.例如:监控系统的负载变化监控服务监测到信息系统的负载或者计算资源的波动超过阈值且与当前运行模态不匹配时,可以触发模态对象构建服务。模态对象构建服务可以依据是否存在当前匹配的模态分别进行装载或转入模态创建服务(半自动、自动)。
59.步骤s104,将监控系统的当前监控模态切换为目标监控模态,并在目标监控模态下对信息系统进行监控。
60.在将监控系统的当前监控模态切换为目标监控模态,并在目标监控模态下对信息系统进行监控。
61.在本实施例中,可以基于面向对象开发语言中多态的概念,可以将监控模式封装为对象,按照不同的监控场景预制、识别、动态创建新的模态并动态载入以解决相关技术中的难以灵活调整监控模态的技术问题,图5是根据本发明实施例的一种可选的监控模态的示意图,如图5所示,上述的监控模态可以包括但不限于:日常模态、集中检测模态、高考查分模态、集中办事模态、节日重保模态等。图5中多个监控模态为某省政务类服务的监控模态划分,该信息系统为全省常住人口及企事业单位提供综合事项办理、日常生活服务等。在日常应用、高考查分时段等其负载呈现明显不同的变化,对应的本实施例中监控系统也以多态的模式来适应场景切换的需要。
62.需要说明的是,本实施例的信息系统所在生产运维环境可以指不含基础设施(如基础风火水电,基础物理存储、物理主机、物理网络、物理安防设备)的“软”应用及系统环境,某种程度可以理解为基于虚拟技术形成的云化生产环境,本实施例在思路理论上可以应用于全量信息系统生产环境,可以结合生产实际对实施例中相关的健康监测、数据采集、报警配置等模型或指标进行对应调整。
63.通过上述步骤,在本实施例中,基于负载数据和计算资源数据对监控系统的监控
模态进行切换,并在监控模态下对信息系统进行监控,避免了相关技术中通过运维人员花费大量的时间精力调整监控配置的情况,从而实现了提高监控系统的监控灵活性以及提高信息系统的健康识别的识别效率的技术效果,进而解决了监控系统难以依据信息系统的监控需求进行调整,且识别信息系统的健康状态的识别效率低的技术问题。
64.可选的,对信息系统进行监控还包括:采集n个第二监测数据,其中,n个第二监测数据至少包括:与信息系统的基本组成部分关联的数据,n为大于1的整数;对n个第二监测数据进行分类聚合,得到m个数据集合,其中,m为大于1的整数;基于m个数据集合、预设权重集合以及监控系统的监控模态,计算信息系统的综合健康度,其中,监控系统的监控模态为当前监控模态或者目标监控模态。
65.由于大型分布式分层应用采集的被监控指标数量多,很难用单一指标来表示系统的健康状态。但关键监控指标的提取、整合又是在不同报警/监控渠道呈现、部分模式计算必要的过程,因此在本实施例中,可以以分层提取与整合的模式进行健康监测指标(对应于上述的综合健康度)的提取与计算,图6是根据本发明实施例的一种可选的健康监测指标的分层的示意图,如图6所示可以分为5层。
66.(1)最底层的采集,采集n个第二监测数据,如cpu、内存、磁盘i/o、集群状态等为基础采集,得到上述的n各第二监测数据,本层的采集与其它因素无关,该层的基础采集是其它层监控指标汇聚和计算的基础;
67.(2)第二层为底层监控指标的概括,可以将n个第二监测数据进行分类聚合,得到m个数据集合。可视为底层采集的属性标签;
68.(3)第三层健康监控指标根据不同的监控模态、节点所属模块、节点所属层级等依据底层采集的数据源进行计算,得到每个监控节点的健康度;
69.(4)第四层健康监控指标结合第三层计算结果计算得出,与监控模态相关。例如:当前的监控系统在高考查分模态中,高考查分对应的应用健康监控指标的“查询延时”的健康状态的可设计为预设值的90%甚至100%,其分解到各同一层级的应用节点的延时健康指标可按照平均或其它计算方式进行汇总计算。
70.(5)第五层,依据信息系统的综合健康度,进行预警,展示。分层健康监控指标设计的目的是为了满足不同报警/监控通道模式下的呈现、满足部分计算及场景下的精简展示,但其在实时、历史监控分析或监控下的场景下必须可按层级展开至原始采集结果。
71.可选的,基于m个数据集合、预设权重集合以及监控系统的监控模态,计算信息系统的综合健康度,包括:基于预设权重集合和m个数据集合以及监控系统的监控模态,计算k个监控节点的节点健康度,其中,k个监控节点至少包括:数据库节点,数据库节点至少包括:多个数据库,k为大于1的正整数;基于k个监控节点的节点健康度,计算综合健康度,并在综合健康度超过目标预设阈值的情况下,发出报警提示,其中,目标预设阈值由监控系统的监控模态确定。
72.上述的监控节点可以是按预设规则对信息系统的进行划分,确定的监控节点,如:关系型数据库节点、文档数据库节点等。每个节点还可以包括多个组成部分,如:关系型数据节点和文档数据节点还可以包括多个数据库。
73.在本实施例中,可以基于每个数据集合中的监测数据和预设权重集合中的权重进行加权计算,得到每个监控节点的节点健康度。
74.例如:在监控模态为日常模态的初始设置下,事项办理业务使用度最高、影响最大,在权重设计环节将事项办理业务库的指标设置为50%,生活服务业务库的权重设置为30%,其它业务库的权重指标设置为20%,则据此关系型数据库节点(对应于上述的监控节点)的健康监控指标(对应于上述的节点健康度)可设计为:
75.h
db
=50%*h
事项办理
+30%*h
生活服务
+20%*h
其它
76.其中,h
事项办理
为基于事项办理业务关联的多个关系型数据库的健康度进行加权计算得到的健康度,h
生活服务
为基于生活服务业务关联的多个关系型数据库的健康度进行加权计算得到的健康度,h
其它
为基于金融机构的其他业务关联的多个关系型数据库的健康度进行加权计算得到的健康度,h
db
为关系型数据库节点的健康度,每个关系型数据库的健康度可以基于每个数据集合进行加权计算确定。
77.基于每个监控节点的节点健康度,通过加权计算或平均数计算的方式,可以确定上述的综合健康度。
78.依据当前监控系统的监控模式,获取该监控模式下的目标预设阈值,通过比较该目标预设阈值与综合健康度的大小,可以确定是否发出报警提示,在综合健康度大于目标预设阈值的情况下,可以发送报警提示。
79.可选的,基于预设权重集合和m个数据集合以及监控系统的监控模态,计算k个监控节点的节点健康度,包括:基于预设权重集合,对每个数据集合中的多个第二监测数据进行加权计算,得到每个监控节点的多个监控模块的模块健康度;基于监控系统的监控模态,确定每个与监控模块的模块健康度对应的权重值;基于每个监控模块的模块健康度以及对应的权重值确定每个监控节点的节点健康度,得到k个监控节点的节点健康度。
80.在本实施例中,以关系型数据库节点健康指标计算为例。关系型数据库节点按照模块的权重进行计算,比如某政务系统根据业务情况其关系型数据库划分为事项办理业务库、生活服务业务库、其它业务库,每个业务库均为主从从状态,此处设计每个业务库的满分健康指标均为100分,每个业务库可以包括多个关系型数据库。
81.单模块关系型数据库(对应于上述的监控模块)的监控状态的健康度(对应于上述的模块监控度)计算设计为:
82.h
zhsl
=0.4*(h
磁盘容量
*0.2+h
i/o
*0.3+h
进程
*0.4+h
cpu
*0.1)+0.6*(h
死锁
*0.4+h
慢查询
*0.35+h
延时
*0.2+h
其它...
*0.05)
83.其中,采集指标的满分值均设计为100分,其得分计算情况可根据需要调节,比如对指标“磁盘容量”可设定使用率低于60%为100分,60%至80%为70分,80%至90%为50分,95%以上为0分等。对于某些关键指标,比如数据库主从的延时状态可直接设定延时超过60秒即得分为0。
84.可选的,信息系统的负载数据包括下述至少之一:网络连接数据、中央处理器的利用率、内存使用率。
85.上述的负载量可以包括:但不限于信息系统的网络连接数据(如:服务器的连接数)、cpu负载(如:中央处理器的利用率)、内存使用率等负载情况。
86.可选的,在目标判断结果指示切换监控系统的监控模态的情况下,基于第一监测数据,确定目标监控模态,包括:判断监控系统的多个监控模态中是否存在与第一监测数据匹配的监控模态;在多个监控模态中存在与第一监测数据匹配的监控模态的情况下,将匹
配成功的监控模态确定为目标监控模态;在多个监控模态中不存在与第一监测数据匹配的监控模态的情况下,基于第一监测数据,建立目标监控模态。
87.在本实施例中,判断监控系统的多个监控模态中是否存在与第一监测数据匹配的监控模态。在多个监控模态中存在与第一监测数据匹配的监控模态的情况下,将匹配成功的监控模态确定为目标监控模态;在多个监控模态中不存在与第一监测数据匹配的监控模态的情况下,基于第一监测数据,建立目标监控模态。
88.可选的,目标阈值集合至少包括:预设负载阈值,预设资源阈值,基于目标阈值集合和第一监测数据,判断是否切换监控系统的监控模态,得到目标判断结果,包括:判断第一监测数据中的负载数据是否超过预设负载阈值,得到第一判断结果;判断第一监测数据中的计算资源的数据是否超过预设资源阈值,得到第二判断结果。基于第一判断结果和第二判断结果,确定目标判断结果。
89.在本实施例中,第一监测数据中的负载数据是否超过预设负载阈值,得到第一判断结果,判断第一监测数据中的计算资源的数据是否超过预设资源阈值,得到第二判断结果,在第一监测数据中的负载数据超过预设负载阈值,和/或,第一监测数据中的计算资源的数据超过预设资源阈值的情况下,确定上述的目标判断结果为需要切换监控模态,否则目标判断结果为不需要切换监控模态。
90.多模态监控的信息系统的相关服务的设计如表1所示:
91.表1
[0092][0093]
图7是根据本发明实施例的一种可选的多模态监控的信息系统的相关服务的交互流程图,如图7所示,系统初始可以基于运维人员手动创建多个模态(如日常模态、集中办事模态、高考查分模态等)载入某个模态运行;模态运行服务采集生产系统各层(如图7中的总负载层、web层、应用层、支撑层以及数据存储层)监控数据并根据模态配置元数据完成计算、告警、展示;负载变化监控服务监测到负载或者计算资源的波动超过阈值且与当前运行模态不匹配时则触发模态对象构建服务;模态对象构建服务依据是否存在当前匹配的模态分别进行装载或转入模态创建服务(半自动、自动);模态装载服务完成模态装载后再次进入模态运行监控服务状态。
[0094]
其中,图7中的总负载层、web层、应用层、支撑层以及数据存储层采集的指标数据包括:
[0095]
(1)总负载层采集的数据可以包括:slb、f5以及其他流量入口;
[0096]
(2)web层采集的数据可以包括:生产环境,网络区域a,web节点1的数据,
……
,生产/灾备环境,网络区域x,web节点n的数据(如图7中的web应用监控指标采集、web中间件性能指标采集、操作系统性能指标采集以及网络性能指标采集)。
[0097]
(3)应用层采集的数据可以包括:生产环境,网络区域a,应用节点1,
……
,生产/灾备环境,网络区域b,应用节点n的数据(如图7中的应用健康监控指标采集、应用中间件性能指标采集、应用日志采集与分析、应用服务响应指标采集、操作系统性能指标采集、网络性
能指标采集)。
[0098]
(4)支撑层采集的数据可以包括:生产环境,网络区域a,节点1,
……
,生产/灾备环境,网络区域b,应用节点n的数据(如图7中的消息服务性能指标采集、缓存服务性能指标采集、文件存储服务性能指标采集、短信服务性能指标采集、检索查询服务性能指标采集、应用网关服务性能指标采集、操作系统性能指标采集等)。
[0099]
(5)数据存储层采集的数据可以包括:生产环境,az1;生产环境,az2;灾备环境中的关系型数据存储数据,文档数据库的数据等。
[0100]
在本实施例中,以多模态模式设计的监控系统,其在负载波动剧烈、分布式大型系统的应用过程中可以有效解决运维人员对监控适配性的需要,降低整体生产运维的投入,减少对信息监控系统的频繁变更,进而提升信息系统的生产稳定。
[0101]
通过本实施例可以对外界负载以及计算资源进行识别并触发监控模态的方法,但在对外界负载变化识别方面仍比较单一,后续可对外界负载、各层负载通过其它方式进行逻辑计算,进一步提升和贴合信息系统的实际的健康指标(如健康度),该指标用于监控系统的健康状态,也作为触发监控系统模态的一个指标,实现了提高识别信息系统的健康状态的识别效率的技术效果。
[0102]
实施例二
[0103]
本技术实施例二提供了一种可选的信息系统的监控装置,监控装置中的各个实施单元对应于实施例一中的各个实施步骤。
[0104]
图8是根据本发明实施例的一种可选的信息系统的监控装置的示意图,如图8所示,该监控装置包括:采集单元81、判断单元82、确定单元83以及监控单元84。
[0105]
具体的,采集单元81采集第一监测数据,其中,第一监测数据至少包括:信息系统的负载数据、信息系统的计算资源的数据,第一监测数据是指在当前监控模态下对信息系统进行监控,得到的数据;
[0106]
判断单元82,用于基于目标阈值集合和第一监测数据,判断是否切换监控系统的监控模态,得到目标判断结果;
[0107]
确定单元83,用于在目标判断结果指示切换监控系统的监控模态的情况下,基于第一监测数据,确定目标监控模态;
[0108]
监控单元84,用于将监控系统的当前监控模态切换为目标监控模态,并在目标监控模态下对信息系统进行监控。
[0109]
在本技术实施例二提供的信息系统的监控装置中,可以通过采集单元81采集第一监测数据,其中,第一监测数据至少包括:信息系统的负载数据、信息系统的计算资源的数据,第一监测数据是指在当前监控模态下对信息系统进行监控,得到的数据,通过判断单元82基于目标阈值集合和第一监测数据,判断是否切换监控系统的监控模态,得到目标判断结果,通过确定单元83在目标判断结果指示切换监控系统的监控模态的情况下,基于第一监测数据,确定目标监控模态,通过监控单元84将监控系统的当前监控模态切换为目标监控模态,并在目标监控模态下对信息系统进行监控。在本实施例中,基于负载数据和计算资源数据对监控系统的监控模态进行切换,并在监控模态下对信息系统进行监控,避免了相关技术中通过运维人员花费大量的时间精力调整监控配置的情况,从而实现了提高监控系统的监控灵活性以及提高信息系统的健康识别的识别效率的技术效果。进而解决了监控系
统难以依据信息系统的监控需求进行调整,且识别信息系统的健康状态的识别效率低的技术问题。
[0110]
可选的,在本技术实施例二提供的信息系统的监控装置中,在信息系统的监控装置中,对信息系统进行监控,包括:采集子单元,用于采集n个第二监测数据,其中,n个第二监测数据至少包括:与信息系统的基本组成部分关联的数据,n为大于1的整数;分类聚合子单元,用于对n个第二监测数据进行分类聚合,得到m个数据集合,其中,m为大于1的整数;计算子单元,用于基于m个数据集合、预设权重集合以及监控系统的监控模态,计算信息系统的综合健康度,其中,监控系统的监控模态为当前监控模态或者目标监控模态。
[0111]
可选的,在本技术实施例二提供的信息系统的监控装置中,计算子单元包括:计算模块,用于基于预设权重集合和m个数据集合以及监控系统的监控模态,计算k个监控节点的节点健康度,其中,k个监控节点至少包括:数据库节点,数据库节点至少包括:多个数据库,k为大于1的正整数;处理模块,用于基于k个监控节点的节点健康度,计算综合健康度,并在综合健康度超过目标预设阈值的情况下,发出报警提示,其中,目标预设阈值由监控系统的监控模态确定。
[0112]
可选的,在本技术实施例二提供的信息系统的监控装置中,计算模块包括:加权计算子模块,用于基于预设权重集合,对每个数据集合中的多个第二监测数据进行加权计算,得到每个监控节点的多个监控模块的模块健康度;确定子模块,用于基于监控系统的监控模态,确定每个与监控模块的模块健康度对应的权重值;处理子模块,用于基于每个监控模块的模块健康度以及对应的权重值确定每个监控节点的节点健康度,得到k个监控节点的节点健康度。
[0113]
可选的,在本技术实施例二提供的信息系统的监控装置中,信息系统的负载数据包括下述至少之一:网络连接数据、中央处理器的利用率、内存使用率。
[0114]
可选的,在本技术实施例二提供的信息系统的监控装置中,确定单元包括:第一判断子单元,用于判断监控系统的多个监控模态中是否存在与第一监测数据匹配的监控模态;第一确定子单元,用于在多个监控模态中存在与第一监测数据匹配的监控模态的情况下,将匹配成功的监控模态确定为目标监控模态;建立子单元,用于在多个监控模态中不存在与第一监测数据匹配的监控模态的情况下,基于第一监测数据,建立目标监控模态。
[0115]
可选的,在本技术实施例二提供的信息系统的监控装置中,目标阈值集合至少包括:预设负载阈值,预设资源阈值,判断单元包括:第二判断子单元,用于判断第一监测数据中的负载数据是否超过预设负载阈值,得到第一判断结果;第三判断子单元,用于判断第一监测数据中的计算资源的数据是否超过预设资源阈值,得到第二判断结果。第二确定子单元,用于基于第一判断结果和第二判断结果,确定目标判断结果。
[0116]
上述的信息系统的监控装置还可以包括处理器和存储器,上述的采集单元81、判断单元82、确定单元83以及监控单元84等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
[0117]
上述处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来基于负载数据和计算资源数据对监控系统的监控模态进行切换,并在监控模态下对信息系统进行监控,避免了相关技术中通过运维人员花费大量的时间精力调整监控配置的情况,从而实现了提高监控系统的监控灵活性以及提高信息系
统的健康识别的识别效率的技术效果。
[0118]
上述存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flash ram),存储器包括至少一个存储芯片。
[0119]
根据本发明实施例的另一方面,还提供了一种电子设备,包括:处理器;以及存储器,用于存储处理器的可执行指令;其中,处理器配置为经由执行可执行指令来执行上述任意一项的信息系统的监控方法。
[0120]
根据本发明实施例的另一方面,还提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,其中,在计算机程序运行时控制计算机可读存储介质所在设备执行上述任意一项的信息系统的监控方法。
[0121]
图9是根据本发明实施例的一种电子设备的示意图,如图9所示,本发明实施例提供了一种电子设备90,电子设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现上述任意一项的信息系统的监控方法。
[0122]
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
[0123]
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
[0124]
在本技术所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
[0125]
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0126]
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0127]
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
[0128]
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

技术特征:
1.一种信息系统的监控方法,其特征在于,包括:采集第一监测数据,其中,所述第一监测数据至少包括:信息系统的负载数据、所述信息系统的计算资源的数据,所述第一监测数据是指在当前监控模态下对所述信息系统进行监控,得到的数据;基于目标阈值集合和所述第一监测数据,判断是否切换监控系统的监控模态,得到目标判断结果;在所述目标判断结果指示切换所述监控系统的监控模态的情况下,基于所述第一监测数据,确定目标监控模态;将所述监控系统的当前监控模态切换为所述目标监控模态,并在所述目标监控模态下对所述信息系统进行监控。2.根据权利要求1所述的监控方法,其特征在于,对所述信息系统进行监控,包括:采集n个第二监测数据,其中,所述n个第二监测数据至少包括:与所述信息系统的基本组成部分关联的数据,n为大于1的整数;对所述n个第二监测数据进行分类聚合,得到m个数据集合,其中,m为大于1的整数;基于所述m个数据集合、预设权重集合以及所述监控系统的监控模态,计算所述信息系统的综合健康度,其中,所述监控系统的监控模态为所述当前监控模态或者所述目标监控模态。3.根据权利要求2所述的监控方法,其特征在于,基于所述m个数据集合、预设权重集合以及所述监控系统的监控模态,计算所述信息系统的综合健康度,包括:基于所述预设权重集合和所述m个数据集合以及所述监控系统的监控模态,计算k个监控节点的节点健康度,其中,所述k个监控节点至少包括:数据库节点,所述数据库节点至少包括:多个数据库,k为大于1的正整数;基于所述k个监控节点的节点健康度,计算所述综合健康度,并在所述综合健康度超过目标预设阈值的情况下,发出报警提示,其中,所述目标预设阈值由所述监控系统的监控模态确定。4.根据权利要求3所述的监控方法,其特征在于,基于所述预设权重集合和所述m个数据集合以及所述监控系统的监控模态,计算k个监控节点的节点健康度,包括:基于所述预设权重集合,对每个数据集合中的多个第二监测数据进行加权计算,得到每个监控节点的多个监控模块的模块健康度;基于所述监控系统的监控模态,确定每个与所述监控模块的所述模块健康度对应的权重值;基于每个所述监控模块的所述模块健康度以及对应的权重值确定每个监控节点的节点健康度,得到所述k个监控节点的节点健康度。5.根据权利要求1所述的监控方法,其特征在于,所述信息系统的负载数据包括下述至少之一:网络连接数据、中央处理器的利用率、内存使用率。6.根据权利要求1所述的监控方法,其特征在于,在所述目标判断结果指示切换所述监控系统的监控模态的情况下,基于所述第一监测数据,确定目标监控模态,包括:判断所述监控系统的多个监控模态中是否存在与所述第一监测数据匹配的监控模态;在所述多个监控模态中存在与所述第一监测数据匹配的监控模态的情况下,将匹配成
功的监控模态确定为所述目标监控模态;在所述多个监控模态中不存在与所述第一监测数据匹配的监控模态的情况下,基于所述第一监测数据,建立所述目标监控模态。7.根据权利要求4所述的监控方法,其特征在于,所述目标阈值集合至少包括:预设负载阈值,预设资源阈值,基于目标阈值集合和所述第一监测数据,判断是否切换监控系统的监控模态,得到目标判断结果,包括:判断所述第一监测数据中的负载数据是否超过所述预设负载阈值,得到第一判断结果;判断所述第一监测数据中的计算资源的数据是否超过所述资源阈值,得到第二判断结果;基于所述第一判断结果和所述第二判断结果,确定所述目标判断结果。8.一种信息系统的监控装置,其特征在于,包括:采集单元,用于采集第一监测数据,其中,所述第一监测数据至少包括:信息系统的负载数据、所述信息系统的计算资源的数据,所述第一监测数据是指在当前监控模态下对所述信息系统进行监控,得到的数据;判断单元,用于基于目标阈值集合和所述第一监测数据,判断是否切换监控系统的监控模态,得到目标判断结果;确定单元,用于在所述目标判断结果指示切换所述监控系统的监控模态的情况下,基于所述第一监测数据,确定目标监控模态;监控单元,用于将所述监控系统的当前监控模态切换为所述目标监控模态,并在所述目标监控模态下对所述信息系统进行监控。9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行权利要求1至7中任意一项所述的信息系统的监控方法。10.一种电子设备,其特征在于,包括一个或多个处理器和存储器,所述存储器用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现权利要求1至7中任意一项所述的信息系统的监控方法。

技术总结
本发明公开了一种信息系统的监控方法、系统、存储介质及电子设备。涉及云计算技术领域,其中,该方法包括:采集第一监测数据,其中,第一监测数据至少包括:信息系统的负载数据、信息系统的计算资源的数据;基于目标阈值集合和第一监测数据,判断是否切换监控系统的监控模态,得到目标判断结果;在目标判断结果指示切换监控系统的监控模态的情况下,基于第一监测数据,确定目标监控模态;将监控系统的当前监控模态切换为目标监控模态,并在目标监控模态下对信息系统进行监控。本发明解决了监控系统难以依据信息系统的监控需求进行调整,且识别信息系统的健康状态的识别效率低的技术问题。信息系统的健康状态的识别效率低的技术问题。信息系统的健康状态的识别效率低的技术问题。


技术研发人员:高天峰
受保护的技术使用者:工银科技有限公司
技术研发日:2023.05.29
技术公布日:2023/9/23
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐