告警检测方法、电子设备、计算机可读存储介质与流程

未命名 08-13 阅读:185 评论:0


1.本技术实施例涉及接入网中任意无源光网络(pon,passive optical network)的点对多点(ptomp,point to multiplypoint)以及点对点(ptop,point topoint)通信技术领域,特别涉及告警检测方法、电子设备、计算机可读存储介质。


背景技术:

2.由于pon链路本身的状态以及光网络单元(onu,optical network unit)本身的不稳定性,因此pon光线路终端(olt,opticallineterminal)需要对onu在完成注册后的状态进行管理,从标准实现主要涉及onu断纤(olt检测到onu离线,即losi告警)和onu掉电(onu主动上报掉电消息,即dgi告警)四种场景:olt根据onu上述两种告警综合判断onu处于的实际故障场景,以及pon口下相关onu的上述两种告警集合综合判断pon口的实际故障场景。但是,由于onu本身的工况因素存在差异,某些onu可能无法准确上报掉电告警,从而导致olt检测的告警准确度不高。目前尚未有有效的解决方案。


技术实现要素:

3.本技术实施例提供一种告警检测方法、电子设备、计算机可读存储介质。
4.第一方面,本技术实施例提供一种告警检测方法,包括:在待检测第一设备离线且重新上线后,判断所述待检测第一设备的上报数据与第二设备中保存的所述待检测第一设备的下发数据是否一致;根据判断结果和检测到的所述待检测第一设备的第一告警确定所述待检测第一设备的第二告警是否正确上报。
5.第二方面,本技术实施例提供一种电子设备,包括:至少一个处理器;存储器,存储器上存储有至少一个程序,当所述至少一个程序被所述至少一个处理器执行时,实现上述任意一种告警检测方法。
6.第三方面,本技术实施例提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一种告警检测方法。
7.本技术实施例提供的告警检测方法,基于带检测第一设备的上报数据与第二设备中保存的待检测第一设备的下发数据是否一致,以及检测到的待检测第一设备的第一告警来检测待检测第一设备的第二告警是否正确上报,从而实现了对待检测第一设备的第二告警的检测,提高了对待检测第一设备的第二告警的检测准确度,从而实现现网类似问题的高效快速处理,同时减少工程中由于误判导致的资源浪费。
附图说明
8.图1为相关技术xpon的组网系统的示意图;
9.图2为本技术一个实施例提供的告警检测方法的流程图;
10.图3为本技术实施例的示例提供的告警检测方法的流程图;
11.图4为本技术另一个实施例提供的告警检测装置的组成框图。
具体实施方式
12.为使本领域的技术人员更好地理解本技术的技术方案,下面结合附图对本技术提供的告警检测方法、电子设备、计算机可读存储介质进行详细描述。
13.在下文中将参考附图更充分地描述示例实施例,但是所述示例实施例可以以不同形式来体现且不应当被解释为限于本文阐述的实施例。反之,提供这些实施例的目的在于使本技术透彻和完整,并将使本领域技术人员充分理解本技术的范围。
14.在不冲突的情况下,本技术各实施例及实施例中的各特征可相互组合。
15.如本文所使用的,术语“和/或”包括至少一个相关列举条目的任何和所有组合。
16.本文所使用的术语仅用于描述特定实施例,且不意欲限制本技术。如本文所使用的,单数形式“一个”和“该”也意欲包括复数形式,除非上下文另外清楚指出。还将理解的是,当本说明书中使用术语“包括”和/或“由
……
制成”时,指定存在所述特征、整体、步骤、操作、元件和/或组件,但不排除存在或添加至少一个其它特征、整体、步骤、操作、元件、组件和/或其群组。
17.除非另外限定,否则本文所用的所有术语(包括技术和科学术语)的含义与本领域普通技术人员通常理解的含义相同。还将理解,诸如那些在常用字典中限定的那些术语应当被解释为具有与其在相关技术以及本技术的背景下的含义一致的含义,且将不解释为具有理想化或过度形式上的含义,除非本文明确如此限定。
18.xpon例如以太网无源光网络(epon,ethernet passive optical network)、千兆无源光网络(g-pon,gigabit-capable passive optical network)以及其它无源光网络等。在xpon中,常见的组网系统如图1所示,包括:网管服务器(ems,element management system)、光线路终端(olt,opticalline terminal)、光分配网络(odn,optical distribution network)和若干个光网络单元(onu,optical network unit)。图1中仅以两个onu为例给出示意图,实际上可以包含更多的onu。olt作为中心局端设备以pon口为单位通过odn管理、连接、汇聚多个onu;onu接受olt的管理实现用户业务的接入,从而实现数据业务和配置管理等功能;odn主要包括:主干光纤、多个支路光纤以及连接主干光纤与支路光纤的分光器或其他连接器。xpon作为“点对多点”的拓扑结构,以xpon olt对应的pon口为基本单位管理并维护多个onu,xpon olt首先以pon口为单位实现onu的注册认证,在onu完成注册认证后通过逻辑配置建立逻辑转发通道并以下述方式实现pon口下多个onu的业务数据或管理数据的上下行转发。
19.当onu上线时,olt会通过管理通道查询该onu的上报数据并为该onu分配动态数据。其中,管理通道包括但不限于gpon的物理层操作管理和维护(ploam,physical layer operations,administration and maintenance)通道或onu管理和控制面(omci,onu management and control interface)通道,epon的标准操作管理和维护(oam,operations,administration and maintenance)通道或扩展oam通道等;动态数据包括但不限于onu的逻辑通道标识、管理信息库(mib,management information base)计数器等。onu在上电状态下会维持上述动态数据以保持与olt一致,除非olt下发新的动态数据以更新onu本地的动态数据,并保持与olt一致,或onu重启以清空本地的动态数据。
20.可见上述xponolt对onu的管理维护中,基本功能是实现onu的管理。
21.onu的断纤和掉电四种场景如下:
22.场景1:当pon olt和对应onu之间的支路光纤中断时,olt将检测到对应onu的losi告警,具体的,pon口连续4个期望帧里没有检测某onu的上行信号,工程中实际表征该onu离线(losi),也即olt检测到该onu的losi告警;进一步的,当支路光纤不稳定或光路状态处于临界时,则表现为onu频繁上下线,olt频繁检测到losi告警;随着运营商对用户业务感知的重视度日益提升,当前部分运营商会针对单个onu的losi告警触发派单。
23.场景2:当对应的onu掉电,包括主动关电或被动掉电,onu根据设备内部电容放电情况,例如根据电容电平或电平跳变情况,该onu会主动上报掉电告警给olt,onu掉电瞬间按照协议规定的消息向olt上报掉电告警,协议规定的消息例如gpon协议规定的ploam消息,或epon协议规定的标准oam消息,olt收到掉电告警后认为该onu掉电。当olt收到掉电告警时,同时会检测到对应onu的losi告警,会用掉电告警屏蔽losi告警,即掉电告警的优先级高于losi告警。也就是说,工程中实际表征为该onu掉电(dgi)。
24.场景3:当多个onu对应pon口的主干光纤中断,该pon口下所有当前在线的onu均会离线,此时olt的对应pon口会检测到pon los告警,具体的,pon口连续4帧没有检测到有效上行信号,认为pon口产生了los告警。pon los告警由于涉及主干光纤故障,因此出现pon los告警会触发运营商的派单。
25.场景4:当对应pon口下所有onu均掉电(一般对应于某区域停电),这种情况下当前所有在线的onu均会上报掉电告警,即olt对应pon口会根据标准检查并上报pon los告警,同时该pon口下所有对应onu会上报掉电告警。当pon口按一定规则判断若干onu上报了掉电告警,且同时检测到pon los告警,则认为该pon口的pon los原因是小区掉电,即将pon los告警改进更正为小区(区域)掉电告警。
26.从工程应用角度,由于断纤(支路/主干)需要运营商主动派单解决,而掉电(onu掉电/区域停电)一般情况下不需要运营商主动处理。所以针对上述场景1/3(losi/pon los)需要用户主动处理,场景2/4(dgi/区域停电)则一般不需要处理。其中场景4一般会将pon los告警结合对应onu的掉电告警会转译成区域停电告警。以实现不同场景分别对应的不同告警,便于用户的运维处理。
27.实际应用中,由于onu本身工况因素存在差异,如设备长期运行或设备频繁上下电等引起的onu的电容亏电等,某些onu在掉电场景下,可能无法准确上报dgi告警(如漏报dgi告警或虚报dgi告警),即上述场景1和场景2无法区分;进一步当同一pon口下多个onu存在无法准确上报dgi告警时,上述场景3和场景4也无法区分。这种情况由于用户无法准确派单,onu业务无法快速恢复,从而影响网络运维稳定和用户业务感知。
28.为此上述问题的本质是onu工况(即dgi告警无法准确上报)导致的pon olt以及上层运维系统对onu状态的判断异常。即ponolt需要识别对应onu的dgi能力。但xpon olt和onu实现对此提出了挑战:
29.一:该问题本质是onu的实际物理状态异常(电容),即onu的软件dgi上报能力并无法等效于其电容实际物理状态。所以以onu的dgi上报能力无法完全代替onu可触发掉电上报的物理状态;
30.二:xpon采用的点对多点网络,实际接入的onu数量是海量的,且其能力和状态差异很大。实际网络中将是多类型,多状态的onu的混合情况,所以要求现网所有onu均准确上报其dgi能力无法实现且成本巨大,即上述场景4无法得到解决。
31.目前尚未有有效的解决方案。
32.本技术实施例的告警检测方法虽然是基于xpon系统存在的问题提出的,但是本技术实施例的告警检测方法同样适用于与xpon系统具有相同的基础认证方式,以及相同的动态数据和告警交互方式的其他任何系统。
33.下面的描述为了不将告警检测方式限定在xpon系统,以第一设备代替onu,第二设备代替olt来进行描述,第一设备不仅仅包括onu,还包括与onu具有相同的基础认证方式,以及相同的动态数据和告警交互方式的其他任何设备,olt不仅仅包括olt,还包括与olt具有相同的基础认证方式,以及相同的动态数据和告警交互方式的其他任何设备。
34.这里相同的基础认证方式是指第一设备和第二设备之间通过基础注册认证标识信息进行注册认证以实现对第一设备的接入合法性的控制,以及业务转发的管理过程。
35.基础注册认证标识信息包括但不限于epon系统或10gepon系统的媒体访问控制(mac,mediaaccesscontrol)地址或逻辑onu标识(loid,logical onuidentifier)或loid+密码(pw,password),gpon系统或xgepon系统的用户号(sn,subscribernumber)或 loid或loid+pw以及其他类似的基础注册认证标识信息。
36.本技术实施例中,ems用于对olt以及xpon网络的配置、管理以及维护等工作;ems网管维护并管理olt、onu的历史信息以及相关告警与通知消息。并可根据相关告警与通知消息完成对具体异常信息判断定位。
37.olt用于周期性启动onu的发现过程,为onu分配链路标识(如llid(epon系统)或onu id(gpon系统)),并接收判断发现进程中onu上报的基础注册认证信息是否与olt本地配置保存信息一致。若onu上报的基础注册认证信息与olt本地配置保存信息一致,完成onu在olt上注册与认证,并为onu分配相应的上行时隙,onu在olt为其配置分配的时隙中上传数据;否则onu在olt上注册认证失败,不允许其转发除协议交互以外的任何普通业务数据。
38.odn用于在olt下连接数量不等的onu,作为olt和onu之间直接的物理连接通道,以pon口为单位由多段光纤(一条或两条(互为保护)的主干光纤以及多条支路光纤)以及其他相关物理光器件组合而成;
39.onu用于承担家庭用户的终端设备的角色,接受olt的管理。当onu离线或掉电过程中,olt对应pon口可检测到对应onu的收无光(losi),同时根据onu是否上报掉电告警,由olt决定对应onu的告警是losi或dgi(当olt检测到losi,同时收到onu的dgi,则在olt上显示为对应onu的dgi,即dgi屏蔽losi)。进一步的,当pon口下所有onu掉线,olt则上报pon los告警;当pon口检测到pon los告警同时收到若干onu短时间内集中上报的dgi,则pon口告警为小区掉电。
40.图2为本技术一个实施例提供的告警检测方法的流程图。
41.第一方面,参照图2,本技术一个实施例提供一种告警检测方法,可以应用于第二设备,该方法包括:
42.步骤200、在待检测第一设备离线且重新上线后,判断待检测第一设备的上报数据与第二设备中保存的待检测第一设备的下发数据是否一致。
43.在一些示例性实施例中,待检测第一设备可以人为指定或按照一定策略确定。例如,人为指定部分或全部第一设备为待检测第一设备。为了提升对第一设备的识别效率,缩小检测范围,可以选择在t0时间窗口中出现离线现象,且有可能没有准确上报掉电告警的
第一设备为待检测第一设备。其中,t0可以人为配置。第一设备是否准确上报掉电告警可以根据之前保存的待检测第一设备的设备信息、表征第二告警是否曾经正常上报的信息alm和表征待检测第一设备的掉电能力的信息dgi之间的对应关系确定。例如,根据对应关系中的alm和dgi共同确定第一设备是否准确上报掉电告警。
44.在一些示例性实施例中,待检测第一设备的上报数据包括:第二设备下发给待检测第一设备,并在待检测第一设备生效的动态数据;待检测第一设备和第二设备保持一致的动态数据。
45.在一些示例性实施例中,第二设备下发给待检测第一设备,并在待检测第一设备生效的动态数据包括但不限于第二设备在待检测第一设备上线过程中为待检测第一设备分配的逻辑链路标识,如epon系统或10gepon系统中的逻辑链接标识(llid,logical link identification)或gpon系统或xg(s)pon系统中的allocid(alloc-id:由olt使用 assign_allocidploam消息所分配的alloc-id,用于标识onu上行通道)等。当待检测第一设备重启或掉电后该动态数据会清空或变为默认值。
46.在一些示例性实施例中,待检测第一设备和第二设备保持一致的动态数据包括但不限于第二设备在待检测第一设备上线过程中为待检测第一设备分配的mib计数器值。当待检测第一设备重启或掉电后该动态数据会清空或变为默认值。
47.在一些示例性实施例中,第二设备中保存的待检测第一设备的下发数据包括但不限于第二设备在待检测第一设备上线过程中为待检测第一设备分配的动态数据,该动态数据例如逻辑链路标识和mib计数器值等。
48.在一些示例性实施例中,判断待检测第一设备的上报数据与第二设备中保存的待检测第一设备的下发数据是否一致包括以下至少之一:
49.判断待检测第一设备的上报数据中的逻辑链路标识与第二设备中保存的待检测第一设备的逻辑链路标识是否相同;
50.判断待检测第一设备的上报数据中的mib计数器值与第二设备中保存的待检测第一设备的mib计数器值是否相同。
51.在一些示例性实施例中,在待检测第一设备重新上线时间和离线时间之间的差值大于或等于第一预设时间t1的情况下,继续执行判断待检测第一设备的上报数据与第二设备中保存的待检测第一设备的下发数据是否一致的步骤。通过第一预设时间t1实现了对短暂重启或短暂掉电重启与一般离线和掉电的区分。
52.在一些示例性实施例中,第一预设时间t1大于第二预设时间t2。如第一预设时间t1为第二预设时间t2的n倍,n例如为3。
53.步骤201、根据判断结果和检测到的待检测第一设备的第一告警确定待检测第一设备的第二告警是否正确上报。
54.在一些示例性实施例中,在待检测第一设备的上报数据中的逻辑链路标识与第二设备中保存的待检测第一设备的逻辑链路标识相同的情况下,判断结果为待检测第一设备的上报数据与第二设备中保存的待检测第一设备的下发数据一致;在待检测第一设备的上报数据中的逻辑链路标识与第二设备中保存的待检测第一设备的逻辑链路标识不相同的情况下,判断结果为待检测第一设备的上报数据与第二设备中保存的待检测第一设备的下发数据不一致。
55.在一些示例性实施例中,在待检测第一设备的上报数据中的mib计数器值与第二设备中保存的待检测第一设备的mib计数器值相同的情况下,判断结果为待检测第一设备的上报数据与第二设备中保存的待检测第一设备的下发数据一致;在待检测第一设备的上报数据中的mib计数器值与第二设备中保存的待检测第一设备的mib计数器值不相同的情况下,判断结果为待检测第一设备的上报数据与第二设备中保存的待检测第一设备的下发数据不一致。
56.在一些示例性实施例中,在待检测第一设备的上报数据中的逻辑链路标识与第二设备中保存的待检测第一设备的逻辑链路标识相同,且待检测第一设备的上报数据中的mib计数器值与第二设备中保存的待检测第一设备的mib计数器值相同的情况下,判断结果为待检测第一设备的上报数据与第二设备中保存的待检测第一设备的下发数据一致;在待检测第一设备的上报数据中的逻辑链路标识与第二设备中保存的待检测第一设备的逻辑链路标识不相同,或待检测第一设备的上报数据中的mib计数器值与第二设备中保存的待检测第一设备的mib计数器值不相同的情况下,判断结果为待检测第一设备的上报数据与第二设备中保存的待检测第一设备的下发数据不一致。
57.在一些示例性实施例中,检测到的待检测第一设备的第一告警有可能是离线告警(losi),也有可能是掉线告警(dgi)。
58.在一些示例性实施例中,根据判断结果和检测到的待检测第一设备的第一告警确定待检测第一设备的第二告警是否正确上报包括以下至少之一:
59.在判断结果为待检测第一设备的上报数据与第二设备中保存的待检测第一设备的下发数据一致,且检测到的第一告警为离线告警情况下,确定待检测第一设备的离线告警正确上报;
60.在判断结果为待检测第一设备的上报数据与第二设备中保存的待检测第一设备的下发数据一致,且检测到的第一告警为掉电告警情况下,确定待检测第一设备的掉电告警非正确上报,且待检测第一设备的掉电告警为虚假告警;
61.在判断结果为待检测第一设备的上报数据与第二设备中保存的待检测第一设备的下发数据不一致,且检测到的第一告警为离线告警情况下,确定待检测第一设备的掉电告警非正确上报,且待检测第一设备的掉电告警漏报;
62.在判断结果为待检测第一设备的上报数据与第二设备中保存的待检测第一设备的下发数据不一致,且检测到的第一告警为掉电告警情况下,确定待检测第一设备的掉电告警正确上报。
63.在一些示例性实施例中,在待检测第一设备重新上线时间和离线时间之间的差值小于或等于第二预设时间t2的情况下,该方法还包括:获取待检测第一设备的运行时长;根据待检测第一设备的运行时长和重新上线时长之间的差值是否大于或等于第三预设时间,确定待检测第一设备是否重启。
64.在一些示例性实施例中,可以通过协议通道获取待检测第一设备的运行时长。
65.在一些示例性实施例中,针对xpon系统,协议通道例如epon系统的扩展oam通道或gpon系统的onu管理和控制接口(omci,onu management and control interface)通道等。
66.在一些示例性实施例中,根据待检测第一设备的运行时长和重新上线时长之间的差值是否大于或等于第三预设时间,确定待检测第一设备是否重启包括以下至少之一:
67.在待检测第一设备的运行时长和重新上线时长之间的差值大于或等于第三预设时间的情况下,确定待检测第一设备未重启,即判定为对应支路光纤断开;
68.在待检测第一设备的运行时长和重新上线时长之间的差值小于第三预设时间的情况下,确定待检测第一设备重启。
69.在一些示例性实施例中,确定待检测第一设备重启后,该方法还包括:根据待检测第一设备的第一告警,以及保存的待检测第一设备的设备信息、表征第二告警是否曾经正常上报的信息和表征待检测第一设备的掉电能力的信息之间的对应关系确定待检测第一设备的重启类型。
70.在一些示例性实施例中,表征待检测第一设备的掉电能力的信息包括:表征待检测第一设备的掉电告警是否为虚假告警的信息dgi(false),以及表征待检测第一设备的掉电告警是否漏报的信息dgi(missing);
71.确定待检测第一设备的重启类型包括以下至少之一:
72.在第一告警为离线告警,且对应关系中表征待检测第一设备的掉电告警是否漏报的信息为表征待检测第一设备的掉电告警没有漏报的信息(即为第二数值)的情况下,确定重启类型为软件重启;
73.在第一告警为离线告警,且对应关系中表征待检测第一设备的掉电告警是否漏报的信息为表征待检测第一设备的掉电告警漏报的信息(即为第一数值)的情况下,确定重启类型为断电重启;
74.在第一告警为掉电告警,且对应关系中表征待检测第一设备的掉电告警是否为虚假告警的信息为表征待检测第一设备的掉电告警不是虚假告警的信息(即为第二数值)的情况下,确定重启类型为断电重启;
75.在第一告警为掉电告警,且对应关系中表征待检测第一设备的掉电告警是否为虚假告警的信息为表征待检测第一设备的掉电告警为虚假告警的信息(即为第一数值)的情况下,确定重启类型为软件重启。
76.在一些示例性实施例中,根据判断结果和检测到的待检测第一设备的第一告警确定待检测第一设备的第二告警是否正确上报后,该方法还包括:根据待检测第一设备的第二告警是否正确上报,保存或更新待检测第一设备的设备信息、表征第二告警是否曾经正常上报的信息alm和表征待检测第一设备的掉电能力的信息dgi之间的对应关系。
77.在一些示例性实施例中,对应关系可以保存在任何设备中。例如,对应关系可以保存在网管服务器或第三方运维系统中,olt在onu第一次上线时,根据onu的唯一标识从网管服务器或第三方运维系统中获取onu对应的对应关系,并更新本地的onu对应的对应关系,这样,网管服务器或第三方运维系统可以根据对应关系进行派单,处理对应的故障;其中,onu的唯一标识例如可以是mac地址或sn等。
78.在一些示例性实施例中,待检测第一设备的设备信息可以是指与第一设备一一对应的任意信息。例如,第一设备型号、注册标识中的至少一个等。
79.在一些示例性示例中,表征第二告警是否曾经正常上报的信息alm包括:表征离线告警是否曾经正常上报的信息alm(losi)和表征掉电告警是否曾经正常上报的信息alm(dgi)中的至少一个。
80.在一些示例性实施例中,表征离线告警是否曾经正常上报的信息alm(losi)为第
一数值时,表示离线告警曾经正常上报;表征离线告警是否曾经正常上报的信息alm(losi)为第二数值时,表示离线告警曾经非正常上报。
81.在一些示例性实施例中,第一数值和第二数值可以是任意两个不同的数值。例如,第一数值为1,第二数值为0;或者,第一数值为0,第二数值为1。
82.在一些示例性实施例中,表征掉电告警是否曾经正常上报的信息alm(dgi)为第一数值时,表示掉电告警曾经正常上报;表征掉电告警是否曾经正常上报的信息alm(dgi)为第二数值时,表示掉电告警曾经非正常上报。
83.在一些示例性实施例中,表征待检测第一设备的掉电能力的信息dgi包括:表征待检测第一设备的掉电告警是否为虚假告警的信息dgi(false)和表征待检测第一设备的掉电告警是否漏报的信息dgi(missing)。
84.在一些示例性实施例中,表征待检测第一设备的掉电告警是否为虚假告警的信息dgi(false)为第一数值时,表示待检测第一设备的掉电告警为虚假告警;表征待检测第一设备的掉电告警是否为虚假告警的信息dgi(false)为第二数值时,表示待检测第一设备的掉电告警不是虚假告警。
85.在一些示例性实施例中,表征待检测第一设备的掉电告警是否漏报的信息dgi(missing)为第一数值时,表示待检测第一设备的掉电告警漏报;表征待检测第一设备的掉电告警是否漏报的信息dgi(missing)为第二数值时,表示待检测第一设备的掉电告警没有漏报。
86.下面描述一下具体如何保存或更新对应关系。
87.在确定待检测第一设备的离线告警正确上报的情况下,将待检测第一设备对应的对应关系中的表征离线告警是否曾经正常上报的信息alm(losi)保持或更新为第一数值;在确定待检测第一设备的离线告警非正确上报的情况下,将待检测第一设备对应的对应关系中的表征离线告警是否曾经正常上报的信息alm(losi)保持或更新为第二数值。
88.在确定待检测第一设备的掉电告警正确上报的情况下,将待检测第一设备对应的对应关系中的表征掉电告警是否曾经正常上报的信息alm(dgi)保持或更新为第一数值;在确定待检测第一设备的掉电告警非正确上报的情况下,将待检测第一设备对应的对应关系中的表征掉电告警是否曾经正常上报的信息alm(dgi)保持或更新为第二数值。
89.在连续确定待检测第一设备的掉电告警为虚假告警的次数大于或等于第三预设阈值的情况下,将待检测第一设备对应的对应关系中的表征待检测第一设备的掉电告警是否为虚假告警的信息dgi(false)保持或更新为第一数值;在连续确定待检测第一设备的掉电告警为虚假告警的次数小于第三预设阈值,或确定待检测第一设备的掉电告警不是虚假告警的情况下,将待检测第一设备对应的对应关系中的表征待检测第一设备的掉电告警是否为虚假告警的信息dgi(false)保持或更新为第二数值。
90.在连续确定待检测第一设备的掉电告警漏报的次数大于或等于第四预设阈值的情况下,将待检测第一设备对应的对应关系中的表征待检测第一设备的掉电告警是否漏报的信息dgi(missing)保持或更新为第一数值;在连续确定待检测第一设备的掉电告警漏报的次数小于第四预设阈值,或确定待检测第一设备的掉电告警没有漏报的情况下,将待检测第一设备对应的对应关系中的表征待检测第一设备的掉电告警是否漏报的信息dgi(missing)保持或更新为第二数值。
91.在一些示例性实施例中,该方法还包括:在检测到某一个pon口的ponlos告警或小区掉电告警的情况下,确定某一个pon口下的第一设备中与ponlos告警或小区掉电告警关联的第一设备;根据与pon los告警或小区掉电告警关联的第一设备对应的对应关系更新pon los告警或小区掉电告警。
92.在一些示例性实施例中,确定某一个pon口下的第一设备中与pon los告警或小区掉电告警关联的第一设备包括:
93.在检测到ponlos告警或小区掉电告警的时间与检测到某一个pon口下的某一个第一设备的离线告警的时间之间的差值的绝对值小于或等于第四预设时间的情况下,确定与pon los告警关联或小区掉电告警的第一设备包括某一个第一设备。
94.在一些示例性实施例中,根据与ponlos告警或小区掉电告警关联的第一设备对应的对应关系更新ponlos告警或小区掉电告警包括以下至少之一:
95.在检测到某一个pon口的pon los告警,且与pon los告警关联的第一设备中存在掉电告警漏报的第一设备的数量大于或等于第一预设阈值的情况下,将ponlos告警更新为小区掉电告警;
96.在检测到某一个pon口的pon los告警,且与pon los告警关联的第一设备中存在掉电告警漏报的第一设备的相对占比大于或等于第二预设阈值的情况下,将pon los告警更新为小区掉电告警;
97.在检测到某一个pon口的小区掉电告警,且与小区掉电告警关联的第一设备中存在掉电告警为虚假告警的第一设备的数量大于或等于第一预设阈值的情况下,将小区掉电告警更新为pon los告警;
98.在检测到某一个pon口的小区掉电告警,且与小区掉电告警关联的第一设备中存在掉电告警为虚假告警的第一设备的相对占比大于或等于第二预设阈值的情况下,将小区掉电告警更新为ponlos告警。
99.在一些示例性实施例中,与ponlos告警或小区掉电告警关联的第一设备是否存在掉电告警漏报的情况可以根据对应关系中表征待检测第一设备的掉电告警是否漏报的信息dgi(missing)确定,对应关系中的待检测第一设备即为与pon los告警或小区掉电告警关联的第一设备。具体的,在对应关系中表征待检测第一设备的掉电告警是否漏报的信息dgi(missing)为第一数值的情况下,确定与ponlos告警或小区掉电告警关联的第一设备存在掉电告警漏报的情况;在对应关系中表征待检测第一设备的掉电告警是否漏报的信息dgi(missing)为第二数值的情况下,确定与pon los告警或小区掉电告警关联的第一设备不存在掉电告警漏报的情况。
100.在一些示例性实施例中,与pon los告警或小区掉电告警关联的第一设备是否存在掉电告警为虚假告警的情况可以根据对应关系中表征待检测第一设备的掉电告警是否为虚假告警的信息dgi(false)确定,对应关系中的待检测第一设备即为与pon los告警或小区掉电告警关联的第一设备。具体的,在对应关系中表征待检测第一设备的掉电告警是否为虚假告警的信息dgi(false)为第一数值的情况下,确定与ponlos告警或小区掉电告警关联的第一设备存在掉电告警为虚假告警的情况;在对应关系中表征待检测第一设备的掉电告警是否为虚假告警的信息dgi(false)为第二数值的情况下,确定与ponlos告警或小区掉电告警关联的第一设备不存在掉电告警为虚假告警的情况。
101.本技术实施例提供的告警检测方法,基于带检测第一设备的上报数据与第二设备中保存的待检测第一设备的下发数据是否一致,以及检测到的待检测第一设备的第一告警来检测待检测第一设备的第二告警是否正确上报,从而实现了对待检测第一设备的第二告警的检测,提高了对待检测第一设备的第二告警的检测准确度,从而实现现网类似问题的高效快速处理,同时减少工程中由于误判导致的资源浪费。
102.为了更加完整的呈现本技术实施例提供的告警检测方法的整个过程,下面通过一个示例来进行说明,所列举的示例不用于限定本技术实施例的保护范围。
103.示例
104.参照图3,告警检测方法包括:
105.步骤300、在待检测onu离线且重新上线后,在待检测onu重新上线时间和离线时间之间的差值大于或等于第一预设时间t1的情况下,执行步骤301;在待检测onu重新上线时间和离线时间之间的差值小于或等于第二预设时间t2的情况下,执行步骤304。
106.步骤301、判断待检测onu的上报数据与olt中保存的待检测onu的下发数据是否一致。
107.本步骤中,待检测onu的上报数据包括:olt下发给待检测onu,并在待检测onu生效的动态数据;待检测onu和olt保持一致的动态数据。
108.其中,olt下发给待检测第一设备,并在待检测onu生效的动态数据包括但不限于olt在待检测onu上线过程中为待检测onu分配的逻辑链路标识。
109.其中,待检测onu和olt保持一致的动态数据包括但不限于olt在待检测onu上线过程中为待检测onu分配的mib计数器值。
110.步骤302、在判断结果为待检测onu的上报数据与olt中保存的待检测onu的下发数据一致,且检测到的第一告警为离线告警情况下,确定待检测onu的离线告警正确上报;在判断结果为待检测onu的上报数据与olt中保存的待检测第一设备的下发数据一致,且检测到的第一告警为掉电告警情况下,确定待检测onu的掉电告警非正确上报,且待检测onu的掉电告警为虚假告警;在判断结果为待检测onu的上报数据与olt中保存的待检测onu的下发数据不一致,且检测到的第一告警为离线告警情况下,确定待检测onu的掉电告警非正确上报,且待检测onu的掉电告警漏报;在判断结果为待检测onu的上报数据与olt中保存的待检测onu的下发数据不一致,且检测到的第一告警为掉电告警情况下,确定待检测onu的掉电告警正确上报。
111.步骤303、保存或更新待检测onu的设备信息、表征待检测onu的离线告警或掉电告警是否曾经正常上报的信息alm和表征待检测onu的掉电能力的信息dgi之间的对应关系。
112.本步骤中,表征待检测onu的掉电能力的信息dgi包括:表征待检测onu的掉电告警是否为虚假告警的信息dgi(false)和表征待检测onu的掉电告警是否漏报的信息dgi(missing)。
113.步骤304、获取待检测onu的运行时长;判断待检测onu的运行时长和重新上线时长之间的差值是否大于或等于第三预设时间,如果是,则确定待检测onu未重启,即判定为对应支路光纤断开;如果不是,则确定待检测onu重启,并执行步骤305。
114.步骤305、根据待检测onu的第一告警,以及保存的待检测onu的设备信息、表征待检测onu的离线告警或掉电告警是否曾经正常上报的信息和表征待检测onu的掉电能力的
信息之间的对应关系确定待检测onu的重启类型。
115.第二方面,本技术另一个实施例提供一种电子设备,包括:至少一个处理器;存储器,存储器上存储有至少一个程序,当至少一个程序被至少一个处理器执行时,实现上述任意一种告警检测方法。
116.其中,处理器为具有数据处理能力的器件,其包括但不限于中央处理器(cpu)等;存储器为具有数据存储能力的器件,其包括但不限于随机存取存储器(ram,更具体如sdram、ddr等)、只读存储器(rom)、带电可擦可编程只读存储器(eeprom)、闪存(flash)。
117.在一些实施例中,处理器、存储器通过总线相互连接,进而与计算设备的其它组件连接。
118.第三方面,本技术另一个实施例提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现上述任意一种告警检测方法。
119.图4为本技术另一个实施例提供的告警检测装置的组成框图。
120.第四方面,参照图4,本技术另一个实施例提供一种告警检测装置,包括:判断模块401,用于在待检测第一设备离线且重新上线后,判断所述待检测第一设备的上报数据与第二设备中保存的所述待检测第一设备的下发数据是否一致;第一确定模块402,用于根据判断结果和检测到的所述待检测第一设备的第一告警确定所述待检测第一设备的第二告警是否正确上报。
121.在一些示例性实施例中,还包括:存储模块403,用于根据所述待检测第一设备的第二告警是否正确上报,保存或更新所述待检测第一设备的设备信息、表征所述第二告警是否曾经正常上报的信息和表征所述待检测第一设备的掉电能力的信息之间的对应关系。
122.在一些示例性实施例中,还包括:第二确定模块404,用于在检测到某一个pon口的pon los告警或小区掉电告警的情况下,确定所述某一个pon口下的第一设备中与所述ponlos告警关联的第一设备;更新模块405,用于根据所述与所述ponlos告警关联的第一设备对应的对应关系更新所述ponlos告警或所述小区掉电告警。
123.上述告警检测装置的具体实现过程与前述实施例告警检测方法的具体实现过程相同,这里不再赘述。
124.本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施方式中,在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分;例如,一个物理组件可以具有多个功能,或者一个功能或步骤可以由若干物理组件合作执行。某些物理组件或所有物理组件可以被实施为由处理器,如中央处理器、数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其它数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于ram、rom、eeprom、闪存或其它存储器技术、cd-rom、数字多功能盘(dvd)或其它光盘存储、磁盒、磁带、磁盘存储或其它磁存储器、或者可以用于存储期望的信息并且可以被计算机访问的任何其它的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指
令、数据结构、程序模块或者诸如载波或其它传输机制之类的调制数据信号中的其它数据,并且可包括任何信息递送介质。
125.本文已经公开了示例实施例,并且虽然采用了具体术语,但它们仅用于并仅应当被解释为一般说明性含义,并且不用于限制的目的。在一些实例中,对本领域技术人员显而易见的是,除非另外明确指出,否则可单独使用与特定实施例相结合描述的特征、特性和/或元素,或可与其它实施例相结合描述的特征、特性和/或元件组合使用。因此,本领域技术人员将理解,在不脱离由所附的权利要求阐明的本技术的范围的情况下,可进行各种形式和细节上的改变。

技术特征:
1.一种告警检测方法,其特征在于,包括:在待检测第一设备离线且重新上线后,判断所述待检测第一设备的上报数据与第二设备中保存的所述待检测第一设备的下发数据是否一致;根据判断结果和检测到的所述待检测第一设备的第一告警确定所述待检测第一设备的第二告警是否正确上报。2.根据权利要求1所述的告警检测方法,其特征在于,所述待检测第一设备的上报数据包括:所述第二设备下发给所述待检测第一设备,并在所述待检测第一设备生效的动态数据;所述待检测第一设备和所述第二设备保持一致的动态数据。3.根据权利要求1所述的告警检测方法,其特征在于,所述根据判断结果和检测到的所述待检测第一设备的第一告警确定所述待检测第一设备的第二告警是否正确上报包括以下至少之一:在所述判断结果为所述待检测第一设备的上报数据与所述第二设备中保存的所述待检测第一设备的下发数据一致,且检测到的第一告警为离线告警情况下,确定所述待检测第一设备的离线告警正确上报;在所述判断结果为所述待检测第一设备的上报数据与所述第二设备中保存的所述待检测第一设备的下发数据一致,且检测到的第一告警为掉电告警情况下,确定所述待检测第一设备的掉电告警非正确上报,且所述待检测第一设备的掉电告警为虚假告警;在所述判断结果为所述待检测第一设备的上报数据与所述第二设备中保存的所述待检测第一设备的下发数据不一致,且检测到的第一告警为离线告警情况下,确定所述待检测第一设备的掉电告警非正确上报,且所述待检测第一设备的掉电告警漏报;在所述判断结果为所述待检测第一设备的上报数据与所述第二设备中保存的所述待检测第一设备的下发数据不一致,且检测到的第一告警为掉电告警情况下,确定所述待检测第一设备的掉电告警正确上报。4.根据权利要求1-3任意一项所述的告警检测方法,其特征在于,所述根据判断结果和检测到的所述待检测第一设备的第一告警确定所述待检测第一设备的第二告警是否正确上报后,该方法还包括:根据所述待检测第一设备的第二告警是否正确上报,保存或更新所述待检测第一设备的设备信息、表征所述第二告警是否曾经正常上报的信息和表征所述待检测第一设备的掉电能力的信息之间的对应关系。5.根据权利要求4所述的告警检测方法,其特征在于,该方法还包括:在检测到某一个pon口的pon los告警或小区掉电告警的情况下,确定所述某一个pon口下的第一设备中与所述pon los告警或所述小区掉电告警关联的第一设备;根据所述与所述pon los告警或所述小区掉电告警关联的第一设备对应的对应关系更新所述pon los告警或所述小区掉电告警。6.根据权利要求5所述的告警检测方法,其特征在于,所述确定所述某一个pon口下的第一设备中与所述pon los告警或所述小区掉电告警关联的第一设备包括:在检测到所述pon los告警或所述小区掉电告警的时间与检测到所述某一个pon口下
的某一个第一设备的离线告警的时间之间的差值的绝对值小于或等于第四预设时间的情况下,确定所述与所述pon los告警或所述小区掉电告警关联的第一设备包括所述某一个第一设备。7.根据权利要求5所述的告警检测方法,其特征在于,所述根据所述与所述pon los告警或所述小区掉电告警关联的第一设备对应的对应关系更新所述pon los告警或所述小区掉电告警包括以下至少之一:在检测到所述某一个pon口的pon los告警,且所述与所述pon los告警关联的第一设备中存在掉电告警漏报的第一设备的数量大于或等于第一预设阈值的情况下,将所述pon los告警更新为小区掉电告警;在检测到所述某一个pon口的pon los告警,且所述与所述pon los告警关联的第一设备中存在掉电告警漏报的第一设备的相对占比大于或等于第二预设阈值的情况下,将所述pon los告警更新为小区掉电告警;在检测到所述某一个pon口的小区掉电告警,且所述与所述小区掉电告警关联的第一设备中存在掉电告警为虚假告警的第一设备的数量大于或等于第一预设阈值的情况下,将所述小区掉电告警更新为pon los告警;在检测到所述某一个pon口的小区掉电告警,且所述与所述小区掉电告警关联的第一设备中存在掉电告警为虚假告警的第一设备的相对占比大于或等于第二预设阈值的情况下,将所述小区掉电告警更新为pon los告警。8.根据权利要求1-3任意一项所述的告警检测方法,其特征在于,在所述待检测第一设备重新上线时间和离线时间之间的差值大于或等于第一预设时间的情况下,继续执行所述判断所述待检测第一设备的上报数据与第二设备中保存的所述待检测第一设备的下发数据是否一致的步骤。9.根据权利要求8所述的告警检测方法,其特征在于,在所述待检测第一设备重新上线时间和离线时间之间的差值小于或等于第二预设时间的情况下,该方法还包括:获取所述待检测第一设备的运行时长;根据所述待检测第一设备的运行时长和重新上线时长之间的差值是否大于或等于第三预设时间,确定所述待检测第一设备是否重启。10.根据权利要求9所述的告警检测方法,其特征在于,所述根据所述待检测第一设备的运行时长和重新上线时长之间的差值是否大于或等于第三预设时间,确定所述待检测第一设备是否重启包括以下至少之一:在所述待检测第一设备的运行时长和重新上线时长之间的差值大于或等于所述第三预设时间的情况下,确定所述待检测第一设备未重启;在所述待检测第一设备的运行时长和重新上线时长之间的差值小于所述第三预设时间的情况下,确定所述待检测第一设备重启。11.根据权利要求10所述的告警检测方法,其特征在于,所述确定所述待检测第一设备重启后,该方法还包括:根据所述待检测第一设备的第一告警,以及保存的所述待检测第一设备的设备信息、表征所述第二告警是否曾经正常上报的信息和表征所述待检测第一设备的掉电能力的信息之间的对应关系确定所述待检测第一设备的重启类型。
12.根据权利要求11所述的告警检测方法,其特征在于,所述表征所述待检测第一设备的掉电能力的信息包括:表征所述待检测第一设备的掉电告警是否为虚假告警的信息,以及表征所述待检测第一设备的掉电告警是否漏报的信息;所述确定所述待检测第一设备的重启类型包括以下至少之一:在所述第一告警为离线告警,且所述对应关系中表征所述待检测第一设备的掉电告警是否漏报的信息为表征所述待检测第一设备的掉电告警没有漏报的信息的情况下,确定所述重启类型为软件重启;在所述第一告警为离线告警,且所述对应关系中表征所述待检测第一设备的掉电告警是否漏报的信息为表征所述待检测第一设备的掉电告警漏报的信息的情况下,确定所述重启类型为断电重启;在所述第一告警为掉电告警,且所述对应关系中表征所述待检测第一设备的掉电告警是否为虚假告警的信息为表征所述待检测第一设备的掉电告警不是虚假告警的信息的情况下,确定所述重启类型为断电重启;在所述第一告警为掉电告警,且所述对应关系中表征所述待检测第一设备的掉电告警是否为虚假告警的信息为表征所述待检测第一设备的掉电告警为虚假告警的信息的情况下,确定所述重启类型为软件重启。13.一种电子设备,其特征在于,包括:至少一个处理器;存储器,所述存储器上存储有至少一个程序,当所述至少一个程序被所述至少一个处理器执行时,实现权利要求1-12任意一项所述的告警检测方法。14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-12任意一项所述的告警检测方法。

技术总结
本申请实施例提供了一种告警检测方法、电子设备、计算机可读存储介质,告警检测方法包括:在待检测第一设备离线且重新上线后,判断所述待检测第一设备的上报数据与第二设备中保存的所述待检测第一设备的下发数据是否一致;根据判断结果和检测到的所述待检测第一设备的第一告警确定所述待检测第一设备的第二告警是否正确上报。告警是否正确上报。告警是否正确上报。


技术研发人员:余辰东
受保护的技术使用者:中兴通讯股份有限公司
技术研发日:2022.01.28
技术公布日:2023/8/9
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐