基于交叉心跳监测的自动备援方法、系统、设备及介质与流程
未命名
07-19
阅读:138
评论:0
1.本发明涉及计算机安全技术领域,特别是涉及一种基于交叉心跳监测的自动备援方法、系统、设备及介质。
背景技术:
2.随着linux在关键行业应用的逐渐增多,它必将提供一些原来由ibm和sun这样的大型商业公司所提供的服务,这些商业公司所提供的服务都有一个关键特性,就是高可用集群。
3.高可用集群是指一组通过硬件和软件连接起来的独立计算机,它们在用户面前表现为一个单一系统,在这样的一组计算机系统内部的一个或者多个节点停止工作,服务会从故障节点切换到正常工作的节点上运行,不会引起服务中断。从这个定义可以看出,集群必须检测节点和服务何时失效,何时恢复为可用。这个任务通常由一组被称为“心跳”的代码完成。在linux-ha里这个功能由一个叫做heartbeat的程序完成。
4.现有技术针对一种基于心跳监听实现失效自动备援的技术采取的技术方案为在heartbeat monitor的失效备援call interface redundant方法内,增加针对步骤实例的失效备援方法。
5.该技术的缺点为:在双机热备高可用系统中,当联系2个节点的心跳线断开时,本来作为一个整体,动作协调的ha系统,就分裂为2个独立的个体;由于相互失去了联系,都以为对方出了故障,2个节点上的ha软件像裂脑人一样本能的争抢共享资源争取应用服务,就会发生严重后果,或者共享资源被瓜分,两边服务都起不来了。或者是两边服务都起来了,但同时读写共享存储,导致数据损坏。
6.发生脑裂的时候,对业务的影响是极其严重的,有的时候甚至是致命的。如果是应用在数据库或者是存储服务这种极重要的高可用上,那就导致用户发布的数据间断的写在两台服务器上的恶果,最终数据恢复非常困难或者是难以恢复。
7.由此可见,上述现有的自动备援方法在使用上,显然仍存在有不便与缺陷,而亟待加以进一步改进。如何能创设一种新的自动备援方法,成为当前业界急需改进的目标。
技术实现要素:
8.有鉴于此,本公开实施例提供一种基于交叉心跳监测的自动备援方法,至少部分解决现有技术中存在的问题。
9.第一方面,本公开实施例提供了一种基于交叉心跳监测的自动备援方法,所述方法包括以下步骤:通过心跳监测功能监控各个调度服务器的应用服务状态;以预设的频率在所述调度服务器间通过报文传递所述应用服务状态信息;其中,当预设的时间内未收到第一调度服务器发送的报文时,判断所述第一调度服务器中的数据库状态更新和注册中心服务是否异常;其中,
当所述数据库状态更新异常,所述注册中心的各个执行器服务正常时,将当前任务从注册中心移除,并触发失效备援;当所述注册中心的各个执行器服务异常,所述数据库状态更新正常时,将当前任务从注册中心移除,不做失效备援;以及,当所述注册中心的各个执行器服务异常,数据库状态更新同时发生异常时,将当前任务从注册中心移除,并触发失效备援;当进行失效备援时,将所述第一调度服务器置为不可用状态,由第二调度服务器接管运行在所述第一调度服务器上的应用服务。
10.根据本公开实施例的一种具体实现方式,判断所述第一调度服务器中的数据库状态更新和注册中心服务是否异常,包括:比较所述第一调度服务器中数据库的更新时间和当前系统时间,当数据库的更新时间超过当前系统时间多于6分钟时,判断所述数据库状态更新异常,当数据库的更新时间超过当前系统时间少于等于6分钟时,判断所述数据库状态更新正常;判断所述应用服务注册中心中的执行器服务是否异常。
11.根据本公开实施例的一种具体实现方式,所述由第二调度服务器接管运行在所述第一调度服务器上的应用服务,包括:将所述第一调度服务器的应用服务中待执行任务置为待恢复状态;所述第二调度服务器通过引擎轮询计算获取待恢复状态的待执行任务,并将所述待执行任务发送给所述第二调度服务器中的应用服务运行,所述第二调度服务器中的应用服务通过调用恢复执行器,对将所述待恢复状态的待执行任务进行恢复操作。
12.根据本公开实施例的一种具体实现方式,所述方法还包括:当所述第一调度服务器异常时,调度服务器间通过抢占方式对所述第一调度服务器上的任务进行失效备援。
13.根据本公开实施例的一种具体实现方式,所述抢占方式通过redis的分布式锁机制实现,当发现锁已经被占用时,则放弃失效备援。
14.根据本公开实施例的一种具体实现方式,所述方法应用于单中心高可用部署架构、两地双中心部署架构或两地三中心部署架构中。
15.第二方面,本公开实施例提供了一种基于交叉心跳监测的自动备援方法系统,所述系统包括:心跳监测模块,被配置用于通过心跳监测功能监控各个调度服务器的应用服务状态;判断模块,被配置用于以预设的频率在所述调度服务器间通过报文传递所述应用服务状态信息;其中,当预设的时间内未收到第一调度服务器发送的报文时,判断所述第一调度服务器中的数据库状态更新和注册中心服务是否异常;其中,当所述数据库状态更新异常,所述注册中心的各个执行器服务正常时,将当前任务从注册中心移除,并触发失效备援;当所述注册中心的各个执行器服务异常,所述数据库状态更新正常时,将当前任务从注册中心移除,不做失效备援;以及,当所述注册中心的各个执行器服务异常,数据库状态更新同时发生异常时,将当前任务从注册中心移除,并触发失效备援;失效备援模块,被配置用于当进行失效备援时,将所述第一调度服务器置为不可
用状态,由第二调度服务器接管运行在所述第一调度服务器上的应用服务。
16.根据本公开实施例的一种具体实现方式,所述失效备援模块通过将所述第一调度服务器的应用服务中待执行任务置为待恢复状态;所述第二调度服务器通过引擎轮询计算获取待恢复状态的待执行任务,并将所述待执行任务发送给所述第二调度服务器中的应用服务运行,所述第二调度服务器中的应用服务通过调用恢复执行器,对将所述待恢复状态的待执行任务进行恢复操作。
17.第三方面,本公开实施例还提供了一种电子设备,该电子设备包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有能够被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行时,使所述至少一个处理器前述第一方面或第一方面的任一实现方式中的任一项所述的基于交叉心跳监测的自动备援方法。
18.第四方面,本公开实施例还提供了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令当由至少一个处理器执行时使所述至少一个处理器执行前述第一方面或第一方面的任一实现方式中的基于交叉心跳监测的自动备援方法。
19.第五方面,本公开实施例还提供了一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使该计算机执行前述第一方面或第一方面的任一实现方式中的基于交叉心跳监测的自动备援方法。
20.本公开实施例中的基于交叉心跳监测的自动备援方法,通过心跳监控触发失效备援,在失效备援时通过修改任务的状态,配合引擎轮询及引擎驱动,完成任务的恢复,保证了平台的高可用、业务的连续性、准确性和可靠性,并且可以在短时间内快速处理大量的任务。
附图说明
21.上述仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,以下结合附图与具体实施方式对本发明作进一步的详细说明。
22.图1为本公开实施例提供的一种基于交叉心跳监测的自动备援方法流程示意图;图2为本公开实施例提供的一种心跳监测模块的主要业务流程示意图;图3为本公开实施例提供的一种失效备援的业务流程示意图;图4为本公开实施例提供的一种失效备援逻辑架构示意图;图5为本公开实施例提供的一种高性能集群组成示意图;图6为本公开实施例提供的一种单中心的高可用部署架构示意图;图7为本公开实施例提供的一种两地双中心部署架构示意图;图8为本公开实施例提供的一种两地三中心部署架构示意图;图9为本公开实施例提供的一种基于交叉心跳监测的自动备援方法系统结构示意图;以及图10为本公开实施例提供的电子设备示意图。
具体实施方式
23.下面结合附图对本公开实施例进行详细描述。
24.以下通过特定的具体实例说明本公开的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本公开的其他优点与功效。显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。本公开还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本公开的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
25.需要说明的是,下文描述在所附权利要求书的范围内的实施例的各种方面。应显而易见,本文中所描述的方面可体现于广泛多种形式中,且本文中所描述的任何特定结构及/或功能仅为说明性的。基于本公开,所属领域的技术人员应了解,本文中所描述的一个方面可与任何其他方面独立地实施,且可以各种方式组合这些方面中的两者或两者以上。举例来说,可使用本文中所阐述的任何数目个方面来实施设备及/或实践方法。另外,可使用除了本文中所阐述的方面中的一或多者之外的其他结构及/或功能性实施此设备及/或实践此方法。
26.另外,在以下描述中,提供具体细节是为了便于透彻理解实例。然而,所属领域的技术人员将理解,可在没有这些特定细节的情况下实践所述方面。
27.本发明实施例提供了一种基于交叉心跳监测的自动备援方法,通过心跳监控触发失效备援,在失效备援时通过修改任务的状态,配合引擎轮询及引擎驱动,完成任务的恢复,保证了平台的高可用和业务的连续性。
28.ha(high available,高可用)又被叫做双机热备,用于关键业务。一般场景是,有两个业务节点服务器a和服务器b,当一台服务器出现故障时,可由另一台服务器承担服务任务,从而在不需要人工干预的情况下,自动保证系统能持续对外提供服务。
29.heartbeat是一款开源提供高可用(high-available)服务的软件,通过heartbeat可以将资源(ip及程序服务等资源)从一台已经故障的计算机快速转移到另一台正常运转的机器上继续提供服务。
30.heartbeat (linux-ha)的工作原理:heartbeat 最核心的包括两个部分,心跳监测部分和资源接管部分,心跳监测可以通过网络链路和串口进行,而且支持冗余链路,它们之间相互发送报文来告诉对方自己当前的状态,如果在指定的时间内未收到对方发送的报文,那么就认为对方失效,这时需启动资源接管模块来接管运行在对方主机上的资源或者服务。
31.图1为本公开实施例提供的基于交叉心跳监测的自动备援方法流程的示意图。
32.如图1所示,在步骤s110处,通过心跳监测功能监控各个调度服务器的应用服务状态。
33.在本发明实施例中,所述的各个调度服务器为两个及两个以上的调度服务器。
34.更具体地,接下来转到步骤s120。
35.在步骤s120处,以预设的频率在所述调度服务器间通过报文传递所述应用服务状态信息。
36.举例来说,预设的频率可以为3分钟,即每3分钟在所有调度服务器间通过报文互相发送应用服务状态信息。
37.更具体地,接下来转到步骤s130。
38.在步骤s130处,当预设的时间内未收到第一调度服务器发送的报文时,判断所述第一调度服务器中的数据库状态更新和注册中心服务是否异常。
39.更具体地,当超过9分钟未收到某一调度服务器(即第一调度服务器)的报文时,判断该服务器数据库状态更新和注册中心服务是否发生异常。
40.在本发明实施例中,判断所述第一调度服务器中的数据库状态更新和注册中心服务是否异常,包括:比较所述第一调度服务器中数据库的更新时间和当前系统时间,当数据库的更新时间超过当前系统时间多于6分钟时,判断所述数据库状态更新异常,当数据库的更新时间超过当前系统时间少于等于6分钟时,判断所述数据库状态更新正常;判断所述应用服务注册中心中的执行器服务是否异常(即服务引擎是否能够进行正常任务处理及对外服务)。
41.在本发明实施例中,数据库的更新时间超过当前系统时间可以自定义配置为其他时间,但最佳失效备援时间为6分钟。
42.更具体地,如图2所示,心跳监控主要实现调度服务器自身状态更新、应用服务检查、触发失效备援三个功能:自身状态更新:调度服务器中的每个执行器服务以一定的频率更新数据库的状态,例如,当初始频率为3分钟,即每3分钟更新一次自身状态及修改时间。
43.应用服务检查:应用主要分为三个步骤:第一步:查询数据库中每个服务的更新时间,将更新时间与当前系统时间做比较,判断是否超过6分钟;其中,当未超过6分钟时,认为数据库状态更新正常;当超过6分钟时,认为数据库状态更新异常;第二步:查询注册中心中各个执行器服务是否正常;第三步:根据查询情况判断是否异常触发失效备援功能。其中,触发失效备援的处理规则分为三种,第一种数据库状态更新异常,注册中心的服务正常,则将当前任务从注册中心移除,并且触发失效备援功能;第二种注册中心服务异常,数据库状态更新正常,则将当前任务从注册中心移除,不做失效备援。第三种注册中心内服务异常,数据库状态更新同时发生异常,则将当前任务从注册中心移除,并且触发失效备援。
44.更具体地,接下来转到步骤s140。
45.在步骤s140处,当所述数据库状态更新异常,所述注册中心的各个执行器服务正常时,将当前任务从注册中心移除,并触发失效备援。
46.更具体地,接下来转到步骤s150。
47.在步骤s150处,当所述注册中心的各个执行器服务异常,所述数据库状态更新正常时,将当前任务从注册中心移除,不做失效备援。
48.更具体地,接下来转到步骤s160。
49.在步骤s160处,当所述注册中心的各个执行器服务异常,数据库状态更新同时发生异常时,将当前任务从注册中心移除,并触发失效备援。
50.更具体地,接下来转到步骤s170。
51.在步骤s170处,当进行失效备援时,将所述第一调度服务器置为不可用状态,由第二调度服务器接管运行在所述第一调度服务器上的应用服务在本发明实施例中,所述由第二调度服务器接管运行在所述第一调度服务器上的应用服务,包括:将所述第一调度服务器的应用服务中待执行任务置为待恢复状态;所述第二调度服务器通过引擎轮询计算获取待恢复状态的待执行任务,并将所述待执行任务发送给所述第二调度服务器中的应用服务运行,所述第二调度服务器中的应用服务通过调用恢复执行器,对将所述待恢复状态的待执行任务进行恢复操作。
52.更具体地,失效备援是将运行在宕机服务上的任务置为待恢复状态,引擎轮询计算获取待恢复任务后,将任务发送给其他调度服务器运行,其他调度服务器通过调用恢复执行器,对任务进行恢复操作。
53.在本发明实施例中,所述方法还包括:当所述第一调度服务器异常时,调度服务器间通过抢占方式对所述第一调度服务器上的任务进行失效备援。所述抢占方式通过redis的分布式锁机制实现,当发现锁已经被占用时,则放弃失效备援(如图3所示)。
54.在本发明实施例中,如图6-8所示, 所述方法应用于单中心高可用部署架构、两地双中心部署架构或两地三中心部署架构中。
55.失效备援功能是为了保证平台的高可用和业务的连续性,通过心跳监控触发失效备援,在失效备援时通过修改任务的状态,配合引擎轮询及引擎驱动,完成任务的恢复。
56.图4为本公开实施例提供的一种失效备援逻辑架构示意图;该系统由应用变更服务器,数据存储、客户端应用、agent远程代理以及集成功能等部分组成,是一个典型的四层架构。
57.用户层基于系统提供的如流程设计、版本管理、变更管理、权限控制等调度功能,提供了3个重要的工具允许开发人员及管理员进行变更流程设计、变更调度及变更过程监控。
58.系统核心层为调度引擎,为了保证高可用,调度引擎具备了调度集群、心跳检测、负载均衡及失效备援高可用机制。
59.图5为本公开实施例提供的一种高性能集群组成示意图;数据中心及开发中心分别部署应用变更自动化系统,这两套平台相互独立。通过版本管理,对应用程序变更版本进行统一管理。平台由调度服务器、数据库、客户端管理程序、远程代理端及第三方接口模板构成。
60.图6为本公开实施例提供的一种单中心的高可用部署架构示意图;应用服务采用集群模式,通过失效备源、灾难恢复等一系列策略保证业务安全。
61.图7为本公开实施例提供的一种两地双中心部署架构示意图;两地双中心的异地灾备模式工作机制如下:(1)生产中心entegor服务器采用集群模式,通过失效备援以及灾难恢复等机制保障生产中心自身的运维安全。
62.(2)生产中心与灾备中心通过数据库备份技术,实现自动化运维平台执行信息的同步共享。灾备切换时,灾备中心应用服务器根据数据库信息完整恢复所有任务,在灾备中心继续执行应用系统的任务,保持系统集成功能,实现无缝切换。
63.(3)业务系统的任务程序,依据规范加强事务管理健壮性,出现灾备切换时,允许
任务重新提交并自行判断事务处理。
64.(4)业务系统服务器ip列表提供管理模式,entegor默认主ip驱动支持,提供切换开关。
65.图8为本公开实施例提供的一种两地三中心部署架构示意图;同城灾备中心的建设,可依据两地双中心方案中提到的模式进行。具备条件的同城灾备中心,不仅在发生意外时提供灾备服务,平时还可以作为生产中心的补充,对外提供服务。
66.本发明提出的基于交叉心跳监测的自动备援方法通过心跳监控触发失效备援,在失效备援时通过修改任务的状态,配合引擎轮询及引擎驱动,完成任务的恢复,优点在于:高可用性:集群中一个节点失效,它的任务可以传递给其他节点,有效防止单点失效;高性能:负载均衡集群允许系统同时介入更多的用户;高性价比:可以采用廉价的符合工业标准的硬件构造高性能的系统。
67.图9示出了本发明提供的基于交叉心跳监测的自动备援方法系统900,包括心跳监测模块910、判断模块920和失效备援模块930。
68.心跳监测模块910用于通过心跳监测功能监控各个调度服务器的应用服务状态;判断模块920用于以预设的频率在所述调度服务器间通过报文传递所述应用服务状态信息;其中,当预设的时间内未收到第一调度服务器发送的报文时,判断所述第一调度服务器中的数据库状态更新和注册中心服务是否异常;其中,当所述数据库状态更新异常,所述注册中心的各个执行器服务正常时,将当前任务从注册中心移除,并触发失效备援;当所述注册中心的各个执行器服务异常,所述数据库状态更新正常时,将当前任务从注册中心移除,不做失效备援;以及,当所述注册中心的各个执行器服务异常,数据库状态更新同时发生异常时,将当前任务从注册中心移除,并触发失效备援;失效备援模块930用于当进行失效备援时,将所述第一调度服务器置为不可用状态,由第二调度服务器接管运行在所述第一调度服务器上的应用服务。
69.在本发明实施例中,所述失效备援模块通过将所述第一调度服务器的应用服务中待执行任务置为待恢复状态;所述第二调度服务器通过引擎轮询计算获取待恢复状态的待执行任务,并将所述待执行任务发送给所述第二调度服务器中的应用服务运行,所述第二调度服务器中的应用服务通过调用恢复执行器,对将所述待恢复状态的待执行任务进行恢复操作。
70.参见图10,本公开实施例还提供了一种电子设备100,该电子设备包括:至少一个处理器;以及,与该至少一个处理器通信连接的存储器;其中,该存储器存储有可被该至少一个处理器执行的指令,该指令被该至少一个处理器执行,以使该至少一个处理器能够执行前述方法实施例中的基于交叉心跳监测的自动备援方法。
71.本公开实施例还提供了一种非暂态计算机可读存储介质,该非暂态计算机可读存储介质存储计算机指令,该计算机指令用于使该计算机执行前述方法实施例中的基于交叉心跳监测的自动备援方法。
72.本公开实施例还提供了一种计算机程序产品,该计算机程序产品包括存储在非暂态计算机可读存储介质上的计算程序,该计算机程序包括程序指令,当该程序指令被计算机执行时,使该计算机执行前述方法实施例中的基于交叉心跳监测的自动备援方法。
73.下面参考图10,其示出了适于用来实现本公开实施例的电子设备100的结构示意图。本公开实施例中的电子设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、pda(个人数字助理)、pad(平板电脑)、pmp(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字tv、台式计算机等等的固定终端。图10示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
74.如图10所示,电子设备100可以包括处理装置(例如中央处理器、图形处理器等)1001,其可以根据存储在只读存储器(rom)1002中的程序或者从存储装置1008加载到随机访问存储器(ram)1003中的程序而执行各种适当的动作和处理。在ram 1003中,还存储有电子设备100操作所需的各种程序和数据。处理装置1001、rom 1002以及ram 1003通过总线1004彼此相连。输入/输出(i/o)接口1005也连接至总线1004。
75.通常,以下装置可以连接至i/o接口1005:包括例如触摸屏、触摸板、键盘、鼠标、图像传感器、麦克风、加速度计、陀螺仪等的输入装置1006;包括例如液晶显示器(lcd)、扬声器、振动器等的输出装置1007;包括例如磁带、硬盘等的存储装置1008;以及通信装置1009。通信装置1009可以允许电子设备100与其他设备进行无线或有线通信以交换数据。虽然图中示出了具有各种装置的电子设备100,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
76.特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置1009从网络上被下载和安装,或者从存储装置1008被安装,或者从rom 1002被安装。在该计算机程序被处理装置1001执行时,执行本公开实施例的方法中限定的上述功能。
77.需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、rf(射频)等等,或者上述
的任意合适的组合。
78.上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
79.上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:获取至少两个网际协议地址;向节点评价设备发送包括所述至少两个网际协议地址的节点评价请求,其中,所述节点评价设备从所述至少两个网际协议地址中,选取网际协议地址并返回;接收所述节点评价设备返回的网际协议地址;其中,所获取的网际协议地址指示内容分发网络中的边缘节点。
80.或者,上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:接收包括至少两个网际协议地址的节点评价请求;从所述至少两个网际协议地址中,选取网际协议地址;返回选取出的网际协议地址;其中,接收到的网际协议地址指示内容分发网络中的边缘节点。
81.可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如java、smalltalk、c++,还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(lan)或广域网(wan)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
82.附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
83.描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定,例如,第一获取单元还可以被描述为“获取至少两个网际协议地址的单元”。
84.应当理解,本公开的各部分可以用硬件、软件、固件或它们的组合来实现。
85.以上所述,仅为本公开的具体实施方式,但本公开的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本公开揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本公开的保护范围之内。因此,本公开的保护范围应以权利要求的保护范围为准。
技术特征:
1.一种基于交叉心跳监测的自动备援方法,其特征在于,所述方法包括以下步骤:通过心跳监测功能监控各个调度服务器的应用服务状态;以预设的频率在所述调度服务器间通过报文传递所述应用服务状态信息;其中,当预设的时间内未收到第一调度服务器发送的报文时,判断所述第一调度服务器中的数据库状态更新和注册中心服务是否异常;其中,当所述数据库状态更新异常,所述注册中心的各个执行器服务正常时,将当前任务从注册中心移除,并触发失效备援;当所述注册中心的各个执行器服务异常,所述数据库状态更新正常时,将当前任务从注册中心移除,不做失效备援;以及,当所述注册中心的各个执行器服务异常,数据库状态更新同时发生异常时,将当前任务从注册中心移除,并触发失效备援;当进行失效备援时,将所述第一调度服务器置为不可用状态,由第二调度服务器接管运行在所述第一调度服务器上的应用服务。2.根据权利要求1所述的基于交叉心跳监测的自动备援方法,其特征在于,判断所述第一调度服务器中的数据库状态更新和注册中心服务是否异常,包括:比较所述第一调度服务器中数据库的更新时间和当前系统时间,当数据库的更新时间超过当前系统时间多于6分钟时,判断所述数据库状态更新异常,当数据库的更新时间超过当前系统时间少于等于6分钟时,判断所述数据库状态更新正常;判断所述应用服务注册中心中的执行器服务是否异常。3.根据权利要求1所述的基于交叉心跳监测的自动备援方法,其特征在于,所述由第二调度服务器接管运行在所述第一调度服务器上的应用服务,包括:将所述第一调度服务器的应用服务中待执行任务置为待恢复状态;所述第二调度服务器通过引擎轮询计算获取待恢复状态的待执行任务,并将所述待执行任务发送给所述第二调度服务器中的应用服务运行,所述第二调度服务器中的应用服务通过调用恢复执行器,对将所述待恢复状态的待执行任务进行恢复操作。4.根据权利要求3所述的基于交叉心跳监测的自动备援方法,其特征在于,所述方法还包括:当所述第一调度服务器异常时,调度服务器间通过抢占方式对所述第一调度服务器上的任务进行失效备援。5.根据权利要求4所述的基于交叉心跳监测的自动备援方法,其特征在于,所述抢占方式通过redis的分布式锁机制实现,当发现锁已经被占用时,则放弃失效备援。6.根据权利要求1-5中任意一项所述的基于交叉心跳监测的自动备援方法,其特征在于,所述方法应用于单中心高可用部署架构、两地双中心部署架构或两地三中心部署架构中。7.一种基于交叉心跳监测的自动备援方法系统,其特征在于,所述系统包括:心跳监测模块,被配置用于通过心跳监测功能监控各个调度服务器的应用服务状态;判断模块,被配置用于以预设的频率在所述调度服务器间通过报文传递所述应用服务状态信息;其中,当预设的时间内未收到第一调度服务器发送的报文时,判断所述第一调度服务器中的数据库状态更新和注册中心服务是否异常;其中,当所述数据库状态更新异常,
所述注册中心的各个执行器服务正常时,将当前任务从注册中心移除,并触发失效备援;当所述注册中心的各个执行器服务异常,所述数据库状态更新正常时,将当前任务从注册中心移除,不做失效备援;以及,当所述注册中心的各个执行器服务异常,数据库状态更新同时发生异常时,将当前任务从注册中心移除,并触发失效备援;失效备援模块,被配置用于当进行失效备援时,将所述第一调度服务器置为不可用状态,由第二调度服务器接管运行在所述第一调度服务器上的应用服务。8.根据权利要求7所述的基于交叉心跳监测的自动备援方法系统,其特征在于,所述失效备援模块通过将所述第一调度服务器的应用服务中待执行任务置为待恢复状态;所述第二调度服务器通过引擎轮询计算获取待恢复状态的待执行任务,并将所述待执行任务发送给所述第二调度服务器中的应用服务运行,所述第二调度服务器中的应用服务通过调用恢复执行器,对将所述待恢复状态的待执行任务进行恢复操作。9.一种电子设备,其特征在于,该电子设备包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有能够被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行时,使所述至少一个处理器执行如权利要求1至6中的任一项所述的基于交叉心跳监测的自动备援方法。10.一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令当由至少一个处理器执行时使所述至少一个处理器执行如权利要求1至6中的任一项所述的基于交叉心跳监测的自动备援方法。
技术总结
本发明公开了一种基于交叉心跳监测的自动备援方法、系统、设备及介质,所述方法包括:通过心跳监测功能监控各个调度服务器的应用服务状态;以预设的频率在所述调度服务器间通过报文传递所述应用服务状态信息;其中,当预设的时间内未收到第一调度服务器发送的报文时,判断所述第一调度服务器中的数据库状态更新和注册中心服务是否异常,并判断是否触发失效备援;当进行失效备援时,将所述第一调度服务器置为不可用状态,由第二调度服务器接管运行在所述第一调度服务器上的应用服务。通过本公开的处理方案,保证了平台的高可用性和业务的连续性。的连续性。的连续性。
技术研发人员:姜全尧 张静波 邢翠霞 宫喜斌 刘英莉
受保护的技术使用者:北京理想信息科技有限公司
技术研发日:2023.06.14
技术公布日:2023/7/18
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
