分布式系统重启方法、装置、系统及存储介质与流程

未命名 09-20 阅读:121 评论:0


1.本发明涉及数据通信领域,具体而言,涉及一种分布式系统重启方法、装置、系统及存储介质。


背景技术:

2.分布式系统一般由主控卡(main processing unit,mpu)、业务卡(line processing unit,lpu)、交换卡(switch fabric unit,sfu)、电源、风扇、机框等组件组成。通常情况下,主控卡提供整个分布式系统的管理平面,业务卡与交换卡提供分布式系统的数据平面。
3.分布式系统通常应用在数据中心的汇聚层或核心层、园区网络的核心层等,在灾备演练、系统升级等情况下,需要进行重启。由于分布式系统为通信网络中的重要节点,对于业务中断时间极其敏感,而现有的管理平面和数据平面耦合的整系统重启方式,其业务中断时间为分钟级,易造成较大的损失。


技术实现要素:

4.为了克服现有技术的不足,有效减少业务中断时间,本发明实施例提供了一种分布式系统重启方法、装置、系统及存储介质。
5.本发明实施例的技术方案可以这样实现:
6.第一方面,本发明实施例提供一种分布式系统重启方法,应用于分布式系统中的主控卡,所述分布式系统还包括多个业务卡,所述方法包括:
7.接收系统重启请求,所述系统重启请求中携带针对所述分布式系统中多个业务卡的重启顺序决策方式;
8.根据所述重启顺序决策方式,获取所述分布式系统的运行信息;
9.根据所述运行信息,确定每个所述业务卡的重启顺序;
10.在自身完成重启后,按照每个所述业务卡的重启顺序,依次对每个所述业务卡进行重启。
11.可选地,所述运行信息包括汇聚端口配置数据和路由表项,所述汇聚端口配置数据和路由表项是所述主控卡在所述决策方式为基于流量路径的方式的情况下获取的;
12.所述根据所述运行信息,确定每个所述业务卡的重启顺序的步骤包括:
13.根据所述路由表项和所述汇聚端口配置数据,确定所述分布式系统的每个流量路径组;
14.基于全部所述流量路径组,确定每个所述业务卡的重启顺序。
15.可选地,所述流量路径组包括至少一条流量路径,所述流量路径具有设备id和业务卡id;
16.所述基于全部所述流量路径组,确定每个所述业务卡的重启顺序的步骤包括:
17.针对每个所流量路径组,若根据所述流量路径组内的每条所述流量路径的设备id
和业务卡id,确定所述流量路径组满足多路径,则将所述流量路径组作为待用路径组;
18.基于全部所述待用路径组,确定每个所述业务卡的重启顺序。
19.可选地,所述流量路径具有优先系数,所述基于全部所述待用路径组,确定每个所述业务卡的重启顺序的步骤包括:
20.根据每个所述待用路径组内的每条所述流量路径的业务卡id,确定每个所述业务卡对应的所有所述流量路径;
21.针对每个所述业务卡,将所述业务卡对应的所有所述流量路径的优先系数之和作为所述业务卡的路径权重;
22.按照每个所述业务卡的路径权重,确定每个所述业务卡的重启顺序。
23.可选地,所述根据所述路由表项和所述汇聚端口配置数据,确定所述分布式系统的每个流量路径组的步骤包括:
24.根据所述路由表项,确定所述分布式系统的每个三层路径组;
25.根据所述汇聚端口配置数据,确定所述分布式系统的每个二层路径组,得到每个所述流量路径组,所述流量路径组包括二层路径组和三层路径组。
26.可选地,所述运行信息包括系统接口数据,所述系统接口数据是所述主控卡在所述决策方式为基于流量吞吐的方式的情况下获取的;
27.所述根据所述运行信息,确定每个所述业务卡的重启顺序的步骤包括:
28.根据所述系统接口数据,确定所述分布式系统中处于连接状态的接口;
29.获取处于连接状态的接口在预设时间内统计的每个所述业务卡的业务流量;
30.按照每个所述业务卡的业务流量,确定每个所述业务卡的重启顺序。
31.可选地,所述运行信息包括系统接口数据,所述系统接口数据是所述主控卡在所述决策方式为基于流量敏感程度的方式的情况下获取的;
32.所述根据所述运行信息,确定每个所述业务卡的重启顺序的步骤包括:
33.根据所述系统接口数据,确定所述分布式系统中处于连接状态的接口;
34.获取处于连接状态的接口在预设时间内统计的每个所述业务卡的有效报文转发量,所述有效报文为携带有预设字段的报文;
35.按照每个所述业务卡的有效报文转发量,确定每个所述业务卡的重启顺序。
36.第二方面,本发明实施例提供一种分布式系统重启装置,应用于分布式系统中的主控卡,所述分布式系统还包括多个业务卡,所述装置包括:
37.接收模块,用于系统重启请求,所述系统重启请求中携带针对所述分布式系统中多个业务卡的重启顺序决策方式;
38.获取模块,用于根据所述重启顺序决策方式,获取所述分布式系统的运行信息;
39.处理模块,用于根据所述运行信息,确定每个所述业务卡的重启顺序;
40.重启模块,用于在所述主控卡完成重启后,按照每个所述业务卡的重启顺序,依次对每个所述业务卡进行重启。
41.第三方面,本发明实施例提供一种分布式系统,其包括主控卡和多个业务卡,所述主控卡烧录有计算机程序,所述计算机程序被执行时实现如前述第一方面所述的系统重启方法。
42.第四方面,本发明实施例提供一种计算机可读存储介质,其存储有计算机程序,所
述计算机程序被处理器执行时实现如前述第一方面所述的系统重启方法。
43.相较于现有技术,本发明实施例提供的分布式系统重启方法,主控卡接收携带针对所述分布式系统中多个业务卡的重启顺序决策方式的系统重启请求;根据重启顺序决策方式携带的决策方式,获取分布式系统的运行信息;根据运行信息,确定每个业务卡的重启顺序;主控卡在自身完成重启后,按照每个业务卡的重启顺序,依次对每个业务卡进行重启。由于本发明实施例通过重启顺序决策方式对应的分布式系统的运行信息,确定各业务卡的重启顺序,在主控卡完成重启后,再按照各业务卡的重启顺序依次重启各业务卡,使主控卡在重启时,所有业务卡正常运行,任一业务卡重启时,其他业务卡可以继续承载业务,从而避免分布式系统重启时出现长时间的业务中断,降低损失。
附图说明
44.为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
45.图1为本发明实施例提供的一种分布式系统的结构示意框图;
46.图2为本发明实施例提供的一种分布式系统重启方法的流程示意图;
47.图3为本发明实施例提供的一种重启顺序确定方式的流程示意图一;
48.图4为本发明实施例提供的一种重启顺序确定方式的流程示意图二;
49.图5为本发明实施例提供的一种重启顺序确定方式的流程示意图三;
50.图6为本发明实施例提供的一种应用场景示意图;
51.图7为本发明实施例提供的一种分布式系统重启装置的功能单元框图。
52.图标:100-分布式系统重启装置;101-接收模块;102-获取模块;103-处理模块;104-重启模块。
具体实施方式
53.为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
54.因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
55.应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
56.需要说明的是,在不冲突的情况下,本发明的实施例中的特征可以相互结合。
57.分布式系统一般由主控卡(main processing unit,mpu)、业务卡(line processing unit,lpu)、交换卡(switch fabric unit,sfu)、电源、风扇、机框等组件组成。
58.主控卡通常提供整个分布式系统的管理平面。管理平面完成分布式系统的运行状态监控(如检测各卡及电源等是否在位)、日志与告警信息处理、系统版本管理维护、分布式系统的协议处理、业务调度、路由计算等。
59.业务卡与交换网板通常提供分布式系统的数据平面。数据平面在高速无阻塞数据通道下,提供可靠的数据转发,实现各业务模块之间的业务交换功能。
60.分布式系统通常应用在数据中心的汇聚层或核心层,园区网络的核心层等。对于分布式系统,一般情况下,不执行重启动作。但在灾备演练、系统升级等情况下,需要执行重启动作。但是由于分布式系统处于重要节点,对于业务中断时间极其敏感,较长时间中断可能带来较大损失,影响重大行业(如医疗、金融、国防等)的业务运行,因此需要保证业务中断时间尽可能少。
61.目前,分布式系统重启的方法主要有两种,一种是整系统重启,另一种是issu(in-service software upgrade,在线业务软件升级)重启。
62.整系统重启是采用管理平面与数据平面耦合的方式进行,即在主控卡复位时,管理平面与数据平面都会被同时复位,导致在完成重启前,分布式系统长时间处于中断状态,业务中断时间为分钟级。
63.issu重启是采用管理平面与数据平面解耦合的方式进行,在主控卡复位时,管理平面复位,数据平面继续工作。通过对主控卡、备用主控卡采用分别复位的方式(明确限制需要配置主控卡1:1冗余备份),实现升级重启。对于数据平面,在升级前后版本差异较小的情况下,采用在线升级方式,无需复位业务卡即可实现业务卡的升级。在升级前后版本差异较大的情况下,基于复位数据转发核的方式实现业务卡的升级。
64.上述两种重启方法,前者业务中断时间长,后者则对分布式系统的硬件配置有强制性要求(如需要配置主控卡1:1冗余备份),业务中断时间与issu支持情况相关,在版本差异较大情况下,无法实现。
65.为了有效减少业务中断时间,本发明实施例提供了一种分布式系统重启方法,下面将进行详细介绍。
66.请参照图1,分布式系统包括主控卡,多个业务卡和多个交换网板,主控卡能够管理所有业务卡和所有交换网板,主控卡与分布式系统外部的电子设备通信连接,本发明实施例提供的分布式系统重启应用在分布式系统中的主控卡上。
67.请参照图2,该分布式系统重启方法包括步骤s101~s103。
68.s101,接收系统重启请求。
69.其中,所述系统重启请求中携带针对所述分布式系统中多个业务卡的重启顺序决策方式,主控卡接收到系统重启请求的方式可以是网页方式、cli(command-line interface,命令行界面)命令方式、网管设备或装置下发(如netconf、snmp等)。
70.s102,根据重启顺序决策方式,获取分布式系统的运行信息。
71.其中,决策方式有三种,分别是基于流量路径的方式、基于流量吞吐的方式和基于流量敏感程度的方式。
72.不同的决策方式对应的运行信息是不同的,在本发明实施例中,当决策方式为基于流量路径的方式时,获取的运行信息包括汇聚端口配置数据和路由表项,当决策方式为基于流量吞吐的方式或基于流量敏感程度的方式时,获取的运行信息包括系统接口数据。
73.s103,根据运行信息,确定每个业务卡的重启顺序。
74.在本发明实施例中,步骤s103的“根据运行信息,确定每个业务卡的重启顺序”的实现过程存在以下三种情况:
75.情况一:运行信息包括汇聚端口配置数据和路由表项,汇聚端口配置数据和路由表项是在决策方式为基于流量路径的方式的情况下从主控卡获取的。
76.请参照图3,步骤s103中的“根据运行信息,确定每个业务卡的重启顺序”的实现过程可以包括步骤s201~s202。
77.s201,根据路由表项和汇聚端口配置数据,确定分布式系统的每个流量路径组。
78.其中,流量路径组包括二层路径组和三层路径组。
79.可选地,步骤s201的实现过程可以如下:
80.s201-1,根据路由表项,确定分布式系统的每个三层路径组。
81.示例性地,路由表项中的一个三层路径组的原始信息如下:
82.10.1.32.11/32[10/0]via 10.1.96.22,1d:06:38:15,100ge0/0/49
[0083]
[10/0]via 10.1.96.18,4d:06:04:27,100ge0/0/50
[0084]
[10/0]via 10.1.96.28,5d:01:23:07,100ge0/1/49
[0085]
[10/0]via 10.1.96.30,5d:01:23:07,100ge0/1/50
[0086]
根据该三层路径组的原始信息,得到如下表所示的三层路径组:
[0087]
路径组序号目标路径出接口设备id业务卡id优先系数110.1.32.110/0/49006110.1.32.110/0/50006110.1.32.110/1/49018110.1.32.110/1/50018
[0088]
即序号为1的三层路径组包括4条具有相同目标路径的三层路径,4条三层路径在出入口、设备id、业务卡id以及优先系数上存在差别。
[0089]
其中,优先系数可以通过配置的方式进行设定,既可以基于业务卡,给不同业务卡上的三层路径设定不同的优先系数,例如,给在业务卡0上的三层路径设定优先系数为6,给在业务卡1上的三层路径设定优先系数为8。也可以基于具体三层路径进行一对一设定。
[0090]
s201-2,根据汇聚端口配置数据,确定分布式系统的每个二层路径组。
[0091]
通常情况下,可以将一个二层汇聚组看作一个二层路径组,二层汇聚组中的一个端口就标识一个二层路径。
[0092]
示例性地,汇聚端口配置数据中的一个二层路径组的原始信息如下:
[0093]
link aggregation 1
[0094]
number of ports in total:6
[0095]
number of ports at attached:4
[0096]
gigabitethernet0/0/43:attached
[0097]
gigabitethernet0/0/44:attached
[0098]
gigabitethernet0/0/45:detached
[0099]
gigabitethernet0/1/43:attached
[0100]
gigabitethernet0/1/44:attached
[0101]
gigabitethernet0/1/45:detached
[0102]
根据该二层路径组的原始信息,得到如下表所示的二层路径组:
[0103]
路径组序号目标路径设备id业务卡id优先系数2link10022link10022link10142link1014
[0104]
即序号为2的二层路径组包括4条具有相同目标路径的二层路径,4条二层路径在设备id、业务卡id以及优先系数上存在差别。
[0105]
其中,优先系数可以通过配置的方式进行设定,既可以基于业务卡,给不同业务卡上的二层路径设定不同的优先系数,例如,给在业务卡0上的二层路径设定优先系数为2,给在业务卡1上的二层路径设定优先系数为4。也可以基于具体二层路径进行一对一设定。
[0106]
s202,基于全部流量路径组,确定每个业务卡的重启顺序。
[0107]
其中,流量路径组包括至少一条流量路径,流量路径具有设备id和业务卡id。
[0108]
可选地,步骤s202的实现过程可以如下:
[0109]
s202-1,针对每个所流量路径组,若根据流量路径组内的每条流量路径的设备id和业务卡id,确定流量路径组满足多路径,则将流量路径组作为待用路径组。
[0110]
在本发明实施例中,如果可以按照设备id和业务卡id,将一个流量路径组拆分为两个及以上的子组,每个子组内的所有流量路径具有相同的设备id和业务卡id,那么该流量路径组满足多路径。
[0111]
示例性地,假设一个三层路径组中有如下所示的4条三层路径:
[0112]
路径组序号目标路径出接口设备id业务卡id优先系数110.1.32.110/0/49006110.1.32.110/0/50006110.1.32.110/1/49018110.1.32.110/1/50018
[0113]
按照设备id和业务卡id,可以将该三层路径组拆分为两个子组,分别为子组1和子组2。
[0114]
子组1包括如下两条三层路径:
[0115]
目标路径出接口设备id业务卡id优先系数10.1.32.110/0/4900610.1.32.110/0/50006
[0116]
子组2包括如下两条三层路径:
[0117]
[0118][0119]
同样地,假设一个二层路径组中有如下所示的4条二层路径:
[0120]
路径组序号目标路径设备id业务卡id优先系数2link10022link10022link10142link1014
[0121]
按照设备id和业务卡id,可以将该二层路径组拆分为两个子组,分别为子组3和子组4。
[0122]
子组3包括如下两条二层路径:
[0123]
目标路径设备id业务卡id优先系数link1002link1002
[0124]
子组4包括如下两条二层路径:
[0125]
目标路径设备id业务卡id优先系数link1014link1014
[0126]
由于上述三层路径组和二层路径组都可以按照设备id和业务卡id拆分成两个及以上的子组,均满足多路径,因此,上述三层路径组和二层路径组均可以作为待用流量路径组。
[0127]
可以理解地,对于任意一个流量路径组,当其可以被拆分成子组时,意味着其包括的流量路径是分布在不同的业务卡上的,使得当任一业务卡发生重启时,虽然该业务卡上的流量路径不能继续转发流量,但与该业务卡上的流量路径属于同一流量路径组的其他业务卡上的流量路径能继续对流量进行转发,不会造成业务中断。
[0128]
需要注意地是,在本发明实施例中,对于无法按照设备id和业务卡id进行拆分的流量路径组,则需要提示用户进行人工干预,即手动添加物理线路或逻辑线路,如果用户选择不干预,则该流量路径组不能作为待用流量路径组来用于后续计算各业务卡的重启顺序。
[0129]
s202-2,基于全部待用路径组,确定每个业务卡的重启顺序。
[0130]
可选地,步骤s202-2的实现过程可以如下:
[0131]
s202-2a,根据每个待用路径组内的每条流量路径的业务卡id,确定每个业务卡对应的所有流量路径。
[0132]
沿用上述示例,子组1内的两条三层路径对应业务卡0,子组2内的两条三层路径对应业务卡1,子组3内的两条路径对应业务卡0,子组4内的两条二层路径对应业务卡1,将业务卡0和业务卡1对应的流量路径的信息进行汇总,得到下表:
[0133]
路径组序号目标路径路径路径数量优先系数110.1.32.11{0/0}212
110.1.32.11{0/1}2162link1{0/0}242link1{0/1}28
[0134]
上表中每一行对应一个流量路径组拆分出的一个子组,可以理解地,“路径组序号”相同的行代表同一流量路径组拆分出的子组。上表中的“优先系数”的值是所在行对应的子组内所有流量路径的优先系数之和。
[0135]
s202-2b,针对每个业务卡,将业务卡对应的所有流量路径的优先系数之和作为业务卡的路径权重。
[0136]
示例性地,假设分布式系统包括6个业务卡,分别为lpu0、lpu1、lpu2、lpu3、lpu4以及lpu5。
[0137]
针对该分布式系统,通过执行上述步骤,得到的各业务卡的路径权重如下:
[0138][0139]
上表中,lpu0在序号为1的流量路径组中对应的所有流量路径的优先系数之和为12,在序号为2的流量路径组中对应的所有流量路径的优先系数之和为4,在序号为2的流量路径组中对应的所有流量路径的优先系数之和为36,那么lpu0的路径权重为12+4+36=52。
[0140]
s202-2c,按照每个业务卡的路径权重,确定每个业务卡的重启顺序。
[0141]
在本发明实施例中,路径权重的高低可以反映流量路径组依赖该业务卡进行负载转发的重要程度,因此可以依赖业务卡的路径权重来决定业务卡的启动顺序,例如,路径权重越低的业务卡越优先重启,路径权重值越高的业务卡越后重启。
[0142]
沿用上述示例,业务卡lpu0、lpu1、lpu2、lpu3、lpu4以及lpu5的重启顺序为lpu5、lpu4、lpu1、lpu2、lpu0、lpu3。
[0143]
情况二:运行信息包括系统接口数据,系统接口数据是在决策方式为基于流量吞吐的方式的情况下从主控卡获取的。
[0144]
请参照图4,步骤s103中的“根据运行信息,确定每个业务卡的重启顺序”的实现过
程可以包括步骤s301~s303。
[0145]
s301,根据系统接口数据,确定分布式系统中处于连接状态的接口。
[0146]
其中,处于连接状态(up状态)的接口既可以是物理接口,也可以是逻辑接口。
[0147]
s302,获取处于连接状态的接口在预设时间内统计的每个业务卡的业务流量。
[0148]
在本发明实施例中,需先向处于连接状态的接口下发统计开始指令,以告知接口统计能够反映业务卡吞吐的业务流量大小的指标,例如,可以是总报文的大小,也可以是总报文的个数,还可以是实时流量值或一段时间范围的流量值。
[0149]
在一定时间后,再向处于连接状态的接口下发统计结束指令,以获取统计结果,统计结果的方式可以是基于业务卡的维度,统计表征业务流量的指标:报文总个数、每秒转发的帧数量或每秒转发的字节数。
[0150]
示例性地,假设分布式系统中包括两个业务卡,分别为lpu0和lpu7。针对该分布式系统,通过执行上述步骤,得到的各业务卡的业务流量如下:
[0151]
业务卡报文个数转发报文数lpu 010001024000lpu 7500512000
[0152]
s303,按照每个业务卡的业务流量,确定每个业务卡的重启顺序。
[0153]
在本发明实施例中,考虑系统的稳定性,可以优先重启业务流量较小的业务卡,最后重启业务流量较大的业务卡,这样对系统影响比较小。
[0154]
沿用上述示例,由于lpu7承载的业务流量较lpu0小,因此优先重启lpu7,然后重启lpu0。
[0155]
情况三:运行信息包括系统接口数据,系统接口数据是在决策方式为基于流量敏感程度的方式的情况下从主控卡获取的。
[0156]
请参照图5,步骤s103中的“根据运行信息,确定每个业务卡的重启顺序”的实现过程可以包括步骤s401~s403。
[0157]
s401,根据系统接口数据,确定分布式系统中处于连接状态的接口。
[0158]
其中,处于连接状态(up状态)的接口既可以是物理接口,也可以是逻辑接口。
[0159]
s402,获取处于连接状态的接口在预设时间内统计的每个业务卡的有效报文转发量,有效报文为携带有预设字段的报文。
[0160]
其中,有效报文转发量反映了业务卡承载的流量的敏感程度。
[0161]
可以理解地,预设字段用于标识报文是否为有效报文,预设字段可以根据vlan的cos(class of service,服务等级)值进行设定,也可以根据dscp(differentiated services code point,区分服务码点)值进行设定,还可以设定为其他满足实际需要的值。
[0162]
示例性地,假设分布式系统中包括两个业务卡,分别为lpu0和lpu7。针对该分布式系统,流量敏感程度的预设字段为cos值,通过执行上述步骤,得到的各业务卡的业务流量如下:
[0163][0164]
在本发明实施例中,需先向处于连接状态的接口下发统计开始指令,以告知接口统计能够反映流量敏感程度的有效报文转发量。一定时间后,再向处于连接状态的接口下发统计结束指令,以获取统计结果。
[0165]
s403,按照每个业务卡的有效报文转发量,确定每个业务卡的重启顺序。
[0166]
在本发明实施例中,可以优先重启承载的流量的敏感程度较低的业务卡,最后重启承载的流量的敏感程度较大的业务卡。
[0167]
沿用上述示例,由于lpu0的流量敏感程度统计值为700,低于lpu7的流量敏感程度统计值1050,因此优先重启lpu0,然后重启lpu7。
[0168]
s104,在自身完成重启后,按照每个业务卡的重启顺序,依次对每个业务卡进行重启。
[0169]
上述分布式系统重启方法的执行主体为分布式系统中的主控卡,作为另外一种实现方式,如图6所示,上述分布式系统重启方法的执行主体也可以是分布式系统外部的电子设备,此时分布式系统重启方法还涉及电子设备与分布式系统的主控卡之间的信息交互,即:
[0170]
s1,主控卡在接收到系统重启请求后,将系统重启请求携带的重启顺序决策方式发送给外部电子设备;
[0171]
s2,外部电子设备再根据重启顺序决策方式从主控卡获取分布式系统的运行信息;
[0172]
s3,外部设备根据运行信息,确定每个业务卡的重启顺序,并返回给主控卡,以使主控卡在自身完成重启后,按照每个业务卡的重启顺序,依次对每个业务卡进行重启。
[0173]
需要注意地是,在确定了各业务卡的重启顺序后,可以根据业务卡与交换网板的链接关系,确定各交换网板的重启顺序。
[0174]
为了执行上述方法实施例及各个可能的实施方式中的相应步骤,下面分别给出一种分布式系统重启装置100的实现方式。
[0175]
请参照图7,该分布式系统重启装置100包括接收模块101、获取模块102、处理模块
103和重启模块104。
[0176]
接收模块101,用于接收系统重启请求,所述系统重启请求中携带针对所述分布式系统中多个业务卡的重启顺序决策方式。
[0177]
获取模块102,用于根据所述重启顺序决策方式,获取所述分布式系统的运行信息。
[0178]
处理模块103,用于根据所述运行信息,确定每个所述业务卡的重启顺序。
[0179]
重启模块104,用于在所述主控卡完成重启后,按照每个所述业务卡的重启顺序,依次对每个所述业务卡进行重启。
[0180]
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的分布式系统重启装置100的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
[0181]
本发明实施例还提供一种包含多个业务卡和烧录有计算机程序的主控卡的分布式系统,计算机程序在被执行时可以用于执行上述的方法实施例提供的分布式系统重启方法中的相关操作。
[0182]
本发明实施例还提供一种包含计算机程序的计算机可读存储介质,计算机程序在被执行时可以用于执行上述的方法实施例提供的分布式系统重启方法中的相关操作。
[0183]
以上,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

技术特征:
1.一种分布式系统重启方法,其特征在于,应用于分布式系统中的主控卡,所述分布式系统还包括多个业务卡,所述方法包括:接收系统重启请求,所述系统重启请求中携带针对所述分布式系统中多个业务卡的重启顺序决策方式;根据所述重启顺序决策方式,获取所述分布式系统的运行信息;根据所述运行信息,确定每个所述业务卡的重启顺序;在自身完成重启后,按照每个所述业务卡的重启顺序,依次对每个所述业务卡进行重启。2.如权利要求1所述的方法,其特征在于,所述运行信息包括汇聚端口配置数据和路由表项,所述汇聚端口配置数据和路由表项是所述主控卡在所述重启顺序决策方式为基于流量路径的方式的情况下获取的;所述根据所述运行信息,确定每个所述业务卡的重启顺序的步骤包括:根据所述路由表项和所述汇聚端口配置数据,确定所述分布式系统的每个流量路径组;基于全部所述流量路径组,确定每个所述业务卡的重启顺序。3.如权利要求2所述的方法,其特征在于,所述流量路径组包括至少一条流量路径,所述流量路径具有设备id和业务卡id;所述基于全部所述流量路径组,确定每个所述业务卡的重启顺序的步骤包括:针对每个所流量路径组,若根据所述流量路径组内的每条所述流量路径的设备id和业务卡id,确定所述流量路径组满足多路径,则将所述流量路径组作为待用路径组;基于全部所述待用路径组,确定每个所述业务卡的重启顺序。4.如权利要求3所述的方法,其特征在于,所述流量路径具有优先系数,所述基于全部所述待用路径组,确定每个所述业务卡的重启顺序的步骤包括:根据每个所述待用路径组内的每条所述流量路径的业务卡id,确定每个所述业务卡对应的所有所述流量路径;针对每个所述业务卡,将所述业务卡对应的所有所述流量路径的优先系数之和作为所述业务卡的路径权重;按照每个所述业务卡的路径权重,确定每个所述业务卡的重启顺序。5.如权利要求2所述的方法,其特征在于,所述根据所述路由表项和所述汇聚端口配置数据,确定所述分布式系统的每个流量路径组的步骤包括:根据所述路由表项,确定所述分布式系统的每个三层路径组;根据所述汇聚端口配置数据,确定所述分布式系统的每个二层路径组,得到每个所述流量路径组,所述流量路径组包括二层路径组和三层路径组。6.如权利要求1所述的方法,其特征在于,所述运行信息包括系统接口数据,所述系统接口数据是所述主控卡在所述重启顺序决策方式为基于流量吞吐的方式的情况下获取的;所述根据所述运行信息,确定每个所述业务卡的重启顺序的步骤包括:根据所述系统接口数据,确定所述分布式系统中处于连接状态的接口;获取处于连接状态的接口在预设时间内统计的每个所述业务卡的业务流量;按照每个所述业务卡的业务流量,确定每个所述业务卡的重启顺序。
7.如权利要求1所述的方法,其特征在于,所述运行信息包括系统接口数据,所述系统接口数据是所述主控卡在所述重启顺序决策方式为基于流量敏感程度的方式的情况下获取的;所述根据所述运行信息,确定每个所述业务卡的重启顺序的步骤包括:根据所述系统接口数据,确定所述分布式系统中处于连接状态的接口;获取处于连接状态的接口在预设时间内统计的每个所述业务卡的有效报文转发量,所述有效报文为携带有预设字段的报文;按照每个所述业务卡的有效报文转发量,确定每个所述业务卡的重启顺序。8.一种分布式系统重启装置,其特征在于,应用于分布式系统中的主控卡,所述分布式系统还包括多个业务卡,所述装置包括:接收模块,用于接收系统重启请求,所述系统重启请求中携带针对所述分布式系统中多个业务卡的重启顺序决策方式;获取模块,用于根据所述重启顺序决策方式,获取所述分布式系统的运行信息;处理模块,用于根据所述运行信息,确定每个所述业务卡的重启顺序;重启模块,用于在所述主控卡完成重启后,按照每个所述业务卡的重启顺序,依次对每个所述业务卡进行重启。9.一种分布式系统,其特征在于,其包括主控卡和多个业务卡,所述主控卡烧录有计算机程序,所述计算机程序被执行时实现如权利要求1~7任一项所述的系统重启方法。10.一种计算机可读存储介质,其特征在于,其存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1~7任一项所述的系统重启方法。

技术总结
本发明提供的一种分布式系统重启方法、装置、系统及存储介质,涉及数据通信领域。所述方法:主控卡接收携带针对所述分布式系统中多个业务卡的重启顺序决策方式的系统重启请求;根据重启顺序决策方式,获取分布式系统的运行信息;根据运行信息,确定每个业务卡的重启顺序;主控卡在自身完成重启后,按照每个业务卡的重启顺序,依次对每个业务卡进行重启,从而避免分布式系统重启时出现长时间的业务中断,降低损失。损失。损失。


技术研发人员:刘正芝 方晖
受保护的技术使用者:迈普通信技术股份有限公司
技术研发日:2023.06.30
技术公布日:2023/9/19
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐