对账方法、装置、计算机设备、存储介质和程序产品与流程

未命名 10-18 阅读:144 评论:0


1.本技术涉及数据处理技术领域,特别是涉及一种对账方法、装置、计算机设备、存储介质和程序产品。


背景技术:

2.各账户在使用多个高性能计算集群执行作业的过程中,每个作业均会使用一定的计算资源(如cpu、gpu等),且每个作业所使用的计算资源对应的资源价格有所不同。因此,需要对各账户在执行各作业过程中所使用的消费金额进行记录以及对账。一般的,可以通过云平台对各账户的消费金额进行记录以及对账。
3.然而,传统的对账方法,云平台只能针对资源型号、资源型号的价格、算力相同的单个计算集群进行对账。而针对云平台上会接入多个计算集群的情况,由于多个计算集群中包括多个不同的资源型号、不同的算力以及多个资源型号对应的不同资源价格,因此,传统针对单个计算集群的对账方法,无法针对高复杂度、大数据量的多个计算集群进行对账。


技术实现要素:

4.基于此,有必要针对上述技术问题,提供一种能够针对高复杂度、大数据量的多个计算集群进行对账的对账方法、装置、计算机设备、存储介质和程序产品。
5.第一方面,本技术提供了一种对账方法。所述方法包括:
6.获取多个计算集群中的实时作业数据;
7.按照不同的聚合指标对所述多个计算集群中的实时作业数据进行聚合,生成所述不同的聚合指标对应的聚合结果;
8.根据所述不同的聚合指标对应的聚合结果对所述多个计算集群中的实时作业数据进行对账,生成对账结果。
9.本技术可以按照不同的聚合指标对获取到的多个计算集群中的实时作业数据进行聚合,就能够按照不同的聚合指标对高复杂度、大数据量的多个计算集群中的实时作业数据进行分类并统计,从而能够较准确地生成针对多个计算集群的、不同的聚合指标对应的聚合结果。之后,根据针对多个计算集群的、不同的聚合指标对应的较准确的聚合结果,就能够较准确地对高复杂度、大数据量的多个计算集群中的实时作业数据进行对账,从而较准确地生成对账结果。因此,本技术可以基于不同的聚合指标对高复杂度、大数据量的多个计算集群中的实时作业数据进行对账。
10.在其中一个实施例中,所述不同的聚合指标包括第一类聚合指标及第二类聚合指标;所述按照不同的聚合指标对所述多个计算集群中的实时作业数据进行聚合,生成所述不同的聚合指标对应的聚合结果,包括:
11.按照所述第一类聚合指标对所述多个计算集群中的实时作业数据进行聚合,生成所述第一类聚合指标对应的第一聚合结果;所述第一类聚合指标包括计费指标、所述计费指标对应的资源消耗总量;所述计费指标包括集群标识、用户标识、资源类型及资源单价;
12.按照所述第二类聚合指标对所述多个计算集群中的实时作业数据进行聚合,生成所述第二类聚合指标对应的第二聚合结果;所述第二类聚合指标包括所述计费指标、在所述计费指标下执行每次作业的资源消耗量及在所述计费指标下执行每次作业的作业费用数据。
13.本实施例中,可以按照不同的集群标识、不同的用户标识、不同的资源类型、不同的资源单价及不同的计费指标对应的资源消耗总量,对高复杂度、大数据量的多个计算集群中的实时作业数据进行聚合,就能够较准确地生成第一类聚合指标对应的第一聚合结果。还可以按照不同的集群标识、不同的用户标识、不同的资源类型、不同的资源单价、在计费指标下执行每次作业的资源消耗量及在计费指标下执行每次作业的作业费用数据,对高复杂度、大数据量的多个计算集群中的实时作业数据进行聚合,就能够简化用户作业数据对应的流水数据,能够较准确地生成第二类聚合指标对应的第二聚合结果。
14.在其中一个实施例中,所述根据所述不同的聚合指标对应的聚合结果对所述多个计算集群中的实时作业数据进行对账,生成对账结果,包括:
15.从所述第一聚合结果中确定同一所述资源类型及同一所述资源单价对应的资源消耗总量,根据所述资源消耗总量及所述资源单价,计算同一所述资源类型及同一所述资源单价对应的第一作业费用总量;
16.从所述第二聚合结果中确定同一所述资源类型及同一所述资源单价下每次作业的作业费用数据,根据所述每次作业的作业费用数据确定第二作业费用总量;
17.根据所述第一作业费用总量及所述第二作业费用总量,对所述多个计算集群中的实时作业数据进行对账,生成所述对账结果。
18.本实施例中,针对同一资源类型及同一资源单价,就能够从第一聚合结果中较准确地确定出同一资源类型及同一资源单价对应的资源消耗总量,从而能够根据该较准确的资源消耗总量及资源单价,较准确地计算第一作业费用总量。还能够从第二聚合结果中较准确地确定同一资源类型及同一资源单价下每次作业的作业费用数据,从而能够根据每次作业的作业费用数据较准确地确定第二作业费用总量。之后,根据较准确的第一作业费用总量及较准确的第二作业费用总量,就能够对高复杂度、大数据量的多个计算集群中的实时作业数据进行较准确地对账,从而生成较准确的对账结果。
19.在其中一个实施例中,所述根据所述第一作业费用总量及所述第二作业费用总量,对所述多个计算集群中的实时作业数据进行对账,生成所述对账结果,包括:
20.若所述第一作业费用总量与所述第二作业费用总量相等,则确定所述对账结果为对账成功;
21.若所述第一作业费用总量与所述第二作业费用总量不相等,则针对各计费指标,从所述第一聚合结果中获取所述计费指标对应的第一资源消耗总量,从所述第二聚合结果中获取所述计费指标对应的第二资源消耗总量;所述第二资源消耗总量为所述第二聚合结果中在所述计费指标下执行每次作业的资源消耗量之和;
22.对各所述计费指标对应的第一资源消耗总量及所述第二资源消耗总量进行比较,生成所述对账结果。
23.本实施例中,若第一作业费用总量与第二作业费用总量相等,则可以确定对账结果为对账成功;若第一作业费用总量与第二作业费用总量不相等,则从各计费指标对应的
资源消耗总量的维度,对第一聚合结果中的第一资源消耗总量与第二聚合结果中的第二资源消耗总量进行对账,从而能够确定出多个计算集群中的实时作业数据对账失败的范围,从而能够生成较准确的对账结果,并能够减少后续排查对账失败位置的难度。
24.在其中一个实施例中,所述获取多个计算集群中的实时作业数据,包括:
25.在预设时间段内,获取所述多个计算集群在所述计费指标下执行每次作业的作业数据,基于所述每次作业的作业数据,计算所述预设时间段内所述多个计算集群执行所有作业的第一作业数据总量;
26.按照所述计费指标中的至少一个指标,在所述预设时间段内获取所述多个计算集群执行所有作业的第二作业数据总量;所述第二作业数据总量包括在所述计费指标下执行每次作业的资源消耗量之和;
27.根据所述第一作业数据总量与所述第二作业数据总量,确定所述多个计算集群中的实时作业数据。
28.本实施例中,在预设时间段内,能够按照计费指标从多个计算集群中较准确地获取多个计算集群在计费指标下执行每次作业的作业数据,从而能够基于每次作业的作业数据,较准确地计算预设时间段内多个计算集群执行所有作业的第一作业数据总量。还能够按照计费指标中的至少一个指标,在预设时间段内从多个计算集群中较准确地获取多个计算集群执行所有作业的第二作业数据总量。之后,根据较准确的第一作业数据总量与较准确的第二作业数据总量,就能够较准确地确定高复杂度、大数据量的多个计算集群中的实时作业数据。
29.在其中一个实施例中,所述根据所述第一作业数据总量与所述第二作业数据总量,确定所述多个计算集群中的实时作业数据,包括:
30.将所述第一作业数据总量与所述第二作业数据总量进行比较,生成比较结果;
31.若所述比较结果为所述第一作业数据总量与所述第二作业数据总量相等,则将所述第一作业数据总量或所述第二作业数据总量作为所述多个计算集群中的实时作业数据。
32.本实施例中,将第一作业数据总量与第二作业数据总量进行比较,生成比较结果;若比较结果为第一作业数据总量与第二作业数据总量相等,则说明由多个计算集群向云平台传输的作业数据总量是准确无误的。那么,就可以将第一作业数据总量或第二作业数据总量作为多个计算集群中的实时作业数据,就能够确定出高复杂度、大数据量的多个计算集群中较准确的实时作业数据。因此,本技术实施例可以基于多个计算集群的维度,获取各计算集群中每组用户针对不同资源类型的作业数据,并周期性地与云平台获取的详细作业数据进行比较,从而能够保证多个计算集群与云平台的作业数据之间的一致性。
33.在其中一个实施例中,所述方法还包括:
34.若所述比较结果为所述第一作业数据总量与所述第二作业数据总量不相等,则在所述预设时间段内,重新获取所述多个计算集群执行每次作业的作业数据,基于所述每次作业的作业数据,计算所述预设时间段内所述多个计算集群执行所有作业的新的第一作业数据总量;
35.按照所述计费指标中的至少一个指标,在所述预设时间段内重新获取所述多个计算集群执行所有作业的新的第二作业数据总量;
36.根据所述新的第一作业数据总量与所述新的第二作业数据总量,确定所述多个计
算集群中的新的实时作业数据。
37.本实施例中,若比较结果为第一作业数据总量与第二作业数据总量不相等,则说明第一作业数据总量和/或第二作业数据总量在传输过程中出现错误,就可以重新获取预设时间段内多个计算集群执行所有作业的新的第一作业数据总量,以及预设时间段内重新获取多个计算集群执行所有作业的新的第二作业数据总量。从而,就能够根据重接获取的新的第一作业数据总量与重接获取的新的第二作业数据总量,重新确定多个计算集群中的新的实时作业数据。因此,本实施例提出了一种在作业数据出现异常的情况下(即对账过程中作业数据出现不一致的情况下)进行数据处理的方法。
38.第二方面,本技术还提供了一种对账装置。所述装置包括:
39.获取模块,用于获取多个计算集群中的实时作业数据;
40.聚合模块,用于按照不同的聚合指标对所述多个计算集群中的实时作业数据进行聚合,生成所述不同的聚合指标对应的聚合结果;
41.对账模块,用于根据所述不同的聚合指标对应的聚合结果对所述多个计算集群中的实时作业数据进行对账,生成对账结果。
42.第三方面,本技术还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述第一方面中任一项实施例中的方法的步骤。
43.第四方面,本技术还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面中任一项实施例中的方法的步骤。
44.第五方面,本技术还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述第一方面中任一项实施例中的方法的步骤。
45.上述对账方法、装置、计算机设备、存储介质和程序产品,获取多个计算集群中的实时作业数据;按照不同的聚合指标对多个计算集群中的实时作业数据进行聚合,生成不同的聚合指标对应的聚合结果;根据不同的聚合指标对应的聚合结果对多个计算集群中的实时作业数据进行对账,生成对账结果。本技术可以按照不同的聚合指标对获取到的多个计算集群中的实时作业数据进行聚合,就能够按照不同的聚合指标对高复杂度、大数据量的多个计算集群中的实时作业数据进行分类并统计,从而能够较准确地生成针对多个计算集群的、不同的聚合指标对应的聚合结果。之后,根据针对多个计算集群的、不同的聚合指标对应的较准确的聚合结果,就能够较准确地对高复杂度、大数据量的多个计算集群中的实时作业数据进行对账,从而较准确地生成对账结果。因此,本技术可以基于不同的聚合指标对高复杂度、大数据量的多个计算集群中的实时作业数据进行对账。
附图说明
46.图1为一个实施例中对账方法的应用环境图;
47.图2为一个实施例中对账方法的流程示意图;
48.图3为一个实施例中聚合步骤的流程示意图;
49.图4为一个实施例中生成第一聚合结果及第二聚合结果的流程示意图;
50.图5为一个实施例中对账步骤的流程示意图;
51.图6为一个实施例中进行对账的流程示意图;
52.图7为一个实施例中对账结果生成步骤的流程示意图;
53.图8为一个实施例中实时作业数据确定步骤的流程示意图;
54.图9为一个实施例中多个计算集群向云平台传输作业数据的结构示意图;
55.图10为一个实施例中比较结果为相等的实时作业数据确定步骤的流程示意图;
56.图11为一个实施例中对异常作业数据进行处理的流程示意图;
57.图12为另一个实施例中比较结果为不相等的实时作业数据确定步骤的流程示意图;
58.图13为一个可选的实施例中对账方法的流程示意图;
59.图14为一个实施例中对多个集群中的实时作业数据进行对账的整体流程示意图;
60.图15为一个实施例中对账装置的结构框图;
61.图16为一个实施例中计算机设备的内部结构图。
具体实施方式
62.为了使本技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本技术进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本技术,并不用于限定本技术。
63.各账户在使用多个高性能计算集群执行作业的过程中,每个作业均会使用一定的计算资源(如cpu、gpu等),且每个作业所使用的计算资源对应的资源价格有所不同。因此,需要对各账户在执行各作业过程中所使用的消费金额进行记录以及对账。一般的,可以通过云平台对各账户的消费金额进行记录以及对账。
64.然而,传统的对账方法,云平台只能针对资源型号、资源型号的价格、算力相同的单个计算集群进行对账。而针对云平台上会接入多个计算集群的情况,由于多个计算集群中包括多个不同的资源型号、不同的算力以及多个资源型号对应的不同资源价格,因此,传统针对单个计算集群的对账方法,无法针对高复杂度、大数据量的多个计算集群进行对账。
65.本技术实施例提供的对账方法,可以应用于如图1所示的应用环境中。其中,云平台102通过网络与计算集群104进行通信。数据存储系统可以存储计算集群104需要处理的数据。数据存储系统可以集成在计算集群104上,也可以放在云上或其他网络服务器上。云平台102获取多个计算集群中的实时作业数据;云平台102按照不同的聚合指标对多个计算集群中的实时作业数据进行聚合,生成不同的聚合指标对应的聚合结果;云平台102根据不同的聚合指标对应的聚合结果对多个计算集群中的实时作业数据进行对账,生成对账结果。其中,云平台102可以是服务器。计算集群104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
66.在一个实施例中,如图2所示,提供了一种对账方法,以该方法应用于图1中的云平台102为例进行说明,包括以下步骤:
67.s220,获取多个计算集群中的实时作业数据。
68.其中,云平台也称为云计算平台,云平台是通过对计算资源进行处理,从而形成各种服务的可操作平台。多个计算集群可以是高性能计算(high performance computing,
hpc)集群。作业是指用户提交的、需要在计算集群中执行的任务。实时作业数据是指执行作业过程中所产生的与该作业相关的数据。
69.可选地,由于各用户可以通过多个计算集群执行作业,因此,在通过多个计算集群执行作业的过程中会产生多个计算集群中的实时作业数据。可选地,云平台102可以直接从多个计算集群中获取多个计算集群中的实时作业数据;或者,云平台102也可以先从多个计算集群中获取预设时间段内的作业数据,再根据预设时间段内的作业数据确定预设时间段内多个计算集群中的实时作业数据。其中,预设时间段可以根据实际作业执行状态进行设置,本技术实施例对此不做限定。
70.s240,按照不同的聚合指标对多个计算集群中的实时作业数据进行聚合,生成不同的聚合指标对应的聚合结果。
71.可选地,由于执行不同作业的过程中所使用的资源型号、资源单价等数据有所不同,因此,云平台102可以针对各实时作业数据设置不同的聚合指标。其中,聚合指标为对实时作业数据进行聚合的过程中所使用的聚合维度,聚合指标可以包括但不局限于集群标识、用户标识、资源类型、资源单价、资源消耗量及作业数据量等。作业数据量表示用户执行作业的数量。
72.之后,云平台102可以按照不同的聚合指标对多个计算集群中的实时作业数据进行聚合,生成不同的聚合指标对应的聚合结果。示例性的,假设聚合指标是资源类型、资源单价及作业数据量,那么,云平台102可以按照不同的资源类型、不同的资源单价及不同的作业数据量,对多个计算集群中的实时作业数据进行分类并统计,生成不同的资源类型、不同的资源单价及不同的作业数据量对应的聚合结果。其中,数据聚合(data aggregation)是指将同一对象来自不同数据源的数据进行合并,从而得到该对象的更为完整的信息。不同的聚合指标对应的聚合结果是指按照不同的聚合指标对多个计算集群中的实时作业数据进行聚合,所得到的实时作业数据的统计结果。
73.s260,根据不同的聚合指标对应的聚合结果对多个计算集群中的实时作业数据进行对账,生成对账结果。
74.可选地,云平台102可以根据不同的聚合指标对应的聚合结果,直接对多个计算集群中的实时作业数据进行对账,生成对账结果;或者,云平台102也可以先根据不同的聚合指标对应的聚合结果计算出不同的聚合指标对应的作业费用数据,再基于不同的聚合指标对应的作业费用数据对多个计算集群中的实时作业数据进行对账,生成对账结果。其中,对账是指核对账目中的费用数据是否正确。对账结果可以包括对账成功或者对账失败。
75.上述对账方法中,获取多个计算集群中的实时作业数据;按照不同的聚合指标对多个计算集群中的实时作业数据进行聚合,生成不同的聚合指标对应的聚合结果;根据不同的聚合指标对应的聚合结果对多个计算集群中的实时作业数据进行对账,生成对账结果。本技术可以按照不同的聚合指标对获取到的多个计算集群中的实时作业数据进行聚合,就能够按照不同的聚合指标对高复杂度、大数据量的多个计算集群中的实时作业数据进行分类并统计,从而能够较准确地生成针对多个计算集群的、不同的聚合指标对应的聚合结果。之后,根据针对多个计算集群的、不同的聚合指标对应的较准确的聚合结果,就能够较准确地对高复杂度、大数据量的多个计算集群中的实时作业数据进行对账,从而较准确地生成对账结果。因此,本技术可以基于不同的聚合指标对高复杂度、大数据量的多个计
算集群中的实时作业数据进行对账。
76.在上面的实施例中,涉及到了按照不同的聚合指标对多个计算集群中的实时作业数据进行聚合,生成不同的聚合指标对应的聚合结果,下面就对其具体方法进行介绍。在一个实施例中,不同的聚合指标包括第一类聚合指标及第二类聚合指标,如图3所示,s240包括:
77.s320,按照第一类聚合指标对多个计算集群中的实时作业数据进行聚合,生成第一类聚合指标对应的第一聚合结果;第一类聚合指标包括计费指标、计费指标对应的资源消耗总量;计费指标包括集群标识、用户标识、资源类型及资源单价。
78.其中,不同的聚合指标可以包括但不局限于计费指标、计费指标对应的资源消耗总量、作业数据量、在计费指标下执行每次作业的资源消耗量及在计费指标下执行每次作业的作业费用数据。其中,计费指标包括集群标识、用户标识、资源类型及资源单价。集群标识用于表示不同的计算集群。用户标识用于表示不同的用户或不同的账户。一般的,一个科研团队使用同一个账户进行记账及对账。资源类型是指多个计算集群中的各用户在执行作业时所使用的计算资源的型号。计算资源可以包括但不局限于cpu(中央处理器,central processing unit)、gpu(图形处理器,graphics processing unit)及存储资源。资源单价是指各计算资源的单价。示例性的,假设计算资源的资源类型为型号a,则该计算资源的资源单价为xx元/核时。
79.其中,作业数据量表示执行同一计费指标对应的作业的数量。资源消耗量也可以称为机时量,资源消耗量是指在执行作业的过程中所消耗的计算资源的核时量或者卡时量。示例性的,假设作业运行1个小时且占用2核cpu,则该作业的资源消耗量或机时量为2核时。计费指标对应的资源消耗总量是指基于计费指标对各资源消耗量进行求和所得到的总量。作业费用数据是指在计费指标下执行每次作业所产生的费用。示例性的,执行a作业的作业费用数据等于执行a作业时使用的计算资源对应的资源单价乘以执行a作业时使用的计算资源对应的资源消耗量。在本技术实施例中,可以将不同的聚合指标分为第一类聚合指标及第二类聚合指标。其中,第一类聚合指标包括但不局限于计费指标、计费指标对应的资源消耗总量。
80.可选地,由于不同的聚合指标包括第一类聚合指标,因此,云平台102可以按照第一类聚合指标对多个计算集群中的实时作业数据进行聚合,生成第一类聚合指标对应的第一聚合结果。即可以理解为,云平台102可以按照不同的集群标识、不同的用户标识、不同的资源类型、不同的资源单价及不同的计费指标对应的资源消耗总量,对多个计算集群中的实时作业数据进行分类并统计,从而生成不同的集群标识、不同的用户标识、不同的资源类型、不同的资源单价及不同的资源消耗总量对应的第一聚合结果。其中,第一聚合结果是指按照第一类聚合指标对多个计算集群中的实时作业数据进行聚合,所得到的实时作业数据的统计结果。
81.如图4所示,图4为一个实施例中生成第一聚合结果及第二聚合结果的流程示意图。首先,s402,云平台102可以将多个计算集群中的实时作业数据进行数据解析,从而获取与各作业对应的各集群标识、各用户标识、各资源类型、各作业时长、各资源单价及各资源消耗量等作业数据。其次,s404,云平台102可以根据上述作业数据计算各计费指标对应的作业数据量及各计费指标对应的资源消耗总量。之后,s406,云平台102可以基于上述作业
数据、各计费指标对应的作业数据量及各计费指标对应的资源消耗总量,对多个计算集群中的实时作业数据进行聚合,从而生成第一聚合结果。其中,第一聚合结果的形式可以是作业聚合表。示例性的,针对某个计算集群的作业聚合表可以如下表所示。
82.表1
83.聚合表标识用户标识资源类型资源单价作业数据量资源消耗总量10000001账户a型号a2.0元/核时100个500核时10000002账户a型号a1.8元/核时200个320核时10000003账户a型号b0.2元/核时150个200核时10000004账户a型号c0.5元/核时1000个3000核时10000005账户b型号a2.2元/核时600个1000核时10000006账户d型号d1.2元/核时200个500核时
84.s340,按照第二类聚合指标对多个计算集群中的实时作业数据进行聚合,生成第二类聚合指标对应的第二聚合结果;第二类聚合指标包括计费指标、在计费指标下执行每次作业的资源消耗量及在计费指标下执行每次作业的作业费用数据。
85.可选地,由于不同的聚合指标包括第二类聚合指标,且第二类聚合指标包括但不局限于计费指标、在计费指标下执行每次作业的资源消耗量及在计费指标下执行每次作业的作业费用数据。因此,云平台102可以按照第二类聚合指标对多个计算集群中的实时作业数据进行聚合,生成第二类聚合指标对应的第二聚合结果。即可以理解为,云平台102可以按照不同的集群标识、不同的用户标识、不同的资源类型、不同的资源单价、在计费指标下执行每次作业的资源消耗量及在计费指标下执行每次作业的作业费用数据,对多个计算集群中的实时作业数据进行分类并统计,从而生成不同的集群标识、不同的用户标识、不同的资源类型、不同的资源单价、在计费指标下执行每次作业的资源消耗量及在计费指标下执行每次作业的作业费用数据对应的第二聚合结果。其中,第二聚合结果是指按照第二类聚合指标对多个计算集群中的实时作业数据进行聚合,所得到的实时作业数据的统计结果。
86.结合图4所示,首先,s402,云平台102可以将多个计算集群中的实时作业数据进行数据解析,从而获取与各作业对应的各集群标识、各用户标识、各资源类型、各作业时长、各资源单价及各资源消耗量等作业数据。其次,s404,云平台102可以根据上述作业数据计算在计费指标下执行每次作业的资源消耗量及在计费指标下执行每次作业的作业费用数据。之后,s408,云平台102可以基于上述作业数据、在计费指标下执行每次作业的资源消耗量及在计费指标下执行每次作业的作业费用数据,对多个计算集群中的实时作业数据进行聚合,从而生成第二聚合结果。其中,第二聚合结果的形式可以是账户流水表。针对账户流水表,每记录一次作业费用数据,均需要同步记录该作业对应的聚合表标识。示例性的,针对某个计算集群的账户流水表可以如下表所示。
87.表2
88.聚合表标识用户标识资源类型资源单价作业费用数据资源消耗量10000001账户a型号a2.0元/核时100元50核时10000001账户a型号a2.0元/核时250元125核时10000001账户a型号a2.0元/核时400元200核时10000002账户a型号a1.8元/核时270元150核时
10000003账户a型号b0.2元/核时20元100核时10000005账户b型号a2.2元/核时440元200核时....................................
89.本实施例中,可以按照不同的集群标识、不同的用户标识、不同的资源类型、不同的资源单价及不同的计费指标对应的资源消耗总量,对高复杂度、大数据量的多个计算集群中的实时作业数据进行聚合,就能够较准确地生成第一类聚合指标对应的第一聚合结果。还可以按照不同的集群标识、不同的用户标识、不同的资源类型、不同的资源单价、在计费指标下执行每次作业的资源消耗量及在计费指标下执行每次作业的作业费用数据,对高复杂度、大数据量的多个计算集群中的实时作业数据进行聚合,就能够简化用户作业数据对应的流水数据,能够较准确地生成第二类聚合指标对应的第二聚合结果。
90.在上面的实施例中,涉及到了根据不同的聚合指标对应的聚合结果对多个计算集群中的实时作业数据进行对账,生成对账结果,下面就对其具体方法进行介绍。在一个实施例中,如图5所示,s260包括:
91.s520,从第一聚合结果中确定同一资源类型及同一资源单价对应的资源消耗总量,根据资源消耗总量及资源单价,计算同一资源类型及同一资源单价对应的第一作业费用总量。
92.可选地,如图6所示,图6为一个实施例中进行对账的流程示意图。s602,云平台102可以设置对账周期,并查询第一聚合结果,就可以从第一聚合结果中确定对账周期内同一资源类型及同一资源单价对应的资源消耗总量。之后,s604,云平台102可以根据对账周期内同一资源类型及同一资源单价对应的资源消耗总量、及对账周期内同一资源类型及同一资源单价对应的资源单价,计算对账周期内同一资源类型及同一资源单价对应的第一作业费用总量。其中,对账周期内同一资源类型及同一资源单价对应的第一作业费用总量,等于对账周期内同一资源类型及同一资源单价对应的资源消耗总量、与对账周期内同一资源类型及同一资源单价对应的资源单价的乘积。
93.s540,从第二聚合结果中确定同一资源类型及同一资源单价下每次作业的作业费用数据,根据每次作业的作业费用数据确定第二作业费用总量。
94.可选地,结合图6所示,s606,云平台102可以根据设置好的对账周期查询第二聚合结果,就可以从第二聚合结果中确定对账周期内同一资源类型及同一资源单价下每次作业的作业费用数据。之后,s608,云平台102可以根据对账周期内同一资源类型及同一资源单价下每次作业的作业费用数据,计算对账周期内同一资源类型及同一资源单价对应的第二作业费用总量。其中,对账周期内同一资源类型及同一资源单价对应的第二作业费用总量,等于对账周期内同一资源类型及同一资源单价下每次作业的作业费用数据之和。
95.s560,根据第一作业费用总量及第二作业费用总量,对多个计算集群中的实时作业数据进行对账,生成对账结果。
96.可选地,针对对账周期内的同一资源类型及同一资源单价,云平台102可以将第一作业费用总量与第二作业费用总量进行比较,生成作业费用总量比较结果。其中,可以是通过对第一作业费用总量与第二作业费用总量进行做差的方式进行比较;或者,也可以是通过对第一作业费用总量与第二作业费用总量进行求商的方式进行比较;或者,还可以是通过判断第一作业费用总量与第二作业费用总量是否相等的方式进行比较。当然,本实施例
对将第一作业费用总量与第二作业费用总量进行比较的方式不做限定。作业费用总量比较结果是指将第一作业费用总量与第二作业费用总量进行比较后所得到的结果。示例性的,假设本实施例是通过判断第一作业费用总量与第二作业费用总量是否相等的方式进行比较,那么,作业费用总量比较结果为作业费用总量相等或者作业费用总量不相等。之后,云平台102可以根据作业费用总量比较结果对多个计算集群中的实时作业数据进行对账,生成对账结果。
97.本实施例中,针对同一资源类型及同一资源单价,就能够从第一聚合结果中较准确地确定出同一资源类型及同一资源单价对应的资源消耗总量,从而能够根据该较准确的资源消耗总量及资源单价,较准确地计算第一作业费用总量。还能够从第二聚合结果中较准确地确定同一资源类型及同一资源单价下每次作业的作业费用数据,从而能够根据每次作业的作业费用数据较准确地确定第二作业费用总量。之后,根据较准确的第一作业费用总量及较准确的第二作业费用总量,就能够对高复杂度、大数据量的多个计算集群中的实时作业数据进行较准确地对账,从而生成较准确的对账结果。
98.在上面的实施例中,涉及到了根据第一作业费用总量及第二作业费用总量,对多个计算集群中的实时作业数据进行对账,生成对账结果,下面就对其具体方法进行介绍。在一个实施例中,如图7所示,s560包括:
99.s720,若第一作业费用总量与第二作业费用总量相等,则确定对账结果为对账成功。
100.可选地,结合图6所示,s610,针对对账周期内的同一资源类型及同一资源单价,云平台102可以检测第一作业费用总量与第二作业费用总量是否相等。若检测出第一作业费用总量与第二作业费用总量相等,则s612,云平台102可以确定对账结果为对账成功,并将对账结果为对账成功的本次对账进行记录,并更新用户的账户信息以及对账成功的时间。
101.s740,若第一作业费用总量与第二作业费用总量不相等,则针对各计费指标,从第一聚合结果中获取计费指标对应的第一资源消耗总量,从第二聚合结果中获取计费指标对应的第二资源消耗总量;第二资源消耗总量为第二聚合结果中在计费指标下执行每次作业的资源消耗量之和。
102.可选地,结合图6所示,若检测出第一作业费用总量与第二作业费用总量不相等,则云平台102可以针对各计费指标,s614,从第一聚合结果中获取计费指标对应的第一资源消耗总量,s616,从第二聚合结果中获取计费指标对应的第二资源消耗总量。其中,第二资源消耗总量为第二聚合结果中在计费指标下执行每次作业的资源消耗量之和。结合表1及表2所示,聚合表标识即为计费指标,即可以理解为,一个计费指标对应一个聚合表标识。针对表1,表1中的各行用于表示各计费指标下所消耗的资源消耗总量,所以,表1中的一行对应一个计费指标。针对表2,表2中的各行表示执行一次作业所产生的作业费用数据及执行一次作业资源消耗量,所以,表2中会存在多行对应一个计费指标的情况。
103.示例性的,结合表1及表2所示,针对聚合表标识10000001,即针对计费指标(计算集群a,账户a,型号a,2.0元/核时),可以从表1中获取聚合表标识10000001对应的第一资源消耗总量(500核时);并从表2中获取聚合表标识10000001对应的执行每次作业的资源消耗量(50核时、125核时、200核时),将执行每次作业的资源消耗量相加就可以得到第二资源消耗总量(50核时+125核时+200核时=375核时)。
104.s760,对各计费指标对应的第一资源消耗总量及第二资源消耗总量进行比较,生成对账结果。
105.可选地,云平台102可以对各计费指标对应的第一资源消耗总量及第二资源消耗总量进行比较,生成对账结果。结合图6所示,s618,针对各计费指标对应的第一资源消耗总量及第二资源消耗总量依次进行比较,若一个计费指标对应的第一资源消耗总量及同一计费指标对应的第二资源消耗总量相等,则s620,针对下一计费指标,对该下一计费指标对应的第一资源消耗总量及第二资源消耗总量进行比较,直到各计费指标对应的第一资源消耗总量及第二资源消耗总量均比较完成,对账结束。若一个计费指标对应的第一资源消耗总量及同一计费指标对应的第二资源消耗总量不相等,则s622,将该计费指标及该计费指标对应的作业数据进行记录;再针对下一计费指标,对该下一计费指标对应的第一资源消耗总量及第二资源消耗总量进行比较,直到各计费指标对应的第一资源消耗总量及第二资源消耗总量均比较完成,对账结束。
106.本实施例中,若第一作业费用总量与第二作业费用总量相等,则可以确定对账结果为对账成功;若第一作业费用总量与第二作业费用总量不相等,则针对各计费指标,从第一聚合结果中获取计费指标对应的第一资源消耗总量,从第二聚合结果中获取计费指标对应的第二资源消耗总量;第二资源消耗总量为第二聚合结果中在计费指标下执行每次作业的资源消耗量之和;对各计费指标对应的第一资源消耗总量及第二资源消耗总量进行比较,生成对账结果。就能够针对第一作业费用总量与第二作业费用总量不相等的多个计算集群中的实时作业数据,从各计费指标对应的资源消耗总量的维度,对第一聚合结果中的第一资源消耗总量与第二聚合结果中的第二资源消耗总量进行对账,从而能够确定出多个计算集群中的实时作业数据对账失败的范围,从而能够生成较准确的对账结果,并能够减少后续排查对账失败位置的难度。
107.在上面的实施例中,涉及到了获取多个计算集群中的实时作业数据,下面就对其具体方法进行介绍。在一个实施例中,如图8所示,s220包括:
108.s820,在预设时间段内,获取多个计算集群在计费指标下执行每次作业的作业数据,基于每次作业的作业数据,计算预设时间段内多个计算集群执行所有作业的第一作业数据总量。
109.可选地,如图9所示,图9为一个实施例中多个计算集群向云平台传输作业数据的结构示意图。云平台102可以在预设时间段内,按照不同的计算集群、不同的用户标识、不同的资源类型定时地从多个计算集群中获取多个计算集群在计费指标下执行每次作业的作业数据。且云平台102可以基于多个计算集群在计费指标下执行每次作业的作业数据,计算预设时间段内多个计算集群执行所有作业的作业数据总量,并将该作业数据总量按照不同的计算集群、不同的用户标识、不同的资源类型进行聚合,得到预设时间段内多个计算集群执行所有作业的第一作业数据总量。其中,预设时间段可以根据云平台和计算集群的性能进行设置,特别的,预设时间段可以与对账周期相等。当然,本技术实施例对预设时间段不做限定。第一作业数据总量是指在预设时间段内多个计算集群执行所有作业的过程中所使用到的数据总量。第一作业数据总量可以包括但不局限于作业量、资源消耗量、存储量。作业量是指在预设时间段内多个计算集群执行作业的数量,存储量是指在执行作业过程中所使用的存储容量,例如500gb、1.2t等。
110.s840,按照计费指标中的至少一个指标,在预设时间段内获取多个计算集群执行所有作业的第二作业数据总量;第二作业数据总量包括在计费指标下执行每次作业的资源消耗量之和。
111.可选地,结合图9所示,云平台102可以在预设时间段内通过消息队列实时地从多个计算集群中获取多个计算集群执行所有作业的详细作业数据。其中,详细作业数据可以包括但不局限于作业执行时长、资源消耗量、作业执行时所使用到的队列等。且云平台102还可以按照计费指标中的至少一个指标,在预设时间段内将详细作业数据进行聚合,从而得到多个计算集群执行所有作业的第二作业数据总量。在本实施例中,可以按照不同的计算集群、不同的用户标识、不同的资源类型进行聚合。其中,第二作业数据总量包括但不局限于在计费指标下执行每次作业的资源消耗量之和、作业量、存储量。计费指标中的至少一个指标可以包括集群标识、用户标识、资源类型及资源单价中的至少一个指标。
112.s860,根据第一作业数据总量与第二作业数据总量,确定多个计算集群中的实时作业数据。
113.可选地,结合图9所示,云平台102可以将第一作业数据总量与第二作业数据总量进行比较,生成作业数据总量比较结果;或者,云平台102也可以将第一作业数据总量与第二作业数据总量进行汇总,生成汇总结果。其中,可以是通过对第一作业数据总量与第二作业数据总量进行做差的方式进行比较;或者,也可以是通过对第一作业数据总量与第二作业数据总量进行求商的方式进行比较;或者,还可以是通过判断第一作业数据总量与第二作业数据总量是否相等的方式进行比较。当然,本实施例对将第一作业数据总量与第二作业数据总量进行比较的方式不做限定。作业数据总量比较结果是指将第一作业数据总量与第二作业数据总量进行比较后所得到的结果。汇总结果是指将第一作业数据总量与第二作业数据总量进行求和后所得到的结果。之后,云平台102可以根据作业数据总量比较结果或者汇总结果确定多个计算集群中的实时作业数据。
114.本实施例中,在预设时间段内,能够按照计费指标从多个计算集群中较准确地获取多个计算集群在计费指标下执行每次作业的作业数据,从而能够基于每次作业的作业数据,较准确地计算预设时间段内多个计算集群执行所有作业的第一作业数据总量。还能够按照计费指标中的至少一个指标,在预设时间段内从多个计算集群中较准确地获取多个计算集群执行所有作业的第二作业数据总量。之后,根据较准确的第一作业数据总量与较准确的第二作业数据总量,就能够较准确地确定高复杂度、大数据量的多个计算集群中的实时作业数据。
115.在上面的实施例中,涉及到了根据第一作业数据总量与第二作业数据总量,确定多个计算集群中的实时作业数据,下面就对其具体方法进行介绍。在一个实施例中,如图10所示,s860包括:
116.s1020,将第一作业数据总量与第二作业数据总量进行比较,生成比较结果。
117.可选地,如图11所示,图11为一个实施例中对异常作业数据进行处理的流程示意图。s1102,云平台102可以将预设时间段内多个计算集群执行所有作业的第一作业数据总量与预设时间段内多个计算集群执行所有作业的第二作业数据总量进行比较,生成比较结果。其中,可以是通过对第一作业数据总量与第二作业数据总量进行做差的方式进行比较;或者,也可以是通过对第一作业数据总量与第二作业数据总量进行求商的方式进行比较;
或者,还可以是通过判断第一作业数据总量与第二作业数据总量是否相等的方式进行比较。当然,本实施例对将第一作业数据总量与第二作业数据总量进行比较的方式不做限定。比较结果是指将第一作业数据总量与第二作业数据总量进行比较后所得到的结果。示例性的,假设本实施例是通过判断第一作业数据总量与第二作业数据总量是否相等的方式进行比较,那么,比较结果为第一作业数据总量与第二作业数据总量相等,或者第一作业数据总量与第二作业数据总量不相等。
118.s1040,若比较结果为第一作业数据总量与第二作业数据总量相等,则将第一作业数据总量或第二作业数据总量作为多个计算集群中的实时作业数据。
119.可选地,结合图11所示,若比较结果为第一作业数据总量与第二作业数据总量相等,则说明比较成功,云平台102就可以确定第一作业数据总量与第二作业数据总量均准确无误,此时s1104,云平台102可以记录比较成功的用户、时间、比较结果及实时作业数据,s1106,且云平台102可以将第一作业数据总量或第二作业数据总量作为多个计算集群中的实时作业数据。一般的,由于第二作业数据总量为实时获取到的多个计算集群执行所有作业的详细作业数据,因此,一般选取第二作业数据总量作为多个计算集群中的实时作业数据。
120.本实施例中,将第一作业数据总量与第二作业数据总量进行比较,生成比较结果;若比较结果为第一作业数据总量与第二作业数据总量相等,则说明由多个计算集群向云平台传输的作业数据总量是准确无误的。那么,就可以将第一作业数据总量或第二作业数据总量作为多个计算集群中的实时作业数据,就能够确定出高复杂度、大数据量的多个计算集群中较准确的实时作业数据。因此,本技术实施例可以基于多个计算集群的维度,获取各计算集群中每组用户针对不同资源类型的作业数据,并周期性地与云平台获取的详细作业数据进行比较,从而能够保证多个计算集群与云平台的作业数据之间的一致性。
121.在上面的实施例中,涉及到了若比较结果为第一作业数据总量与第二作业数据总量相等,则将第一作业数据总量或第二作业数据总量作为多个计算集群中的实时作业数据,下面就对另一种具体方法进行介绍。在一个实施例中,如图12所示,上述对账方法包括:
122.s1220,若比较结果为第一作业数据总量与第二作业数据总量不相等,则在预设时间段内,重新获取多个计算集群执行每次作业的作业数据,基于每次作业的作业数据,计算预设时间段内多个计算集群执行所有作业的新的第一作业数据总量。
123.示例性的,结合图11所示,若比较结果为第一作业数据总量与第二作业数据总量不相等,则说明比较失败,那么,云平台102就可以确定出第一作业数据总量和/或第二作业数据总量在传输过程中出现错误。此时,s1108,云平台102可以通过云平台数据库记录比较失败的用户、时间、比较结果及实时作业数据,并查询该用户上次比较通过的时间。其中,上次比较通过的时间是指与当前时刻最接近的比较通过的时间。之后,s1110,云平台102可以确定该用户上次比较通过的时间与当前时刻的时间差值,从而得到该时间差值对应的差值时间段。s1112,且云平台102可以重新获取差值时间段内多个计算集群执行每次作业的作业数据,并基于该每次作业的作业数据,计算差值时间段内多个计算集群执行所有作业的新的第一作业数据总量。其中,差值时间段可以与预设时间段相等。
124.s1240,按照计费指标中的至少一个指标,在预设时间段内重新获取多个计算集群执行所有作业的新的第二作业数据总量。
125.可选地,结合图11所示,s1112,云平台102可以在预设时间段内通过消息队列从多个计算集群中重新获取多个计算集群执行所有作业的新的详细作业数据。其中,详细作业数据可以包括但不局限于作业执行时长、资源消耗量、作业执行时所使用到的队列等。且云平台102还可以按照计费指标中的至少一个指标,在预设时间段内将新的详细作业数据进行聚合,从而得到多个计算集群执行所有作业的新的第二作业数据总量。
126.s1260,根据新的第一作业数据总量与新的第二作业数据总量,确定多个计算集群中的新的实时作业数据。
127.可选地,结合图11所示,云平台102可以将新的第一作业数据总量与新的第二作业数据总量进行比较,生成新的作业数据总量比较结果。之后,云平台102可以根据新的作业数据总量比较结果确定多个计算集群中的新的实时作业数据。此外,s1114,云平台102还可以检测是否对新的第一作业数据总量或者新的第二作业数据总量进行计费。若已经对新的第一作业数据总量或者新的第二作业数据总量进行计费,则s1116,云平台102可以对已经计费的作业数据总量进行记录。
128.若未对新的第一作业数据总量或者新的第二作业数据总量进行计费,则s1118,云平台102可以对新的第一作业数据总量或者新的第二作业数据总量进行计费,并对计费后的新的第一作业数据总量或者新的第二作业数据总量进行对账,生成对账结果。另外,若对账结果为对账失败,则云平台102也可以重新获取新的第一作业数据总量与新的第二作业数据总量,从而基于新的第一作业数据总量与新的第二作业数据总量再次进行对账,生成新的对账结果。若预设次数的对账结果均为对账失败,则停止对账,并通过人工检查各作业数据。当然,本技术实施例对于预设次数不做限定。
129.本实施例中,若比较结果为第一作业数据总量与第二作业数据总量不相等,则说明第一作业数据总量和/或第二作业数据总量在传输过程中出现错误,就可以重新获取预设时间段内多个计算集群执行所有作业的新的第一作业数据总量,以及预设时间段内重新获取多个计算集群执行所有作业的新的第二作业数据总量。从而,就能够根据重接获取的新的第一作业数据总量与重接获取的新的第二作业数据总量,重新确定多个计算集群中的新的实时作业数据。因此,本实施例提出了一种在作业数据出现异常的情况下(即对账过程中作业数据出现不一致的情况下)进行数据处理的方法。
130.在一个可选的实施例中,如图13所示,提供了一种对账方法,应用于云平台102,包括:
131.s1302,在预设时间段内,获取多个计算集群在计费指标下执行每次作业的作业数据,基于每次作业的作业数据,计算预设时间段内多个计算集群执行所有作业的第一作业数据总量;
132.s1304,按照计费指标中的至少一个指标,在预设时间段内获取多个计算集群执行所有作业的第二作业数据总量;第二作业数据总量包括在计费指标下执行每次作业的资源消耗量之和;
133.s1306,将第一作业数据总量与第二作业数据总量进行比较,生成比较结果;
134.s1308,若比较结果为第一作业数据总量与第二作业数据总量相等,则将第一作业数据总量或第二作业数据总量作为多个计算集群中的实时作业数据;
135.s1310,若比较结果为第一作业数据总量与第二作业数据总量不相等,则在预设时
间段内,重新获取多个计算集群执行每次作业的作业数据,基于每次作业的作业数据,计算预设时间段内多个计算集群执行所有作业的新的第一作业数据总量;
136.s1312,按照计费指标中的至少一个指标,在预设时间段内重新获取多个计算集群执行所有作业的新的第二作业数据总量;
137.s1314,根据新的第一作业数据总量与新的第二作业数据总量,确定多个计算集群中的新的实时作业数据;
138.s1316,按照第一类聚合指标对多个计算集群中的实时作业数据进行聚合,生成第一类聚合指标对应的第一聚合结果;第一类聚合指标包括计费指标、计费指标对应的资源消耗总量;计费指标包括集群标识、用户标识、资源类型及资源单价;
139.s1318,按照第二类聚合指标对多个计算集群中的实时作业数据进行聚合,生成第二类聚合指标对应的第二聚合结果;第二类聚合指标包括计费指标、在计费指标下执行每次作业的资源消耗量及在计费指标下执行每次作业的作业费用数据;
140.s1320,从第一聚合结果中确定同一资源类型及同一资源单价对应的资源消耗总量,根据资源消耗总量及资源单价,计算同一资源类型及同一资源单价对应的第一作业费用总量;
141.s1322,从第二聚合结果中确定同一资源类型及同一资源单价下每次作业的作业费用数据,根据每次作业的作业费用数据确定第二作业费用总量;
142.s1324,若第一作业费用总量与第二作业费用总量相等,则确定对账结果为对账成功;
143.s1326,若第一作业费用总量与第二作业费用总量不相等,则针对各计费指标,从第一聚合结果中获取计费指标对应的第一资源消耗总量,从第二聚合结果中获取计费指标对应的第二资源消耗总量;第二资源消耗总量为第二聚合结果中在计费指标下执行每次作业的资源消耗量之和;
144.s1328,对各计费指标对应的第一资源消耗总量及第二资源消耗总量进行比较,生成对账结果。
145.可选地,如图14所示,图14为一个实施例中对多个集群中的实时作业数据进行对账的整体流程示意图。首先,s1402,用户在前端界面上输入“开始对账”指令。s1404,用户在前端界面上输入预设时间段。其次,云平台接收到“开始对账”指令以及预设时间段之后,通过作业数据核对模块获取预设时间段内多个计算集群中的第一作业数据总量及第二作业数据总量,并将第一作业数据总量与第二作业数据总量进行比较,生成比较结果。s1406,若比较结果为第一作业数据总量与第二作业数据总量不相等,则说明作业数据核对失败,此时,通过异常作业数据处理模块重新获取预设时间段内多个计算集群中的新的第一作业数据总量及新的第二作业数据总量,并重新进行作业数据核对,生成新的实时作业数据。
146.s1408,若比较结果为第一作业数据总量与第二作业数据总量相等,则说明作业数据核对成功,此时,将第一作业数据总量或第二作业数据总量作为多个计算集群中的实时作业数据,并s1410,根据多个计算集群中的实时作业数据,通过云平台对账模块进行自动对账,生成对账结果。s1412,若对账结果为对账成功,则在前端界面上显示实时作业数据以及“对账成功”的信息。s1414,若对账结果为对账失败,则通过异常作业数据处理模块重新获取预设时间段内多个计算集群中的新的第一作业数据总量及新的第二作业数据总量,并
重新进行作业数据核对及对账,生成新的实时作业数据及新的对账结果。
147.上述对账方法中,可以按照不同的聚合指标对获取到的多个计算集群中的实时作业数据进行聚合,就能够按照不同的聚合指标对高复杂度、大数据量的多个计算集群中的实时作业数据进行分类并统计,从而能够较准确地生成针对多个计算集群的、不同的聚合指标对应的聚合结果。之后,根据针对多个计算集群的、不同的聚合指标对应的较准确的聚合结果,就能够较准确地对高复杂度、大数据量的多个计算集群中的实时作业数据进行对账,从而较准确地生成对账结果。因此,本技术可以基于不同的聚合指标对高复杂度、大数据量的多个计算集群中的实时作业数据进行对账,从而能够实现针对不同维度的对账,能够保证作业数据的准确性。此外,可以通过前端界面确保用户能够查看到作业数据,且能够确保用户可以直观地查看资金去向。另外,可以通过异常作业数据处理模块记录对账失败的用户及作业数据;且当多次对账失败需要人工介入时,可以提供对账失败的范围,从而能够减小排查的困难。
148.应该理解的是,虽然如上的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
149.基于同样的发明构思,本技术实施例还提供了一种用于实现上述所涉及的对账方法的对账装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个对账装置实施例中的具体限定可以参见上文中对于对账方法的限定,在此不再赘述。
150.在一个实施例中,如图15所示,提供了一种对账装置1500,包括:获取模块1520、聚合模块1540和对账模块1560,其中:
151.获取模块1520,用于获取多个计算集群中的实时作业数据。
152.聚合模块1540,用于按照不同的聚合指标对多个计算集群中的实时作业数据进行聚合,生成不同的聚合指标对应的聚合结果。
153.对账模块1560,用于根据不同的聚合指标对应的聚合结果对多个计算集群中的实时作业数据进行对账,生成对账结果。
154.在一个实施例中,不同的聚合指标包括第一类聚合指标及第二类聚合指标;聚合模块1540包括:
155.第一聚合结果生成单元,用于按照第一类聚合指标对多个计算集群中的实时作业数据进行聚合,生成第一类聚合指标对应的第一聚合结果;第一类聚合指标包括计费指标、计费指标对应的资源消耗总量;计费指标包括集群标识、用户标识、资源类型及资源单价;
156.第二聚合结果生成单元,用于按照第二类聚合指标对多个计算集群中的实时作业数据进行聚合,生成第二类聚合指标对应的第二聚合结果;第二类聚合指标包括计费指标、在计费指标下执行每次作业的资源消耗量及在计费指标下执行每次作业的作业费用数据。
157.在一个实施例中,对账模块1560包括:
158.第一作业费用总量计算单元,用于从第一聚合结果中确定同一资源类型及同一资源单价对应的资源消耗总量,根据资源消耗总量及资源单价,计算同一资源类型及同一资源单价对应的第一作业费用总量;
159.第二作业费用总量确定单元,用于从第二聚合结果中确定同一资源类型及同一资源单价下每次作业的作业费用数据,根据每次作业的作业费用数据确定第二作业费用总量;
160.对账结果生成单元,用于根据第一作业费用总量及第二作业费用总量,对多个计算集群中的实时作业数据进行对账,生成对账结果。
161.在一个实施例中,对账结果生成包括:
162.第一对账结果确定子单元,用于在第一作业费用总量与第二作业费用总量相等的情况下,确定对账结果为对账成功;
163.资源消耗总量获取子单元,用于在第一作业费用总量与第二作业费用总量不相等的情况下,针对各计费指标,从第一聚合结果中获取计费指标对应的第一资源消耗总量,从第二聚合结果中获取计费指标对应的第二资源消耗总量;第二资源消耗总量为第二聚合结果中在计费指标下执行每次作业的资源消耗量之和;
164.第二对账结果确定子单元,用于对各计费指标对应的第一资源消耗总量及第二资源消耗总量进行比较,生成对账结果。
165.在一个实施例中,获取模块1520包括:
166.第一作业数据总量计算单元,用于在预设时间段内,获取多个计算集群在计费指标下执行每次作业的作业数据,基于每次作业的作业数据,计算预设时间段内多个计算集群执行所有作业的第一作业数据总量;
167.第二作业数据总量获取单元,用于按照计费指标中的至少一个指标,在预设时间段内获取多个计算集群执行所有作业的第二作业数据总量;第二作业数据总量包括在计费指标下执行每次作业的资源消耗量之和;
168.实时作业数据获取单元,用于根据第一作业数据总量与第二作业数据总量,确定多个计算集群中的实时作业数据。
169.在一个实施例中,实时作业数据获取单元包括:
170.比较单元,用于将第一作业数据总量与第二作业数据总量进行比较,生成比较结果;
171.实时作业数据确定单元,用于在比较结果为第一作业数据总量与第二作业数据总量相等的情况下,将第一作业数据总量或第二作业数据总量作为多个计算集群中的实时作业数据。
172.在一个实施例中,对账装置1500还包括:
173.第一作业数据总量重新获取模块,用于在比较结果为第一作业数据总量与第二作业数据总量不相等的情况下,在预设时间段内,重新获取多个计算集群执行每次作业的作业数据,基于每次作业的作业数据,计算预设时间段内多个计算集群执行所有作业的新的第一作业数据总量;
174.第二作业数据总量重新获取模块,用于按照计费指标中的至少一个指标,在预设时间段内重新获取多个计算集群执行所有作业的新的第二作业数据总量;
175.新的实时作业数据生成模块,用于根据新的第一作业数据总量与新的第二作业数据总量,确定多个计算集群中的新的实时作业数据。
176.上述对账装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
177.在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图16所示。该计算机设备包括处理器、存储器、输入/输出接口(input/output,简称i/o)和通信接口。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储对账数据。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种对账方法。
178.本领域技术人员可以理解,图16中示出的结构,仅仅是与本技术方案相关的部分结构的框图,并不构成对本技术方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
179.在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
180.获取多个计算集群中的实时作业数据;
181.按照不同的聚合指标对多个计算集群中的实时作业数据进行聚合,生成不同的聚合指标对应的聚合结果;
182.根据不同的聚合指标对应的聚合结果对多个计算集群中的实时作业数据进行对账,生成对账结果。
183.在一个实施例中,不同的聚合指标包括第一类聚合指标及第二类聚合指标;按照不同的聚合指标对多个计算集群中的实时作业数据进行聚合,生成不同的聚合指标对应的聚合结果,处理器执行计算机程序时还实现以下步骤:
184.按照第一类聚合指标对多个计算集群中的实时作业数据进行聚合,生成第一类聚合指标对应的第一聚合结果;第一类聚合指标包括计费指标、计费指标对应的资源消耗总量;计费指标包括集群标识、用户标识、资源类型及资源单价;
185.按照第二类聚合指标对多个计算集群中的实时作业数据进行聚合,生成第二类聚合指标对应的第二聚合结果;第二类聚合指标包括计费指标、在计费指标下执行每次作业的资源消耗量及在计费指标下执行每次作业的作业费用数据。
186.在一个实施例中,根据不同的聚合指标对应的聚合结果对多个计算集群中的实时作业数据进行对账,生成对账结果,处理器执行计算机程序时还实现以下步骤:
187.从第一聚合结果中确定同一资源类型及同一资源单价对应的资源消耗总量,根据资源消耗总量及资源单价,计算同一资源类型及同一资源单价对应的第一作业费用总量;
188.从第二聚合结果中确定同一资源类型及同一资源单价下每次作业的作业费用数据,根据每次作业的作业费用数据确定第二作业费用总量;
189.根据第一作业费用总量及第二作业费用总量,对多个计算集群中的实时作业数据进行对账,生成对账结果。
190.在一个实施例中,根据第一作业费用总量及第二作业费用总量,对多个计算集群中的实时作业数据进行对账,生成对账结果,处理器执行计算机程序时还实现以下步骤:
191.若第一作业费用总量与第二作业费用总量相等,则确定对账结果为对账成功;
192.若第一作业费用总量与第二作业费用总量不相等,则针对各计费指标,从第一聚合结果中获取计费指标对应的第一资源消耗总量,从第二聚合结果中获取计费指标对应的第二资源消耗总量;第二资源消耗总量为第二聚合结果中在计费指标下执行每次作业的资源消耗量之和;
193.对各计费指标对应的第一资源消耗总量及第二资源消耗总量进行比较,生成对账结果。
194.在一个实施例中,获取多个计算集群中的实时作业数据,处理器执行计算机程序时还实现以下步骤:
195.在预设时间段内,获取多个计算集群在计费指标下执行每次作业的作业数据,基于每次作业的作业数据,计算预设时间段内多个计算集群执行所有作业的第一作业数据总量;
196.按照计费指标中的至少一个指标,在预设时间段内获取多个计算集群执行所有作业的第二作业数据总量;第二作业数据总量包括在计费指标下执行每次作业的资源消耗量之和;
197.根据第一作业数据总量与第二作业数据总量,确定多个计算集群中的实时作业数据。
198.在一个实施例中,根据第一作业数据总量与第二作业数据总量,确定多个计算集群中的实时作业数据,处理器执行计算机程序时还实现以下步骤:
199.将第一作业数据总量与第二作业数据总量进行比较,生成比较结果;
200.若比较结果为第一作业数据总量与第二作业数据总量相等,则将第一作业数据总量或第二作业数据总量作为多个计算集群中的实时作业数据。
201.在一个实施例中,处理器执行计算机程序时还实现以下步骤:
202.若比较结果为第一作业数据总量与第二作业数据总量不相等,则在预设时间段内,重新获取多个计算集群执行每次作业的作业数据,基于每次作业的作业数据,计算预设时间段内多个计算集群执行所有作业的新的第一作业数据总量;
203.按照计费指标中的至少一个指标,在预设时间段内重新获取多个计算集群执行所有作业的新的第二作业数据总量;
204.根据新的第一作业数据总量与新的第二作业数据总量,确定多个计算集群中的新的实时作业数据。
205.在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
206.获取多个计算集群中的实时作业数据;
207.按照不同的聚合指标对多个计算集群中的实时作业数据进行聚合,生成不同的聚合指标对应的聚合结果;
208.根据不同的聚合指标对应的聚合结果对多个计算集群中的实时作业数据进行对账,生成对账结果。
209.在一个实施例中,不同的聚合指标包括第一类聚合指标及第二类聚合指标;按照不同的聚合指标对多个计算集群中的实时作业数据进行聚合,生成不同的聚合指标对应的聚合结果,计算机程序被处理器执行时还实现以下步骤:
210.按照第一类聚合指标对多个计算集群中的实时作业数据进行聚合,生成第一类聚合指标对应的第一聚合结果;第一类聚合指标包括计费指标、计费指标对应的资源消耗总量;计费指标包括集群标识、用户标识、资源类型及资源单价;
211.按照第二类聚合指标对多个计算集群中的实时作业数据进行聚合,生成第二类聚合指标对应的第二聚合结果;第二类聚合指标包括计费指标、在计费指标下执行每次作业的资源消耗量及在计费指标下执行每次作业的作业费用数据。
212.在一个实施例中,根据不同的聚合指标对应的聚合结果对多个计算集群中的实时作业数据进行对账,生成对账结果,计算机程序被处理器执行时还实现以下步骤:
213.从第一聚合结果中确定同一资源类型及同一资源单价对应的资源消耗总量,根据资源消耗总量及资源单价,计算同一资源类型及同一资源单价对应的第一作业费用总量;
214.从第二聚合结果中确定同一资源类型及同一资源单价下每次作业的作业费用数据,根据每次作业的作业费用数据确定第二作业费用总量;
215.根据第一作业费用总量及第二作业费用总量,对多个计算集群中的实时作业数据进行对账,生成对账结果。
216.在一个实施例中,根据第一作业费用总量及第二作业费用总量,对多个计算集群中的实时作业数据进行对账,生成对账结果,计算机程序被处理器执行时还实现以下步骤:
217.若第一作业费用总量与第二作业费用总量相等,则确定对账结果为对账成功;
218.若第一作业费用总量与第二作业费用总量不相等,则针对各计费指标,从第一聚合结果中获取计费指标对应的第一资源消耗总量,从第二聚合结果中获取计费指标对应的第二资源消耗总量;第二资源消耗总量为第二聚合结果中在计费指标下执行每次作业的资源消耗量之和;
219.对各计费指标对应的第一资源消耗总量及第二资源消耗总量进行比较,生成对账结果。
220.在一个实施例中,获取多个计算集群中的实时作业数据,计算机程序被处理器执行时还实现以下步骤:
221.在预设时间段内,获取多个计算集群在计费指标下执行每次作业的作业数据,基于每次作业的作业数据,计算预设时间段内多个计算集群执行所有作业的第一作业数据总量;
222.按照计费指标中的至少一个指标,在预设时间段内获取多个计算集群执行所有作业的第二作业数据总量;第二作业数据总量包括在计费指标下执行每次作业的资源消耗量之和;
223.根据第一作业数据总量与第二作业数据总量,确定多个计算集群中的实时作业数据。
224.在一个实施例中,根据第一作业数据总量与第二作业数据总量,确定多个计算集
群中的实时作业数据,计算机程序被处理器执行时还实现以下步骤:
225.将第一作业数据总量与第二作业数据总量进行比较,生成比较结果;
226.若比较结果为第一作业数据总量与第二作业数据总量相等,则将第一作业数据总量或第二作业数据总量作为多个计算集群中的实时作业数据。
227.在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
228.若比较结果为第一作业数据总量与第二作业数据总量不相等,则在预设时间段内,重新获取多个计算集群执行每次作业的作业数据,基于每次作业的作业数据,计算预设时间段内多个计算集群执行所有作业的新的第一作业数据总量;
229.按照计费指标中的至少一个指标,在预设时间段内重新获取多个计算集群执行所有作业的新的第二作业数据总量;
230.根据新的第一作业数据总量与新的第二作业数据总量,确定多个计算集群中的新的实时作业数据。
231.在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
232.需要说明的是,本技术所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
233.本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本技术所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(read-only memory,rom)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(reram)、磁变存储器(magnetoresistive random access memory,mram)、铁电存储器(ferroelectric random access memory,fram)、相变存储器(phase change memory,pcm)、石墨烯存储器等。易失性存储器可包括随机存取存储器(random access memory,ram)或外部高速缓冲存储器等。作为说明而非局限,ram可以是多种形式,比如静态随机存取存储器(static random access memory,sram)或动态随机存取存储器(dynamic random access memory,dram)等。本技术所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本技术所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
234.以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
235.以上实施例仅表达了本技术的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本技术专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本技术构思的前提下,还可以做出若干变形和改进,这些都属于本技术的保护范
围。因此,本技术的保护范围应以所附权利要求为准。

技术特征:
1.一种对账方法,其特征在于,应用于云平台,所述方法包括:获取多个计算集群中的实时作业数据;按照不同的聚合指标对所述多个计算集群中的实时作业数据进行聚合,生成所述不同的聚合指标对应的聚合结果;根据所述不同的聚合指标对应的聚合结果对所述多个计算集群中的实时作业数据进行对账,生成对账结果。2.根据权利要求1所述的方法,其特征在于,所述不同的聚合指标包括第一类聚合指标及第二类聚合指标;所述按照不同的聚合指标对所述多个计算集群中的实时作业数据进行聚合,生成所述不同的聚合指标对应的聚合结果,包括:按照所述第一类聚合指标对所述多个计算集群中的实时作业数据进行聚合,生成所述第一类聚合指标对应的第一聚合结果;所述第一类聚合指标包括计费指标、所述计费指标对应的资源消耗总量;所述计费指标包括集群标识、用户标识、资源类型及资源单价;按照所述第二类聚合指标对所述多个计算集群中的实时作业数据进行聚合,生成所述第二类聚合指标对应的第二聚合结果;所述第二类聚合指标包括所述计费指标、在所述计费指标下执行每次作业的资源消耗量及在所述计费指标下执行每次作业的作业费用数据。3.根据权利要求2所述的方法,其特征在于,所述根据所述不同的聚合指标对应的聚合结果对所述多个计算集群中的实时作业数据进行对账,生成对账结果,包括:从所述第一聚合结果中确定同一所述资源类型及同一所述资源单价对应的资源消耗总量,根据所述资源消耗总量及所述资源单价,计算同一所述资源类型及同一所述资源单价对应的第一作业费用总量;从所述第二聚合结果中确定同一所述资源类型及同一所述资源单价下每次作业的作业费用数据,根据所述每次作业的作业费用数据确定第二作业费用总量;根据所述第一作业费用总量及所述第二作业费用总量,对所述多个计算集群中的实时作业数据进行对账,生成所述对账结果。4.根据权利要求3所述的方法,其特征在于,所述根据所述第一作业费用总量及所述第二作业费用总量,对所述多个计算集群中的实时作业数据进行对账,生成所述对账结果,包括:若所述第一作业费用总量与所述第二作业费用总量相等,则确定所述对账结果为对账成功;若所述第一作业费用总量与所述第二作业费用总量不相等,则针对各计费指标,从所述第一聚合结果中获取所述计费指标对应的第一资源消耗总量,从所述第二聚合结果中获取所述计费指标对应的第二资源消耗总量;所述第二资源消耗总量为所述第二聚合结果中在所述计费指标下执行每次作业的资源消耗量之和;对各所述计费指标对应的第一资源消耗总量及所述第二资源消耗总量进行比较,生成所述对账结果。5.根据权利要求2-4中任一项所述的方法,其特征在于,所述获取多个计算集群中的实时作业数据,包括:在预设时间段内,获取所述多个计算集群在所述计费指标下执行每次作业的作业数据,基于所述每次作业的作业数据,计算所述预设时间段内所述多个计算集群执行所有作
业的第一作业数据总量;按照所述计费指标中的至少一个指标,在所述预设时间段内获取所述多个计算集群执行所有作业的第二作业数据总量;所述第二作业数据总量包括在所述计费指标下执行每次作业的资源消耗量之和;根据所述第一作业数据总量与所述第二作业数据总量,确定所述多个计算集群中的实时作业数据。6.根据权利要求5所述的方法,其特征在于,所述根据所述第一作业数据总量与所述第二作业数据总量,确定所述多个计算集群中的实时作业数据,包括:将所述第一作业数据总量与所述第二作业数据总量进行比较,生成比较结果;若所述比较结果为所述第一作业数据总量与所述第二作业数据总量相等,则将所述第一作业数据总量或所述第二作业数据总量作为所述多个计算集群中的实时作业数据。7.根据权利要求6所述的方法,其特征在于,所述方法还包括:若所述比较结果为所述第一作业数据总量与所述第二作业数据总量不相等,则在所述预设时间段内,重新获取所述多个计算集群执行每次作业的作业数据,基于所述每次作业的作业数据,计算所述预设时间段内所述多个计算集群执行所有作业的新的第一作业数据总量;按照所述计费指标中的至少一个指标,在所述预设时间段内重新获取所述多个计算集群执行所有作业的新的第二作业数据总量;根据所述新的第一作业数据总量与所述新的第二作业数据总量,确定所述多个计算集群中的新的实时作业数据。8.一种对账装置,其特征在于,应用于云平台,所述装置包括:获取模块,用于获取多个计算集群中的实时作业数据;聚合模块,用于按照不同的聚合指标对所述多个计算集群中的实时作业数据进行聚合,生成所述不同的聚合指标对应的聚合结果;对账模块,用于根据所述不同的聚合指标对应的聚合结果对所述多个计算集群中的实时作业数据进行对账,生成对账结果。9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。

技术总结
本申请涉及一种对账方法、装置、计算机设备、存储介质和程序产品。上述方法包括:获取多个计算集群中的实时作业数据;按照不同的聚合指标对多个计算集群中的实时作业数据进行聚合,生成不同的聚合指标对应的聚合结果;根据不同的聚合指标对应的聚合结果对多个计算集群中的实时作业数据进行对账,生成对账结果。采用本方法能够能够针对高复杂度、大数据量的多个计算集群进行对账。多个计算集群进行对账。多个计算集群进行对账。


技术研发人员:赵玉平 吕灼恒 张晋锋 赵欢 张新星 南亚 徐晨
受保护的技术使用者:中科曙光国际信息产业有限公司
技术研发日:2023.06.21
技术公布日:2023/10/11
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐