一种游戏对象处理方法、装置、计算机设备及存储介质与流程

未命名 10-18 阅读：103 评论：0

1.本技术涉及人工智能技术领域，具体涉及一种游戏对象处理方法、装置、计算机设备及存储介质，该存储介质为计算机可读存储介质。

背景技术：

2.目前针对多人在线战术竞技游戏(multiplayer online battle arena，moba)中游戏玩家实力定位方案最常用的是使用分值表示游戏玩家的操作水平。
3.具体来说，游戏玩家实力定位方案是采用通过游戏玩家在游戏对局所得到的分值，直接确定出游戏玩家的操作水平。这种方式对游戏玩家操作水平定位比较单一，无法准确定位出游戏玩家的实际操作水平。

技术实现要素：

4.本技术实施例提供一种游戏对象处理方法、装置、计算机设备及存储介质，能够准确地确定目标对象的操作水平。
5.一种游戏对象处理方法，包括：
6.获取游戏中目标对象和对局对象的对战状态信息集合，对战状态信息集合包括至少一局游戏对应的对战状态信息；
7.对对战状态信息集合包括的对战状态信息进行特征提取，得到对战状态信息对应的对战状态特征信息；
8.根据对战状态特征信息，对目标对象进行操作水平预测，得到每一局游戏对应的操作水平信息；
9.对目标对象的操作水平信息进行融合处理，得到针对目标对象的目标操作水平信息。
10.相应地，本技术实施例提供一种游戏对象处理装置，包括：
11.获取单元，可以用于获取游戏中目标对象和对局对象的对战状态信息集合，对战状态信息集合包括至少一局游戏对应的对战状态信息；
12.提取单元，可以用于对对战状态信息集合包括的对战状态信息进行特征提取，得到对战状态信息对应的对战状态特征信息；
13.预测单元，可以用于根据对战状态特征信息，对目标对象进行操作水平预测，得到每一局游戏对应的操作水平信息；
14.融合单元，可以用于对目标对象的操作水平信息进行融合处理，得到针对目标对象的目标操作水平信息。
15.在一些实施例中，预测单元，具体可以用于对每一局游戏对应的对战状态特征信息进行融合处理，得到每一局游戏对应的融合后状态特征信息；根据每一局游戏对应的融合后状态特征信息，采用训练后操作水平预测模型对目标对象进行操作水平预测，得到每一局游戏对应的操作水平信息。
16.在一些实施例中，对战状态信息包括每一局游戏的时间序列中各时间点对应的对战状态信息；提取单元，具体可以用于对每一局游戏的时间序列中各时间点对应的对战状态信息进行特征提取，得到每一局游戏的时间序列中各时间点对应的对战状态特征信息。
17.对应地，预测单元，具体可以用于根据每一局游戏的时间序列，对时间序列中各时间点对应的对战状态特征信息进行融合处理，得到每一局游戏对应的融合后状态特征信息。
18.在一些实施例中，游戏包括多局；融合单元，具体可以用于针对多局游戏，将其中任一局作为当前局，执行下述操作：针对当前局游戏，若当前局游戏为第一局游戏，则获取目标对象的初始综合操作水平信息，并根据初始综合操作水平信息和目标对象当前局游戏的操作水平信息，计算得到当前局游戏的综合操作水平信息；若当前局游戏不为第一局游戏，则获取目标对象上一局游戏的综合操作水平信息，并根据上一局游戏的综合操作水平信息和目标对象当前局游戏的操作水平信息，计算得到当前局游戏的综合操作水平信息；直至多局游戏中每一局游戏均计算完毕，得到每一局游戏的综合操作水平信息；根据目标对象的综合操作水平信息，确定针对目标对象的目标操作水平信息。
19.在一些实施例中，对战状态特征信息为采用训练后操作水平预测模型对对战状态信息进行特征提取得到的信息；游戏对象处理装置还包括训练单元，训练单元，具体可以用于获取对战数据样本集合，对战数据样本集合包括至少一局游戏中标注操作水平标签的对战数据样本，对战数据样本为针对待预测对象标注了操作水平标签的数据样本；根据对战数据样本，采用待训练操作水平预测模型对待预测对象进行操作水平预测，得到待预测对象针对每一局游戏对应的预测操作水平信息；根据对战数据样本对应的操作水平标签和预测操作水平信息，对待训练操作水平预测模型的模型参数进行收敛，得到训练后操作水平预测模型。
20.在一些实施例中，训练单元，具体可以用于获取第一游戏阵营和第二游戏阵营，第一游戏阵营包括待预测对象和至少一个第一参与对象，第二游戏阵营包括至少一个第二参与对象，其中，待预测对象的候选操作水平信息、第一参与对象的候选操作水平信息和第二参与对象的候选操作水平信息均为随机分配的操作水平信息；将待预测对象、第一参与对象和第二参与对象进行对战处理，以得到对战数据样本；根据待预测对象的候选操作水平信息，确定对战数据样本对应的操作水平标签；根据对战数据样本和对战数据样本对应的操作水平标签，生成对战数据样本集合。
21.在一些实施例中，训练单元，具体可以用于采用待训练操作水平预测模型对对战数据样本进行特征提取，得到样本特征信息；根据样本特征信息，对待预测对象进行操作水平预测，得到待预测对象每一局游戏对应的预测操作水平信息。
22.在一些实施例中，训练单元，具体可以用于针对每一局游戏，对样本特征信息进行融合，得到融合后样本特征信息；根据融合后样本特征信息，对待预测对象进行操作水平预测，得到待预测对象每一局游戏对应的预测操作水平信息。
23.在一些实施例中，训练单元，具体可以用于将待预测对象、第一参与对象和第二参与对象进行对战处理，得到候选对战数据；按照目标时间序列，对候选对战数据进行样本提取，得到待预测对象在每一局游戏中对应的对战数据样本。
24.在一些实施例中，游戏对象处理装置还包括匹配单元，匹配单元具体可以用于根
据目标对象的目标操作水平信息，确定目标对象的目标水平等级信息；根据目标对象的目标水平等级信息，获取至少一个候选对局对象；从候选对局对象中提取出与目标对象匹配的目标对局对象。
25.此外，本技术实施例还提供一种计算机设备，包括存储器和处理器；存储器存储有计算机程序，处理器用于运行存储器内的计算机程序，以执行本技术实施例提供的任一种游戏对象处理方法。
26.此外，本技术实施例还提供一种计算机可读存储介质，计算机可读存储介质存储有计算机程序，计算机程序适于处理器进行加载，以执行本技术实施例提供的任一种游戏对象处理方法。
27.此外，本技术实施例还提供一种计算机程序产品，包括计算机程序，计算机程序被处理器执行时实现本技术实施例所提供的任一种游戏对象处理方法。
28.本技术实施例可以获取游戏中目标对象和对局对象的对战状态信息集合，对战状态信息集合包括至少一局游戏对应的对战状态信息；对对战状态信息集合包括的对战状态信息进行特征提取，得到对战状态信息对应的对战状态特征信息；根据对战状态特征信息，对目标对象进行操作水平预测，得到每一局游戏对应的操作水平信息；对目标对象的操作水平信息进行融合处理，得到针对目标对象的目标操作水平信息。由于本技术实施例可以根据目标对象和对局对象之间的每一局游戏对应的对战状态信息，确定出每一局游戏的操作水平信息，如此能够准确地计算出目标对象的目标操作水平信息，进而准确地确定出目标对象的操作水平。
附图说明
29.为了更清楚地说明本技术实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本技术的一些实施例，对于本领域技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
30.图1是本技术实施例提供的游戏对象处理方法的场景示意图；
31.图2是本技术实施例提供的游戏对象处理方法的流程示意一图；
32.图3是本技术实施例提供的对待训练操作水平预测模型进行训练的流程示意图；
33.图4是本技术实施例提供的游戏对象处理方法的流程示意二图；
34.图5是本技术实施例提供的待训练操作水平预测模型的结构图；
35.图6是本技术实施例提供的训练后操作水平预测模型的应用示意图；
36.图7是本技术实施例提供的针对目标对象的目标操作水平信息的收敛示意图；
37.图8是本技术实施例提供的游戏对象处理装置的结构示意图；
38.图9是本技术实施例提供的计算机设备的结构示意图。
具体实施方式
39.下面将结合本技术实施例中的附图，对本技术实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本技术一部分实施例，而不是全部的实施例。基于本技术中的实施例，本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施
例，都属于本技术保护的范围。
40.本技术实施例提供一种游戏对象处理方法、装置、计算机设备及计算机可读存储介质。其中，该游戏对象处理装置可以集成在计算机设备中，该计算机设备可以是服务器，也可以是终端等设备。
41.其中，服务器可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、网络加速服务(content delivery network，cdn)、以及大数据和人工智能平台等基础云计算服务的云服务器。终端可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等，但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接，本技术在此不做限制。终端包括但不限于手机、电脑、智能语音交互设备、智能家电、车载终端、飞行器等。本技术实施例可应用于各种场景，包括但不限于云技术、人工智能、智慧交通、辅助驾驶等。
42.其中，本技术实施例可以涉及人工智能(artificial intelligence，ai)，人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。
43.人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
44.例如，参见图1，以游戏对象处理装置集成在计算机设备中为例，计算机设备可以获取游戏中目标对象和对局对象的对战状态信息集合；对对战状态信息集合包括的对战状态信息进行特征提取，得到对战状态信息对应的对战状态特征信息；根据对战状态特征信息，对目标对象进行操作水平预测，得到每一局游戏对应的操作水平信息；对目标对象的操作水平信息进行融合处理，得到针对目标对象的目标操作水平信息。
45.其中，对战状态信息集合包括至少一局游戏对应的对战状态信息，每一局游戏可以对应若干对战状态信息。
46.其中，游戏可以是任意的游戏，例如，游戏可以是人机对局的游戏，也即玩家在游戏中控制的虚拟对象和人工智能在游戏中控制的虚拟对象进行对局的游戏；例如，游戏可以是人和人对局的游戏，也即玩家在游戏中所控制的虚拟对象进行对局的游戏。
47.其中，目标对象可以是指目标玩家在游戏中所控制的虚拟对象；目标对象可以包括至少一个虚拟对象。
48.其中，对局对象可以是指人工智能在游戏中所控制的虚拟对象，也可以是指非目标玩家在游戏中所控制的虚拟对象；对局对象可以包括至少一个虚拟对象。
49.其中，操作水平信息可以是表征在一局游戏中，通过预测得到的目标玩家对目标对象在操作上所展现的游戏操作实力；目标操作水平信息可以是表征在至少一局游戏中，目标玩家在对目标对象在操作上所展现的实际游戏操作实力。
50.以下分别进行详细说明。需说明的是，以下实施例的描述顺序不作为对实施例优选顺序的限定。
51.本实施例将从游戏对象处理装置的角度进行描述，该游戏对象处理装置具体可以集成在计算机设备中，该计算机设备可以是服务器，也可以是终端等设备；其中，该终端可以包括平板电脑、笔记本电脑、以及个人计算机(pc，personal computer)、可穿戴设备、虚拟现实设备或其他可以获取数据的智能设备等设备。
52.如图2所示，该游戏对象处理方法的具体流程如步骤s101-s104：
53.s101、获取游戏中目标对象和对局对象的对战状态信息集合。
54.其中，对战状态信息集合包括至少一局游戏对应的对战状态信息。每一局游戏可以对应若干对战状态信息。
55.在本技术实施例中，目标对象可以是指目标玩家在游戏中所控制的虚拟对象；目标对象可以包括至少一个虚拟对象。对局对象可以是指人工智能的神经网络模型在游戏中所控制的虚拟对象，也可以是指非目标玩家在游戏中所控制的虚拟对象；对局对象可以包括至少一个虚拟对象。
56.例如，在本技术实施例中，对局阵营可以包括至少两个阵营，比如，对局阵营包括第一对局阵营和第二对局阵营，其中，第一对局阵营包括至少一个目标对象，第二对局阵营包括至少一个对局对象。第一对局阵营和第二对局阵营进行对战，以得到第一对局阵营和第二对局阵营进行对局的游戏局对应的游戏状态信息。
57.在本技术实施例中，由于在目标对象和对局对象的对局中，所产生的候选对战状态信息并非都是本技术实施例所需要的，候选对战状态信息可以是指目标对象和对局对象在对战过程中所产生的任意信息。基于此，本技术实施例针对每一局游戏，可以按照时间序列中的各时间点对候选对战状态信息进行信息提取，如此，计算机设备可以提取到每一局游戏的时间序列中各时间点对应的对战状态信息。在本技术实施例中，每一局游戏的时间序列包括多个时间点。
58.s102、对对战状态信息集合中包括的对战状态信息进行特征提取，得到对战状态信息对应的对战状态特征信息。
59.其中，对战状态特征信息可以为采用特征提取模型进行特征提取到的信息，特征提取模型可以为现有的相关技术中的神经网络模型。
60.对战状态特征信息还可以为采用训练后操作水平预测模型进行特征提取到的信息，训练后操作水平预测模型为对待训练操作水平预测模型进行训练后所得到的模型。
61.其中，对战状态特征信息可以包括至少一个状态维度对应的对战状态特征信息，状态维度可以包括阵容维度、位置维度和对战维度。
62.阵容维度用于表征对象在对局阵营中的阵容，对象包括目标对象和对局对象。具体来说，阵容维度的对战状态特征信息包括目标对象对应的阵容维度的对战状态特征信息和对局对象对应的阵容维度的对战状态特征信息；其中，目标对象对应的阵容维度的对战状态特征信息可以为目标对象所在的对局阵营中的阵容信息，对局对象对应的阵容维度的对战状态特征信息可以为对局对象所在的对局阵营中的阵容信息。
63.位置维度用于表征对象在对局阵营中的位置，对象包括目标对象和对局对象。具体来说，位置维度的对战状态特征信息包括目标对象对应的位置维度的对战状态特征信息
和对局对象对应的位置维度的对战状态特征信息；其中，目标对象对应的位置维度的对战状态特征信息可以为目标对象在对局阵营中的位置信息；对局对象对应的位置维度的对战状态特征信息可以为对局对象所在对局阵营中的位置信息。
64.对战维度可以是指除了位置维度和阵容维度之外的维度，对战维度用于表征对象在对局中的对战状态。具体来说，对战维度的对战状态特征信息可以为目标对象和对局对象在游戏对战过程的对战信息。
65.本技术实施例中，对战状态信息包括每一局游戏的时间序列中各时间点对应的对战状态信息，基于此，本技术实施例可以对每一局游戏的时间序列中各时间点对应的对战状态信息进行特征提取，得到每一局游戏的时间序列中各时间点对应的对战状态特征信息。
66.由于训练后操作水平预测模型为对待训练操作水平预测模型进行训练后所得到的模型，基于此，本技术实施例可以对待训练操作水平预测模型进行训练，如图3所示，训练过程如步骤a1-a3：
67.a1、获取对战数据样本集合。
68.其中，对战数据样本集合包括至少一局游戏中标注操作水平标签的对战数据样本，对战数据样本为针对待预测对象标注了操作水平标签的数据样本。
69.在本技术实施例中，计算机设备获取对战数据样本集合的方式可以如下：
70.例如，计算机设备可以获取第一游戏阵营和第二游戏阵营，第一游戏阵营包括待预测对象和至少一个第一参与对象，第二游戏阵营包括至少一个第二参与对象；将待预测对象、第一参与对象和第二参与对象进行对战处理，以得到对战数据样本；根据待预测对象的候选操作水平信息，确定对战数据样本对应的操作水平标签；根据对战数据样本和对战数据样本对应的操作水平标签，生成对战数据样本集合。
71.其中，本技术实施例为了模拟玩家在新手阶段所匹配的对局对象和游戏难度不准确的情况，本技术实施例中待预测对象的候选操作水平信息、第一参与对象的候选操作水平信息和第二参与对象的候选操作水平信息均为随机分配的操作水平信息。在本技术实施例中，候选操作水平信息可以以游戏操作难度等级表征。在本技术实施例中，待预测对象、第一参与对象和第二参与对象均可以由神经网络模型控制，基于此，计算机设备可以随机对待预测对象、第一参与对象和第二参与对象分配候选操作水平信息。
72.其中，本技术实施例将待预测对象、第一参与对象和第二参与对象进行对战处理，以得到对战数据样本的方式可以为：计算机设备可以将待预测对象、第一参与对象和第二参与对象进行对战处理，得到候选对战数据；按照目标时间序列，对候选对战数据进行样本提取，得到待预测对象在每一局游戏中对应的对战数据样本。
73.本技术实施例中，目标时间序列可以是指一局游戏中的目标时间序列，目标时间序列可以包括多个时间点，在本技术实施实施例中，以目标时间序列可以包括一局游戏中的十二个时间点为例进行说明。在本技术实施例中，针对每一局游戏，计算机设备可以按照目标时间序列中十二个时间点对候选对战数据进行样本提取，得到待预测对象在每一局游戏中对应的对战数据样本。
74.a2、根据对战数据样本，采用待训练操作水平预测模型对待预测对象进行操作水平预测，得到待预测对象针对每一局游戏对应的预测操作水平信息。
75.其中，本技术实施例根据对战数据样本，采用待训练操作水平预测模型对待预测对象进行操作水平预测，得到待预测对象针对每一局游戏对应的预测操作水平信息的方式可以如下：
76.例如，计算机设备可以采用待训练操作水平预测模型对对战数据样本进行特征提取，得到样本特征信息；根据样本特征信息，对待预测对象进行操作水平预测，得到待预测对象每一局游戏对应的预测操作水平信息。
77.其中，本技术实施例根据样本特征信息，对待预测对象进行操作水平预测，得到待预测对象每一局游戏对应的预测操作水平信息的方式可以为：针对每一局游戏，对样本特征信息进行融合，得到融合后样本特征信息；根据融合后样本特征信息，对待预测对象进行操作水平预测，得到待预测对象每一局游戏对应的预测操作水平信息。
78.本技术实施例针对每一局游戏，对样本特征信息进行融合，得到融合后样本特征信息的方式可以为：对目标时间序列中各时间点对应的样本特征信息按照目标时间序列升序拼接，构建候选时序特征信息，候选时序特征信息即为融合后样本特征信息。
79.a3、根据对战数据样本对应的操作水平标签和预测操作水平信息，对待训练操作水平预测模型的模型参数进行收敛，得到训练后操作水平预测模型。
80.其中，操作水平标签可以理解为是待预测对象的真实操作水平信息。
81.可以理解的是，对战数据样本对应的操作水平标签和预测操作水平信息均针对同一待预测对象的同一局游戏。
82.基于上述，本技术实施例可以通过损失函数计算操作水平标签和预测操作水平信息之间的损失值；根据损失值对待训练操作水平预测模型的模型参数进行收敛，得到训练后操作水平预测模型。
83.其中，损失函数可以是交叉熵损失函数，可以是指数损失函数，还可以是均方误差损失函数等。
84.其中，损失函数可以为交叉熵损失函数，可以为均方误差损失函数。
85.s103、根据对战状态特征信息，对目标对象进行操作水平预测，得到每一局游戏对应的操作水平信息。
86.本技术实施例根据对战状态特征信息，对目标对象进行操作水平预测，得到每一局游戏对应的操作水平信息的方式有多种：
87.例如，计算机设备根据对战状态特征信息，采用现有的相关技术中的游戏水平预测模型对目标对象进行操作水平预测，得到每一局游戏对应的操作水平信息。
88.又例如，计算机设备可以对每一局游戏对应的对战状态特征信息进行融合处理，得到每一局游戏对应的融合后状态特征信息；根据每一局游戏对应的融合后状态特征信息，采用训练后操作水平预测模型对目标对象进行操作水平预测，得到每一局游戏对应的操作水平信息。
89.其中，由于本技术实施例的对战状态特征信息可以包括每一局游戏的时间序列中各时间点对应的对战状态特征信息，基于此，本技术实施例对每一局游戏对应的对战状态特征信息进行融合处理，得到每一局游戏对应的融合后状态特征信息的方式可以为：根据每一局游戏的时间序列，对时间序列中各时间点对应的对战状态特征信息进行融合处理，得到每一局游戏对应的融合后状态特征信息。
90.在本技术实施例中，对时间序列中各时间点对应的对战状态特征信息进行融合处理的方式可以是对时间序列中各时间点对应的对战状态特征信息按照时间序列升序拼接，构造时序特征信息，该时序特征信息即为融合后状态特征信息。
91.s104、对目标对象的操作水平信息进行融合处理，得到针对目标对象的目标操作水平信息。
92.在本技术实施例中，计算机设备可以根据每一局游戏对应的操作水平信息，确定目标对象的目标操作水平信息。
93.本技术实施例对目标对象的操作水平信息进行融合处理，得到针对目标对象的目标操作水平信息的方式可以如下：
94.本技术实施例中，游戏包括多局；针对多局游戏，将其中任一局作为当前局，执行下述操作：例如，针对当前局游戏，若当前局游戏为第一局游戏，则获取目标对象的初始综合操作水平信息，并根据初始综合操作水平信息和目标对象当前局游戏的操作水平信息，计算得到当前局游戏的综合操作水平信息；若当前局游戏不为第一局游戏，则获取目标对象上一局游戏的综合操作水平信息，并根据上一局游戏的综合操作水平信息和目标对象当前局游戏的操作水平信息，计算得到当前局游戏的综合操作水平信息；直至多局游戏中每一局游戏均计算完毕，得到每一局游戏的综合操作水平信息；根据目标对象的综合操作水平信息，确定针对目标对象的目标操作水平信息。
95.其中，初始综合操作水平信息可以是计算机设备初始化的综合操作水平信息。
96.其中，上一局游戏是指当前局的上一局游戏。
97.由于本技术实施例的操作水平信息可以采用数值进行表征，初始综合操作水平信息也可以采用数值表征，基于此，本技术实施例根据初始综合操作水平信息和目标对象当前局游戏的操作水平信息，计算得到当前局游戏的综合操作水平信息的方式可以为：获取预设函数；根据预设函数，对初始综合操作水平信息和目标对象当前局游戏的操作水平信息进行映射处理，得到当前局游戏的综合操作水平信息。
98.同理，本技术实施例也可以根据该预设函数，对上一局游戏的综合操作水平信息和目标对象当前局游戏的操作水平信息进行映射处理，得到当前局游戏的综合操作水平信息。
99.其中，综合操作水平信息可以以数值形式表征，目标操作水平信息可以以数值形式表征。
100.本技术实施例根据目标对象的综合操作水平信息，确定针对目标对象的目标操作水平信息的方式有多种：
101.例如，计算机设备计算每一局游戏对应的综合操作水平信息的平均值，将该平均值作为针对目标对象的目标操作水平信息。
102.又例如，游戏包括多局，综合操作水平信息包括上一局游戏的综合操作水平信息和当前局游戏的综合操作水平信息。
103.针对当前局游戏，若当前局游戏为第一局游戏，则计算当前局游戏的综合操作水平信息和初始综合操作水平信息之间的差异信息；若当前局游戏不为第一局游戏，则计算上一局游戏的综合操作水平信息和当前局游戏的综合操作水平信息之间的差异信息，差异信息可以以数值表征；将每一局游戏作为当前局游戏，重复执行若当前局游戏为第一局游
戏，则计算当前局游戏的综合操作水平信息和初始综合操作水平信息之间的差异信息；若当前局游戏不为第一局游戏，则计算上一局游戏的综合操作水平信息和当前局游戏的综合操作水平信息之间的差异信息的步骤，直至差异信息小于或等于预设阈值，得到针对目标对象的目标操作水平信息。其中，预设阈值可以为0。
104.本技术实施例在步骤s104之后，还可以为目标对象匹配对应的目标对局对象，例如，计算机设备可以根据目标对象的目标操作水平信息，确定目标对象的目标水平等级信息；根据目标对象的目标水平等级信息，获取至少一个候选对局对象；从候选对局对象中提取出与目标对象匹配的目标对局对象。
105.其中，本技术实施例可以获取映射关系集合，映射关系集合包括预设操作水平信息和预设水平等级信息之间的映射关系；根据映射关系集合，确定目标对象的目标操作水平信息对应的目标水平等级信息。
106.其中，本技术实施例的候选对局对象与目标水平等级信息具有对应关系，基于此，本技术实施例可以获取至少一个候选对局对象。
107.其中，目标对局对象与目标对象匹配的情况有多种，例如，当目标对局对象对应的水平等级信息与目标对象的目标水平等级信息相同时，此种情况可以称目标对局对象与目标对象匹配；当目标对局对象对应的水平等级信息与目标对象的目标水平等级信息相同，且目标对局对象的对象种类与目标对象的对象种类满足预设规则时，此种情况可以称目标对局对象与目标对象匹配。
108.本技术实施例可以获取游戏中目标对象和对局对象的对战状态信息集合，对战状态信息集合包括至少一局游戏对应的对战状态信息；对对战状态信息集合包括的对战状态信息进行特征提取，得到对战状态信息对应的对战状态特征信息；根据对战状态特征信息，对目标对象进行操作水平预测，得到每一局游戏对应的操作水平信息；对目标对象的操作水平信息进行融合处理，得到针对目标对象的目标操作水平信息。由于本技术实施例可以根据目标对象和对局对象之间的每一局游戏对应的对战状态信息，确定出每一局游戏的操作水平信息，如此能够准确地计算出目标对象的目标操作水平信息，进而准确地确定出目标对象的操作水平。
109.根据上面实施例所描述的方法，以下将举例作进一步详细说明。
110.在本实施例中，将以该游戏对象处理装置具体集成在计算机设备，计算机设备为服务器。
111.如图4所示，一种游戏对象处理方法，具体步骤如下s201-s207：
112.s201、计算机设备获取对战数据样本集合。
113.在本技术实施例中，计算机设备获取对战数据样本集合的方式可以如下：
114.例如，计算机设备可以获取第一游戏阵营和第二游戏阵营，第一游戏阵营包括待预测对象和至少一个第一参与对象，第二游戏阵营包括至少一个第二参与对象；将待预测对象、第一参与对象和第二参与对象进行对战处理，以得到对战数据样本；根据待预测对象的候选操作水平信息，确定对战数据样本对应的操作水平标签；根据对战数据样本和对战数据样本对应的操作水平标签，生成对战数据样本集合。
115.具体来讲，在游戏中，计算机设备对第一游戏阵营和第二游戏阵营可以采用颜色进行区分。例如，第一游戏阵营的颜色为红色，第二游戏阵营的颜色为蓝色。第一游戏阵营
和第二游戏阵营中均设置五个虚拟对象，第一游戏阵营中的虚拟对象包括待预测对象和四个第一参与对象，第二游戏阵营中的虚拟对象包括五个第二参与对象。每一虚拟对象由对应的神经网络模型控制。
116.然后，针对第一游戏阵营，计算机设备获取第一预设操作水平信息集合，第一预设操作水平信息集合包括若干第一预设操作水平信息，从第一预设操作水平信息集合中随机提取到第一预设操作水平信息作为待预测对象的候选操作水平信息。计算机设备获取第二预设操作水平信息集合，第二预设操作水平信息集合包括若干第二预设操作水平信息，从第二预设操作水平信息集合中随机提取到第二预设操作水平信息作为各第一参与对象的候选操作水平信息。
117.针对第二游戏阵营，计算机设备获取第三预设操作水平信息集合，第三预设操作水平信息集合包括若干第三预设操作水平信息，从第三预设操作水平信息集合中随机提取到第三预设操作水平信息作为各第二参与对象的候选操作水平信息。其中，第一预设操作水平信息集合、第二预设操作水平信息集合以及第三预设操作水平信息集合可根据具体需求设定。
118.基于上述，在神经网络模型控制下，第一游戏阵营和第二游戏阵营进行对战，以得到对战数据样本。也即，本技术实施例将待预测对象、第一参与对象和第二参与对象进行对战处理，以得到对战数据样本的方式可以为：计算机设备可以将待预测对象、第一参与对象和第二参与对象进行对战处理，得到候选对战数据；按照每一局游戏的目标时间序列，对候选对战数据进行样本提取，得到待预测对象在每一局游戏中对应的对战数据样本。
119.其中，在本技术实施例中，由于候选操作水平信息可以以游戏操作难度等级表征，基于此，本技术实施例可以预先设置不同预设游戏操作难度等级范围作为区分条件，来区分模拟待预测对象的单人对战的情况和模拟待预测对象的团队对战的情况。
120.例如，针对待预测对象的单人对战的情况，待预测对象的候选操作水平信息可以在第一预设游戏操作难度等级范围内，而第一参与对象的候选操作水平信息和第二参与对象的候选操作水平信息不在第一预设游戏操作难度等级范围内。此种情况，计算机设备可以只针对待预测对象对应的候选对战数据进行样本提取，如此，可以模拟待预测对象的单人对战的情况。
121.针对待预测对象的团队对战的情况，待预测对象的候选操作水平信息和第一参与对象的候选操作水平可以在第二预设游戏操作难度等级范围内。此种情况，计算机设备可以针对待预测对象所在的第一游戏阵营中所有虚拟对象对应的候选对战数据进行样本提取，如此，可以模拟待预测对象的团队对战的情况。
122.其中，在本技术实施例的第一游戏阵营和第二游戏阵营进行了至少420场游戏对战，针对待预测对象的团队对战的情况，本技术实施例可以生成至少500万条对战数据样本。针对待预测对象的单人对战的情况，待预测对象也可以进行多次对战，生成大量对战数据样本。
123.本技术实施例中，目标时间序列可以包括每一局游戏的十二个时间点。在本技术实施例中，若第一游戏阵营和第二游戏阵营进行对战的对局时长中时间点不满足目标时间序列，可以不获取对战数据样本。
124.s202、计算机设备根据对战数据样本，采用待训练操作水平预测模型对待预测对
象进行操作水平预测，得到待预测对象针对每一局游戏对应的预测操作水平信息。
125.例如，计算机设备可以采用待训练操作水平预测模型的特征提取层对对战数据样本进行特征提取，得到样本特征信息；根据样本特征信息，对待预测对象进行操作水平预测，得到待预测对象每一局游戏对应的预测操作水平信息。
126.其中，计算机设备可以针对每一局游戏，对样本特征信息进行融合，得到融合后样本特征信息；根据融合后样本特征信息，对待预测对象进行操作水平预测，得到待预测对象每一局游戏对应的预测操作水平信息。
127.其中，本技术实施例采集到的样本特征信息可以包括多个候选维度的样本特征信息，候选维度包括：虚拟对象位置、mvp(most valuable player，最有价值游戏者)得分、虚拟对象的候选操作水平信息、阵营数量、待预测对象参与阵营的概率、待预测对象对第二参与对象的伤害数、虚拟对象的虚拟击杀数、虚拟对象的虚拟击杀占比、虚拟对象的虚拟承伤数、虚拟建筑伤害值、虚拟助攻数、虚拟补刀数、虚拟死亡数、虚拟死亡占队比、虚拟承伤死亡比、虚拟伤害击杀比、虚拟对象等级、虚拟金钱、对局时长、阵营的虚拟击杀数，阵营的虚拟对象的虚拟死亡数、待预测对象所在阵营、待预测对象所在阵营颜色、对局结果、对局阵营的虚拟击杀数、对局阵营的虚拟死亡数、待预测对象所在阵营平均每分钟的虚拟击杀数、待预测对象所在阵营平均每分钟的虚拟死亡数、平均每分钟虚拟击杀数、平均每分钟虚拟助攻数、平均每分钟虚拟死亡数、平均每分钟所得虚拟金钱数、平均每分钟阵营虚拟金钱差、平均每分钟阵营虚拟击杀差、平均每分钟虚拟补刀数、待预测对象平均每分钟造成虚拟对象伤害值、待预测对象平均每分钟受到虚拟对象伤害值、待预测对象平均每分钟参团数、平均每分钟mvp得分、平均每分钟(mvp分-阵营平均mvp分)、平均每分钟(mvp分-双方阵营平均mvp分)\平均每分钟(mvp分-对方阵营平均mvp分)、待预测对象所在阵营平均mvp分、对局阵营平均mvp分、mvp分-阵营平均mvp分、mvp分-双方阵营平均mvp分、mvp分-对局阵营平均mvp分、对局阵营平均每分钟人头数、对局阵营平均每分钟的虚拟金钱数、待虚拟对象所在阵营的候选操作水平信息与对局阵营的候选操作水平信息之间的差距、对局阵营。
128.在本技术实施例的样本特征信息可以包括离散特征信息和连续特征信息。
129.基于上述，其中，离散特征信息可以包括虚拟对象身份候选维度的样本特征信息、虚拟对象位置候选维度的样本特征信息、对局结果候选维度的样本特征信息、虚拟对象的候选操作水平信息候选维度的样本特征信息，以及对局阵营候选维度的样本特征信息。除了离散特征信息中的候选维度所对应的样本特征信息，其它候选维度所对应的样本特征信息可以视为连续特征信息。
130.针对连续特征信息，计算机设备进行离散化处理，例如，采用等频或等距对连续特征信息进行分桶处理，以对连续特征信息离散化。具体来说，针对每一连续特征信息，计算机设备将连续特征信息分成若干个不同的桶，例如，15-20区间内任意数量个不同的桶，如此，将连续特征信息转化为离散特征信息。
131.针对上述的离散特征信息，由于离散特征信息可以用数值表示，基于此，计算机设备将大于目标阈值的离散特征信息过滤，如此可以过滤异常的离散特征信息，得到过滤后特征信息。然后，对过滤后特征信息进行编码，编码包括one-hot编码和multi-hot编码。
132.其中，本技术实施例还可以将预设离散特征信息对大于目标阈值的离散特征信息进行替换，得到替换后离散特征信息；基于此，本技术实施例可以将替换后离散特征信息和
正常的离散特征信息作为过滤后特征信息。
133.one-hot编码可以是指离散特征信息的二进制向量编码形式，其将离散值映射到整数值，其中，每个整数值被表示为二进制向量，除了整数的索引之外，它都是零值，它被标记为1。
134.multi-hot编码可以是指离散特征信息的二进制向量编码形式，其将离散值映射到整数值，其中，每个整数值被表示为二进制向量，除了若干个整数的索引为1之外，其他都是零值。
135.具体来说，本技术实施例可以对过滤后特征信息进行one-hot编码，得到one-hot编码特征信息；对one-hot编码特征信息进行multi-hot编码，得到multi-hot编码特征信息；将multi-hot编码特征信息作为样本特征信息，如此可以消除位置偏差。
136.例如，候选虚拟对象包括第一候选虚拟对象和第二候选虚拟对象，第一候选虚拟对象的位置的one-hot编码特征信息可以表示为010，第二候选虚拟对象的位置的one-hot编码特征信息可以表示为001；通过multi-hot编码，得到multi-hot编码特征信息可以表示为010001或者001010，如此消除位置偏差。
137.本技术实施例针对每一局游戏，对样本特征信息进行融合，得到融合后样本特征信息的方式可以为：计算机设备对目标时间序列中各时间点对应的样本特征信息按照目标时间序列升序拼接，构建候选时序特征信息，候选时序特征信息即为融合后样本特征信息。
138.进一步来说，如图5所示，待训练操作水平预测模型可以为omninet神经网络模型，待训练操作水平预测模型包括特征提取层、transformer层、omnidirectional attention层和输出层。
139.在对待训练操作水平预测模型的训练时，将整个数据集(约500万条)划分为训练集(80％)，以及测试集(20％)，模型训练batchsize(即，批量大小)设为2000。
140.其中，特征提取层可以用于将对战数据样本映射到维度空间，得到对战数据样本对应的样本特征信息。在本技术实施例中，对战数据样本可以以游戏对战图像的形式展示。例如，针对每一局游戏，对战数据样本包括目标时间序列中每一时间点对应的对战数据样本。目标时间序列中时间点包括第一时间点、第二时间点
……
第n时间点。n为正整数，在本技术实施例中，n可以设置为十二。
141.在本技术实施例中，对战数据样本包括每一局中，目标时间序列各时间点对应的对战数据样本。待训练操作水平预测模型的特征提取层对目标时间序列中各时间点对应的对战数据样本进行特征提取，得到目标时间序列中各时间点对应的样本特征信息。其中，样本特征信息可以包括至少一个状态维度对应的样本特征信息，状态维度可以包括阵容维度、位置维度和对战维度，阵容维度和位置维度和对战维度可以参见前述解释，此处不再赘述。
142.其中，本技术实施例的每一状态维度对应的样本特征信息可以包括至少一个候选维度的样本特征信息，例如，阵容维度的样本特征信息可以包括阵营数量候选维度的样本特征信息、待预测对象所在阵营候选维度的样本特征信息、待预测对象所在阵营颜色候选维度的样本特征信息、对局阵营候选维度的样本特征信息。位置维度的样本特征信息可以包括虚拟对象位置候选维度的样本特征信息。本技术实施例中，其它候选维度的样本特征信息均可以被包括于对战维度的样本特征信息中。
143.本技术实施例对目标时间序列中各时间点对应的样本特征信息按照目标时间序列升序拼接，构建候选时序特征信息，候选时序特征信息即为融合后样本特征信息，可以理解为，融合后样本特征信息为阵容维度的样本特征信息、位置维度的样本特征信息和对战维度的样本特征信息，按照目标时间序列升序拼接所得到的特征信息。
144.由于融合后样本特征信息为在一局游戏中多次采集的候选时序特征信息，本技术实施例采用擅长处理时序特征信息的transformer作为待训练操作水平信息预测模型的基本架构。transformer层具有至少6层神经网络层，相比于传统的序列深度学习模型，如rnn和lstm，transformer层采用self-attention代替自循环依赖，transformer层的结构便于并行化，可解释性也更强。
145.在本技术实施例中以transformer层具有l-1层神经网络层为例进行阐述，l为正整数，且l大于1。本技术实施例中，融合后样本特征信息x输入到transformer层进行处理，transformer层的第一层神经网络层对融合后样本特征信息的处理可表示为公式(1)：
[0146][0147]
其中，x1表示transformer层中第一层神经网络层的特征信息，可以表示第n个时间点对应的对战数据样本经过特征提取层和transformer层中第一层神经网络处理，由第一层神经网络采集到的样本特征信息。
[0148]
transformer层的第二层神经网络层对x1进行处理，得到transformer层中第二层神经网络层的特征信息，可参见公式(2)：
[0149][0150]
其中，x2表示transformer层中第二层神经网络层所采集到的特征信息，可以表示第n个时间点对应的对战数据样本经过特征提取层和transformer层中第一层神经网络以及transformer层中第二层神经网络处理，由第二层神经网络采集到的样本特征信息。
[0151]
依次类推，可得到transformer层中第l-1层神经网络层的特征信息，参见公式(3)：
[0152][0153]
其中，x
l-1
表示transformer层中第l-1层神经网络层所得到的特征信息，可以表示第n个时间点对应的对战数据样本经过特征提取层和transformer层中的l-1层神经网络处理，由第l-1层神经网络采集到的样本特征信息。
[0154]
omnidirectional attention层即全方位注意力神经网络层，其采用self-attention，omnidirectional attention层允许每个样本特征信息都与整个网络中的所有样本特征信息进行“交互”，使其具有神经网络整个宽度和深度的接受域。这样密集的残差连接形式，有助于梯度传播并增强训练后操作水平预测模型的特征表达能力，使预测结果更加准确，使其比传统transformer模型具有更高的精确度。
[0155]
omnidirectional attention层接收transformer层的输出特征信息，transformer层的输出特征信息xformer(x)可表示为公式(4)：
[0156]
xformer(x)＝x1，x2，...，x
l-1
ꢀꢀꢀꢀ
公式(4)
[0157]
omnidirectional attention层对transformer层的输出特征进行处理，得到处理
后特征信息o，可表示为公式(5)：
[0158]
o＝attend(indexsort(x1，x2，...，x
l-1
))
ꢀꢀꢀꢀꢀ
公式(5)
[0159]
其中，attend表示self-attention的计算规则，indexsort是指按索引排序。
[0160]
本技术实施例对处理后特征信息o进行池化处理，得到池化后特征信息o'。
[0161]
最终，omnidirectional attention层的目标输出特征信息omninet(x)可以表示为公式(6)：
[0162]
omninet(x)＝xformer(x)+o'
ꢀꢀꢀꢀꢀ
公式(6)
[0163]
本技术实施例的omninet神经网络模型包括transformer的encoder结构，即包括特征提取层、transformer层、omnidirectional attention层，然后，在encoder结构上直接接入输出层进行预测。
[0164]
基于此，本技术实施例将omnidirectional attention层的目标输出特征信息通过输出层进行预测，得到预测操作水平信息。在本技术实施例中，输出层可以对目标输出特征信息进行分类，得到针对每一个预设操作水平信息的分类概率；分类概率值最大的预测操作水平信息即为上述的操作水平信息。
[0165]
omninet的attention机制可以动态学习局内不同时间切片特征的重要性。本技术实施例transformer层可以仅仅使用6层神经网络层，使本技术实施例的omninet神经网络模型成为一个轻量级模型，omninet神经网络模型的参数《2m。这样的轻量级模型易并行，推理速度快，能满足线上性能要求。omninet神经网络模型采用transformer层作为基础结构可以更好的支持模型训练，方便模型版本迭代快速更新。
[0166]
s203、计算机设备根据对战数据样本对应的操作水平标签和预测操作水平信息，对待训练操作水平预测模型的模型参数进行收敛，得到训练后操作水平预测模型。
[0167]
本技术实施例可以通过损失函数计算操作水平标签和预测操作水平信息之间的损失值；根据损失值对待训练操作水平预测模型的模型参数进行收敛，得到训练后操作水平预测模型。
[0168]
其中，损失函数可以为交叉熵损失函数。待训练操作水平预测模型采用adam优化器。待训练操作水平预测模型的学习率采用1e-4，l2正则化采用1e-4，训练大概在200epoch左右收敛，并使用4gpu服务器对待训练操作水平预测模型进行训练，可以在较短时间内使待训练操作水平预测模型收敛并达到较好效果。
[0169]
基于上述，本技术实施例进一步进行阐述，本技术实施例的计算机设备可以为服务器，服务器获取到对战数据样本，并根据对战数据样本，在服务器上对待训练操作水平预测模型进行训练，得到训练后操作水平预测模型。本技术实施例可以将训练后操作水平预测模型进行在线部署。训练后操作水平预测模型可以在玩家的新手阶段触发。
[0170]
s204、计算机设备获取游戏中目标对象和对局对象的对战状态信息集合。
[0171]
其中，对战状态信息集合包括至少一局游戏对应的若干对战状态信息。
[0172]
在本技术实施例中，由于在目标对象和对局对象的对局中，所产生的候选对战状态信息并非都是本技术实施所需要的，候选对战状态信息可以是指目标对象和对局对象在对战过程中所产生的任意信息，基于此，本技术实施例按照时间序列中的时间点对候选对战状态信息进行信息提取，如此，计算机设备可以提取到时间序列中时间点对应的对战状态信息。
[0173]
s205、计算机设备采用训练后操作水平预测模型对对战状态信息集合包括的对战状态信息进行特征提取，得到对战状态信息对应的对战状态特征信息。
[0174]
本技术实施例中，对战状态信息包括时间序列中各时间点对应的对战状态信息，基于此，本技术实施例对时间序列中各时间点对应的对战状态信息进行特征提取，得到时间序列中各时间点对应的对战状态特征信息。
[0175]
s206、计算机设备根据对战状态特征信息，对目标对象进行操作水平预测，得到每一局游戏对应的操作水平信息。
[0176]
例如，计算机设备可以对每一局游戏对应的对战状态特征信息进行融合处理，得到每一局游戏对应的融合后状态特征信息；根据每一局游戏对应的融合后状态特征信息，采用训练后操作水平预测模型对目标对象进行操作水平预测，得到每一局游戏对应的操作水平信息。
[0177]
其中，本技术实施例可以根据每一局游戏的时间序列，对时间序列中各时间点对应的对战状态特征信息进行融合处理，得到每一局游戏对应的融合后状态特征信息。
[0178]
在本技术实施例中，对时间序列中各时间点对应的对战状态特征信息进行融合处理的方式可以是对时间序列中各时间点对应的对战状态特征信息按照时间序列升序拼接，构造时序特征信息，该时序特征信息即为融合后状态特征信息。
[0179]
其中，融合后状态特征信息的维度为[样本数，特征数，时间点]，对于不足十二个时间点的时间序列填充0值，共同输入待训练操作水平预测模型。
[0180]
如图6所示，本技术实施例中，训练后操作水平预测模型部署到服务器11上，目标玩家通过游戏客户端12对目标对象进行操作，以将目标对象和对局对象进行对战，得到至少一局游戏对应的若干对战状态信息，然后，将对战状态信息存储到数据库13。处理中台14可以从数据库中提取与目标对象对应的对战状态信息，并将目标对象对应的对战状态信息发送到服务器11，又基于服务器11上的训练后操作水平预测模型进行操作水平预测，得到操作水平信息，并将操作水平信息返回给游戏客户端12。
[0181]
s207、计算机设备对目标对象的操作水平信息进行融合处理，得到针对目标对象的目标操作水平信息。
[0182]
本技术实施例对目标对象的操作水平信息进行融合处理，得到针对目标对象的目标操作水平信息的方式如下：
[0183]
针对多局游戏，将其中任一局作为当前局，执行下述操作：针对当前局游戏，若当前局游戏为第一局游戏，则获取目标对象的初始综合操作水平信息，并根据初始综合操作水平信息和目标对象当前局游戏的操作水平信息，计算得到当前局游戏的综合操作水平信息；若当前局游戏不为第一局游戏，则获取目标对象上一局游戏的综合操作水平信息，并根据上一局游戏的综合操作水平信息和目标对象当前局游戏的操作水平信息，计算得到当前局游戏的综合操作水平信息；直至多局游戏中每一局游戏均计算完毕，得到每一局游戏的综合操作水平信息；根据目标对象的综合操作水平信息，确定针对目标对象的目标操作水平信息。
[0184]
计算机设备根据目标对象的综合操作水平信息，确定针对目标对象的目标操作水平信息的方式可以参见公式(7)：
[0185]st
＝ac
t
+(1-a)s
t-1
ꢀꢀꢀꢀꢀꢀ
公式(7)
[0186]
其中，s
t
表示当前局游戏的综合操作水平信息；a表示平滑系数0《a《1；s
t-1
表示上一局游戏的综合操作水平信息或初始综合操作水平信息；c
t
表示当前局游戏的操作水平信息。其中，当t＝1时，s
t-1
为初始综合操作水平信息；当t≠1时，s
t-1
为上一局游戏的综合操作水平信息。
[0187]
本技术实施例可以计算当前局游戏的综合操作水平信息和初始综合操作水平信息之间的差异信息和计算上一局游戏的综合操作水平信息和当前局游戏的综合操作水平信息之间的差异信息，以对针对目标对象的目标操作水平信息进行收敛，本技术实施例针对目标对象的目标操作水平信息的收敛速度如图7所示，从图7中可以看到在第3局的时候，第2局综合操作水平信息和第3局综合操作水平信息之间的差异信息已经拉开差距形成正态分布，且较为稳定，随着对局次数的增加，差异信息较小，这说明少量对局的情况下，迅速定位目标玩家针对目标对象的操作实力，收敛速度快且稳定。其中，差异信息和综合操作水平信息均可以采用数值表示。
[0188]
现有的true skill算法是通过玩家对局胜负所得到elo分进行迭代更新，从而得到玩家控制虚拟对象的操作水平，此过程十分缓慢。由于现有的true skill算法在新手阶段玩家的elo分准确性低，用elo分进行游戏匹配会降低玩家玩游戏质量。
[0189]
进一步地，在本技术实施例中，将所有玩家和玩家对局次数都小于或等于10筛选出来，以模拟纯新手对局，然后将本技术实施例的游戏对象处理方法对玩家的游戏操作水平的评估和现有的true skill算法对玩家的游戏操作水平的评估进行对比。表1为本技术实施例的游戏对象处理方法和现有的true skill算法的对比。
[0190] 高分阵营获胜场次高分阵营获胜胜率本技术284460.3％现有的true skill算法249649.4％
[0191]
表1
[0192]
如表1所示，在纯新手对局阶段，通过本技术的游戏对象处理方法，目标对象在阵营胜率为60.3％，trues kill算法的目标对象在阵营胜率仅为49.4％，true skill算法的胜率低于本技术。可见在新手阶段，本技术的游戏对象处理方法所得到的目标操作水平信息是比现有的true skill算法所采用的elo分更加准确。
[0193]
除上述之外，本技术实施例还通过目标对象的虚拟杀敌数和目标对象的虚拟被杀数之间的差异值来评估本技术实施例的游戏对象处理方法和现有的true skill算法之间的区别。若目标对象和目标对局对象之间实力接近，差异值较小。
[0194]
本技术实施例相比true skill算法，本技术实施例目标对象的人均|k-d|降低0.5(12.1％)，本技术实施例目标对象的|k-d|》＝8的比例降低1.6％(13.5％)，说明本技术实施例为目标对象作为匹配目标对局对象能显著提高对局质量。
[0195]
其中，k是指目标对象的虚拟杀敌数；d是指目标对象的虚拟被杀数。
[0196]
另外，本技术实施例在步骤s207之后，还可以为目标对象匹配对应的目标对局对象，例如，计算机设备可以根据目标对象的目标操作水平信息，确定目标对象的目标水平等级信息；根据目标对象的目标水平等级信息，获取至少一个候选对局对象；从候选对局对象中提取出与目标对象匹配的目标对局对象。
[0197]
基于上述，本技术实施例所提供的游戏对象处理方法具有诸多优点，例如，(1)本
申请实施例确定目标操作水平信息收敛速度较快，3局以后目标操作水平信息趋于稳定，也即玩家的游戏操作水平能力定档已趋于稳定；(2)本技术实施例对玩家在新手阶段的游戏操作能力评估的准确性明显优于现有的true skill算法，针对目标对象在对局阵营中进行对战所评估的相对实力的准确性，本技术实施例的准确性比现有的true skill算法高6.9％；针对目标对象单独进行对战所评估的相对实力的准确性，本技术实施例的准确性比现有的true skill算法高11.1％；(3)由于本技术使用了每一局游戏中，时间序列中各时间点对应的对战状态特征信息，相比于单层神经网络，本技术实施例的准确性得到了接近20％的提高；(4)本技术实施例在真人对局中的应用对玩家体验提升明显，有效降低对局内极端差异值的比例。
[0198]
以上各个操作的具体实施可参见前面的实施例，在此不再赘述。
[0199]
本技术实施例可以获取游戏中目标对象和对局对象的对战状态信息集合，对战状态信息集合包括至少一局游戏对应的对战状态信息；对对战状态信息集合包括的对战状态信息进行特征提取，得到对战状态信息对应的对战状态特征信息；根据对战状态特征信息，对目标对象进行操作水平预测，得到每一局游戏对应的操作水平信息；对目标对象的操作水平信息进行融合处理，得到针对目标对象的目标操作水平信息。由于本技术实施例可以根据目标对象和对局对象之间的每一局游戏对应的对战状态信息，确定出每一局游戏的操作水平信息，如此能够准确地计算出目标对象的目标操作水平信息，进而准确地确定出目标对象的操作水平。
[0200]
为了更好地实施以上方法，本技术实施例还提供一种游戏对象处理装置，该游戏对象处理装置可以集成在计算机设备，比如服务器或终端等设备中，该终端可以包括平板电脑、笔记本电脑和/或个人计算机等。
[0201]
例如，如图8所示，该游戏对象处理装置可以包括获取单元301、提取单元302、预测单元303、融合单元304、匹配单元305和训练单元306，如下：
[0202]
(1)获取单元301；
[0203]
获取单元301，可以用于获取游戏中目标对象和对局对象的对战状态信息集合，对战状态信息集合包括至少一局游戏对应的对战状态信息。
[0204]
(2)提取单元302；
[0205]
提取单元302，可以用于对对战状态信息集合包括的对战状态信息进行特征提取，得到对战状态信息对应的对战状态特征信息。
[0206]
在一些实施例中，对战状态信息包括每一局游戏的时间序列中各时间点对应的对战状态信息；提取单元302，可以用于对每一局游戏的时间序列中各时间点对应的对战状态信息进行特征提取，得到每一局游戏的时间序列中各时间点对应的对战状态特征信息。
[0207]
(3)预测单元303；
[0208]
预测单元303，可以用于根据对战状态特征信息，对目标对象进行操作水平预测，得到每一局游戏对应的操作水平信息。
[0209]
在一些实施例中，预测单元303，具体可以用于对每一局游戏对应的对战状态特征信息进行融合处理，得到每一局游戏对应的融合后状态特征信息；根据每一局游戏对应的融合后状态特征信息，采用训练后操作水平预测模型对目标对象进行操作水平预测，得到每一局游戏对应的操作水平信息。
[0210]
在一些实施例中，预测单元303，具体可以用于根据每一局游戏的时间序列，对时间序列中各时间点对应的对战状态特征信息进行融合处理，得到每一局游戏对应的融合后状态特征信息。
[0211]
(4)融合单元304；
[0212]
融合单元304，可以用于对目标对象的操作水平信息进行融合处理，得到针对目标对象的目标操作水平信息。
[0213]
在一些实施例中，游戏包括多局；融合单元304，具体可以用于针对多局游戏，将其中任一局作为当前局，执行下述操作：针对当前局游戏，若当前局游戏为第一局游戏，则获取目标对象的初始综合操作水平信息，并根据初始综合操作水平信息和目标对象当前局游戏的操作水平信息，计算得到当前局游戏的综合操作水平信息；若当前局游戏不为第一局游戏，则获取目标对象上一局游戏的综合操作水平信息，并根据上一局游戏的综合操作水平信息和目标对象当前局游戏的操作水平信息，计算得到当前局游戏的综合操作水平信息；直至多局游戏中每一局游戏均计算完毕，得到每一局游戏的综合操作水平信息；根据目标对象的综合操作水平信息，确定针对目标对象的目标操作水平信息。
[0214]
(5)匹配单元305；
[0215]
匹配单元305，可以用于根据目标对象的目标操作水平信息，确定目标对象的目标水平等级信息；根据目标对象的目标水平等级信息，获取至少一个候选对局对象；从候选对局对象中提取出与目标对象匹配的目标对局对象。
[0216]
(6)训练单元306；
[0217]
训练单元306，可以用于获取对战数据样本集合，对战数据样本集合包括至少一局游戏中标注操作水平标签的对战数据样本，对战数据样本为针对待预测对象标注了操作水平标签的数据样本；根据对战数据样本，采用待训练操作水平预测模型对待预测对象进行操作水平预测，得到待预测对象针对每一局游戏对应的预测操作水平信息；根据对战数据样本对应的操作水平标签和预测操作水平信息，对待训练操作水平预测模型的模型参数进行收敛，得到训练后操作水平预测模型。
[0218]
在一些实施例中，训练单元306，可以用于获取第一游戏阵营和第二游戏阵营，第一游戏阵营包括待预测对象和至少一个第一参与对象，第二游戏阵营包括至少一个第二参与对象，其中，待预测对象的候选操作水平信息、第一参与对象的候选操作水平信息和第二参与对象的候选操作水平信息均为随机分配的操作水平信息；将待预测对象、第一参与对象和第二参与对象进行对战处理，以得到对战数据样本；根据待预测对象的候选操作水平信息，确定对战数据样本对应的操作水平标签；根据对战数据样本和对战数据样本对应的操作水平标签，生成对战数据样本集合。
[0219]
在一些实施例中，训练单元306，具体可以用于采用待训练操作水平预测模型对对战数据样本进行特征提取，得到样本特征信息；根据样本特征信息，对待预测对象进行操作水平预测，得到待预测对象每一局游戏对应的预测操作水平信息。
[0220]
在一些实施例中，训练单元306，具体可以用于针对每一局游戏，对样本特征信息进行融合，得到融合后样本特征信息；根据融合后样本特征信息，对待预测对象进行操作水平预测，得到待预测对象的预测操作水平信息。
[0221]
在一些实施例中，训练单元306，具体可以用于将待预测对象、第一参与对象和第
二参与对象进行对战处理，得到候选对战数据；按照目标时间序列，对候选对战数据进行样本提取，得到待预测对象在每一局游戏中对应的对战数据样本。
[0222]
由上可知，本技术实施例的获取单元301可以用于获取游戏中目标对象和对局对象的对战状态信息集合，对战状态信息集合包括至少一局游戏对应的若干对战状态信息；提取单元302可以用于对对战状态信息集合包括的对战状态信息进行特征提取，得到对战状态信息对应的对战状态特征信息；预测单元303可以用于根据对战状态特征信息，对目标对象进行操作水平预测，得到每一局游戏对应的操作水平信息；融合单元304可以用于对目标对象的操作水平信息进行融合处理，得到针对目标对象的目标操作水平信息。由于本技术实施例可以根据目标对象和对局对象之间的每一局游戏对应的对战状态信息，确定出每一局游戏的操作水平信息，如此能够准确地计算出目标对象的目标操作水平信息，进而准确地确定出目标对象的操作水平。
[0223]
本技术实施例还提供一种计算机设备，如图9所示，其示出了本技术实施例所涉及的计算机设备的结构示意图，具体来讲：
[0224]
该计算机设备可以包括一个或者一个以上处理核心的处理器401、一个或一个以上计算机可读计算机可读存储介质的存储器402、电源403和输入单元404等部件。本领域技术人员可以理解，图9中示出的计算机设备结构并不构成对计算机设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。其中：
[0225]
处理器401是该计算机设备的控制中心，利用各种接口和线路连接整个计算机设备的各个部分，通过运行或执行存储在存储器402内的软件程序和/或模块，以及调用存储在存储器402内的数据，执行计算机设备的各种功能和处理数据。可选的，处理器401可包括一个或多个处理核心；优选的，处理器401可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和计算机程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器401中。
[0226]
存储器402可用于存储软件程序以及模块，处理器401通过运行存储在存储器402的软件程序以及模块，从而执行各种功能应用以及数据处理。存储器402可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的计算机程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据计算机设备的使用所创建的数据等。此外，存储器402可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地，存储器402还可以包括存储器控制器，以提供处理器401对存储器402的访问。
[0227]
计算机设备还包括给各个部件供电的电源403，优选的，电源403可以通过电源管理系统与处理器401逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源403还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
[0228]
该计算机设备还可包括输入单元404，该输入单元404可用于接收输入的数字或字符信息通讯，以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。
[0229]
尽管未示出，计算机设备还可以包括显示单元等，在此不再赘述。具体在本实施例中，计算机设备中的处理器401会按照如下的指令，将一个或一个以上的计算机程序的进程
对应的可执行文件加载到存储器402中，并由处理器401来运行存储在存储器402中的计算机程序，从而实现各种功能，如下：
[0230]
获取游戏中目标对象和对局对象的对战状态信息集合，对战状态信息集合包括至少一局游戏对应的对战状态信息；对对战状态信息集合包括的对战状态信息进行特征提取，得到对战状态信息对应的对战状态特征信息；根据对战状态特征信息，对目标对象进行操作水平预测，得到每一局游戏对应的操作水平信息；对目标对象的操作水平信息进行融合处理，得到针对目标对象的目标操作水平信息。
[0231]
以上各个操作的具体实施可参见前面的实施例，在此不再赘述。
[0232]
本领域普通技术人员可以理解，上述实施例的各种方法中的全部或部分步骤可以通过计算机程序来完成，或通过计算机程序控制相关的硬件来完成，该计算机程序可以存储于一计算机可读存储介质中，并由处理器进行加载和执行。
[0233]
为此，本技术实施例提供一种计算机可读存储介质，其中存储有计算机程序，该计算机程序能够被处理器进行加载，以执行本技术实施例所提供的任一种游戏对象处理方法。
[0234]
以上各个操作的具体实施可参见前面的实施例，在此不再赘述。
[0235]
其中，该计算机可读存储介质可以包括：只读存储器(rom，read only memory)、随机存取记忆体(ram，random access memory)、磁盘或光盘等。
[0236]
由于该计算机可读存储介质中所存储的指令，可以执行本技术实施例所提供的任一种游戏对象处理方法中的步骤，因此，可以实现本技术实施例所提供的任一种游戏对象处理方法所能实现的有益效果，详见前面的实施例，在此不再赘述。
[0237]
其中，根据本技术的一个方面，提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述实施例提供的各种可选实现方式中提供的方法。
[0238]
以上对本技术实施例所提供的一种游戏对象处理方法、装置、计算机设备、计算机可读存储介质进行了详细介绍，本文中应用了具体个例对本技术的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本技术的方法及其核心思想；同时，对于本领域的技术人员，依据本技术的思想，在具体实施方式及应用范围上均会有改变之处，综上，本说明书内容不应理解为对本技术的限制。

技术特征：
1.一种游戏对象处理方法，其特征在于，包括：获取游戏中目标对象和对局对象的对战状态信息集合，所述对战状态信息集合包括至少一局游戏对应的对战状态信息；对所述对战状态信息集合包括的对战状态信息进行特征提取，得到所述对战状态信息对应的对战状态特征信息；根据所述对战状态特征信息，对所述目标对象进行操作水平预测，得到每一局游戏对应的操作水平信息；对所述目标对象的操作水平信息进行融合处理，得到针对所述目标对象的目标操作水平信息。2.根据权利要求1所述的游戏对象处理方法，其特征在于，所述根据所述对战状态特征信息，对所述目标对象进行操作水平预测，得到每一局游戏对应的操作水平信息，包括：对每一局游戏对应的对战状态特征信息进行融合处理，得到每一局游戏对应的融合后状态特征信息；根据每一局游戏对应的所述融合后状态特征信息，采用训练后操作水平预测模型对所述目标对象进行操作水平预测，得到每一局游戏对应的操作水平信息。3.根据权利要求2所述的游戏对象处理方法，其特征在于，所述对战状态信息包括每一局游戏的时间序列中各时间点对应的对战状态信息；所述对所述对战状态信息集合包括的对战状态信息进行特征提取，得到所述对战状态信息对应的对战状态特征信息，包括：对所述每一局游戏的时间序列中各时间点对应的对战状态信息进行特征提取，得到每一局游戏的时间序列中各时间点对应的对战状态特征信息；所述对每一局游戏对应的对战状态特征信息进行融合处理，得到每一局游戏对应的融合后状态特征信息，包括：根据每一局游戏的时间序列，对所述时间序列中各时间点对应的对战状态特征信息进行融合处理，得到每一局游戏对应的融合后状态特征信息。4.根据权利要求1所述的游戏对象处理方法，其特征在于，游戏包括多局；所述对所述目标对象的操作水平信息进行融合处理，得到针对所述目标对象的目标操作水平信息，包括：针对所述多局游戏，将其中任一局作为当前局，执行下述操作：针对当前局游戏，若所述当前局游戏为第一局游戏，则获取所述目标对象的初始综合操作水平信息，并根据所述初始综合操作水平信息和所述目标对象当前局游戏的操作水平信息，计算得到当前局游戏的综合操作水平信息；若所述当前局游戏不为第一局游戏，则获取所述目标对象上一局游戏的综合操作水平信息，并根据所述上一局游戏的综合操作水平信息和所述目标对象当前局游戏的操作水平信息，计算得到当前局游戏的综合操作水平信息；直至所述多局游戏中每一局游戏均计算完毕，得到每一局游戏的综合操作水平信息；根据所述目标对象的综合操作水平信息，确定针对所述目标对象的目标操作水平信息。5.根据权利要求1所述的游戏对象处理方法，其特征在于，所述对战状态特征信息为采用训练后操作水平预测模型对所述对战状态信息进行特征提取得到的信息；所述对所述对战状态信息集合包括的对战状态信息进行特征提取之前，所述方法还包括：获取对战数据样本集合，所述对战数据样本集合包括至少一局游戏中标注操作水平标
签的对战数据样本，所述对战数据样本为针对待预测对象标注了操作水平标签的数据样本；根据所述对战数据样本，采用待训练操作水平预测模型对所述待预测对象进行操作水平预测，得到所述待预测对象针对每一局游戏对应的预测操作水平信息；根据所述对战数据样本对应的所述操作水平标签和所述预测操作水平信息，对所述待训练操作水平预测模型的模型参数进行收敛，得到所述训练后操作水平预测模型。6.根据权利要求5所述的游戏对象处理方法，其特征在于，所述获取对战数据样本集合，包括：获取第一游戏阵营和第二游戏阵营，所述第一游戏阵营包括所述待预测对象和至少一个第一参与对象，所述第二游戏阵营包括至少一个第二参与对象，其中，所述待预测对象的候选操作水平信息、所述第一参与对象的候选操作水平信息和所述第二参与对象的候选操作水平信息均为随机分配的操作水平信息；将所述待预测对象、所述第一参与对象和所述第二参与对象进行对战处理，以得到对战数据样本；根据所述待预测对象的候选操作水平信息，确定对战数据样本对应的操作水平标签；根据所述对战数据样本和所述对战数据样本对应的操作水平标签，生成对战数据样本集合。7.根据权利要求1至6任一项所述的游戏对象处理方法，其特征在于，所述对所述目标对象的操作水平信息进行融合处理，得到针对所述目标对象的目标操作水平信息之后，所述方法还包括：根据所述目标对象的目标操作水平信息，确定所述目标对象的目标水平等级信息；根据所述目标对象的目标水平等级信息，获取至少一个候选对局对象；从所述候选对局对象中提取出与所述目标对象匹配的目标对局对象。8.一种游戏对象处理装置，其特征在于，包括：获取单元，用于获取游戏中目标对象和对局对象的对战状态信息集合，所述对战状态信息集合包括至少一局游戏对应的对战状态信息；提取单元，用于对所述对战状态信息集合包括的对战状态信息进行特征提取，得到所述对战状态信息对应的对战状态特征信息；预测单元，用于根据所述对战状态特征信息，对所述目标对象进行操作水平预测，得到每一局游戏对应的操作水平信息；融合单元，用于对所述目标对象的操作水平信息进行融合处理，得到针对所述目标对象的目标操作水平信息。9.一种计算机设备，其特征在于，包括存储器和处理器；所述存储器存储有计算机程序，所述处理器用于运行所述存储器内的计算机程序，以执行权利要求1至7任一项所述的游戏对象处理方法。10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序适于处理器进行加载，以执行权利要求1至7任一项所述的游戏对象处理方法。11.一种计算机程序产品，其特征在于，所述计算机程序产品存储有计算机程序，所述
计算机程序适于处理器进行加载，以执行权利要求1至7任一项所述的游戏对象处理方法。

技术总结
本申请实施例提供一种游戏对象处理方法、装置、计算机设备及存储介质，可应用于云技术、人工智能、智慧交通、辅助驾驶等各种场景；本申请实施例可以获取游戏中目标对象和对局对象的对战状态信息集合；对对战状态信息集合包括的对战状态信息进行特征提取，得到对战状态信息对应的对战状态特征信息；根据对战状态特征信息，对目标对象进行操作水平预测，得到每一局游戏对应的操作水平信息；对操作水平信息进行融合处理，得到针对目标对象的目标操作水平信息。本申请实施例可以准确地确定出目标对象的操作水平。的操作水平。的操作水平。

技术研发人员：张朝运陈浩王锴李英杰郑炳超
受保护的技术使用者：腾讯科技（深圳）有限公司
技术研发日：2022.03.25
技术公布日：2023/10/11

版权声明

本文仅代表作者观点，不代表航空之家立场。
本文系作者授权航家号发表，未经原创作者书面授权，任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时，须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的，航空之家将依法追究其法律责任。（航空之家官方QQ：2926969996）

飞行汽车 https://www.autovtol.com/

上一篇：数据归一化方法、装置、电子设备及存储介质与流程 下一篇：一种反渗透膜结晶处理设备及反渗透结晶处理方法与流程

一种游戏对象处理方法、装置、计算机设备及存储介质与流程

版权声明

航空之家

相关推荐

文章排行

最近发表

标签列表

一种游戏对象处理方法、装置、计算机设备及存储介质与流程

版权声明

相关文章

航空之家

相关推荐

文章排行

最近发表

标签列表