训练方法、装置和计算机可读存储介质与流程

未命名 07-12 阅读：69 评论：0

1.本公开涉及人工智能技术领域，特别涉及一种训练方法、装置和计算机可读存储介质。

背景技术：

2.数据驱动的人工智能及其相关技术在各行各业都发挥了巨大作用，带来了很高价值。并且随着机器学习、深度学习等技术在各种场景下广泛应用，对于模型的可解释性也有着极高的需求。其中，模型可解释性的一个重要体现方面在于样本属性与样本预测值之间的关系上，通常建模专家会要求特征与模型的输出预测值之间满足某种先验经验约束。
3.但是，受样本采集偏差、模型训练过程的随机性等影响，最终得到的特征与模型的输出预测值之间不满先验经验约束足。

技术实现要素：

4.发明人发现：在某些场景中，基于先验知识会出现输入的特征的值在一定区间内与模型的输出值呈现单调相关的特性，但是在实际训练过程中，输入的特征的值与模型的输出值不满足单调相关的特性，并且偏差较大，影响了模型的准确性和合理性。
5.本公开所要解决的一个技术问题是：如何提高训练后模型的准确性和合理性。
6.根据本公开的一些实施例，提供的一种训练方法，包括：获取用于训练的样本组，其中，样本组包括多个样本，多个样本的第一类特征的值互不相同，第二类特征的值相同；将样本组输入机器学习模型，得到输出的样本组中各个样本对应的结果；根据各个样本对应的结果确定第一损失函数的值，其中，第一损失函数根据单调约束条件构建，各个样本对应的结果越符合单调约束条件，第一损失函数的值越小，单调约束条件为各个样本的第一类特征的值在预设区间内与各个样本对应的结果单调相关；根据第一损失函数的值调整机器学习模型的参数。
7.在一些实施例中，根据各个样本对应的结果确定第一损失函数的值包括：将各个样本对应的结果按照预设顺序排列，其中，预设顺序为按照各个样本的第一类特征的值由小到大或由大到小的顺序；根据每相邻两个样本对应的结果的差值确定第一损失函数的值。
8.在一些实施例中，根据每相邻两个样本对应的结果的差值确定第一损失函数的值包括：针对每相邻两个样本对应的结果的差值，确定差值是否满足单调约束条件；将不满足单调约束条件的各个差值相加，得到求和结果；根据求和结果确定第一损失函数的值。
9.在一些实施例中，样本组还包括原始样本，原始样本与多个样本中的一个相同，该方法还包括：根据原始样本对应的结果与原始样本的标注信息确定第二损失函数的值；根据第一损失函数的值调整机器学习模型的参数包括：将第一损失函数的值和第二损失函数的值进行加权求和，得到总损失函数的值；根据总损失函数的值调整机器学习模型的参数。
10.在一些实施例中，根据总损失函数的值调整机器学习模型的参数包括：根据总损
失函数的值确定是否达到预设收敛条件；在未达到预设收敛条件的情况下，根据总损失函数和预设参数调整方法，调整机器学习模型的参数。
11.在一些实施例中，该方法还包括：获取原始样本；根据原始样本的第一类特征的值和第二类特征的值，生成多个样本；将原始样本和多个新样本组成样本组。
12.在一些实施例中，在第一类特征的取值为连续值的情况下，将第一类特征的取值的预设区间划分为多个子区间，并设置各个子区间对应的转换值；将原始样本的第一类特征的原始值替换为所在的子区间对应的转换值，作为原始样本的第一类特征的值；将各个子区间的转换值作为多个样本中各个样本的第一类特征的值。
13.在一些实施例中，第一类特征为用户的知识水平评价指标，第二类特征包括用户的历史行为信息，机器学习模型为风险预测模型，各个样本对应的结果为各个样本对应的资源占用超过期限的概率。
14.在一些实施例中，第一类特征为用户关于对象的历史访问次数，第二类特征包括用户的属性信息，机器学习模型为对象推荐模型，各个样本对应的结果为各个样本对应的对象的推荐概率。
15.在一些实施例中，第一类特征为用户的年龄，第二类特征包括用户的历史问诊信息，机器学习模型为预测模型，各个样本对应的结果为各个样本对应的用户的出现预设症状概率。
16.在一些实施例中，该方法还包括：将待预测用户的特征信息输入风险预测模型，其中，待预测用户的信特征息包括：待预测用户的知识水平评价指标，以及待预测用户的历史行为信息；获取风险预测模型输出的待预测用户对资源占用超过期限的概率。
17.在一些实施例中，该方法还包括：将待推荐用户的特征信息输入对象推荐模型，其中，待推荐用户的特征信息包括：待推荐用户关于对象的历史访问次数以及待推荐用户的属性信息；根据对象推荐模型输出的对象的推荐概率，确定是否向待推荐用户推荐对象。
18.在一些实施例中，该方法还包括：将待预测用户的特征信息输入预测模型，其中，待预测用户的特征信息包括：待预测用户的历史问诊信息，以及待预测用户的年龄；获取预测模型输出的待预测用户出现预设症状的概率。
19.根据本公开的另一些实施例，提供的一种训练装置，包括：获取模块，用于获取用于训练的样本组，其中，样本组包括多个样本，多个样本的第一类特征的值互不相同，第二类特征的值相同；输入模块，用于将样本组输入机器学习模型，得到输出的样本组中各个样本对应的结果；确定模块，用于根据各个样本对应的结果确定第一损失函数的值，其中，第一损失函数根据单调约束条件构建，各个样本对应的结果越符合单调约束条件，第一损失函数的值越小，单调约束条件为各个样本的第一类特征的值在预设区间内与各个样本对应的结果单调相关；调整模块，用于根据第一损失函数的值调整机器学习模型的参数。
20.根据本公开的又一些实施例，提供的一种训练装置，包括：处理器；以及耦接至处理器的存储器，用于存储指令，指令被处理器执行时，使处理器执行如前述任意实施例的训练方法。
21.根据本公开的再一些实施例，提供的一种非瞬时性计算机可读存储介质，其上存储有计算机程序，其中，该程序被处理器执行时实现前述任意实施例的训练方法。
22.本公开的方法中样本组包括第一类特征的值互不相同，第二类特征的值相同的多
个样本，将样本组输入机器学习模型，得到输出的样本组中各个样本对应的结果，根据各个样本对应的结果确定第一损失函数的值，并调整机器学习模型的参数。由于第一损失函数根据单调约束条件构建，训练过程中可以使机器学习模型学习第一类特征和结果的单调相关的特性，训练得到的机器学习模型可以更加符合单调约束条件，提高了训练后模型的准确性和合理性。
23.通过以下参照附图对本公开的示例性实施例的详细描述，本公开的其它特征及其优点将会变得清楚。
附图说明
24.为了更清楚地说明本公开实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本公开的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
25.图1示出本公开的一些实施例的训练方法的流程示意图。
26.图2示出本公开的另一些实施例的训练方法的流程示意图。
27.图3示出本公开的一些实施例的训练装置的结构示意图。
28.图4示出本公开的另一些实施例的训练装置的结构示意图。
29.图5示出本公开的又一些实施例的训练装置的结构示意图。
具体实施方式
30.下面将结合本公开实施例中的附图，对本公开实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本公开一部分实施例，而不是全部的实施例。以下对至少一个示例性实施例的描述实际上仅仅是说明性的，决不作为对本公开及其应用或使用的任何限制。基于本公开中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本公开保护的范围。
31.本公开提出一种训练方法，下面结合图1进行描述。
32.图1为本公开训练方法一些实施例的流程图。如图1所示，该实施例的方法包括：步骤s102～s108。
33.在步骤s102中，获取用于训练的样本组。
34.用于训练的有多个样本组，每个样本组可以包括多个样本，多个样本的第一类特征的值互不相同，第二类特征的值相同。第一类特征的值与机器学习模型输出的结果在预设区间内单调相关。第二类特征为所有特征中除去第一类特征以外的特征。每个样本组中的多个样本的标注信息可以相同。
35.在一些实施例中，样本组还包括原始样本，多个样本是根据原始样本生成的新样本。如图2所示，步骤s202～s206与步骤s102～s106相同，在步骤s202之前还包括：步骤s201，根据原始样本生成多个样本，组成样本组。例如，获取原始样本；根据原始样本的第一类特征的值和第二类特征的值，生成多个(新)样本；将原始样本和多个(新)样本组成样本组。原始样本与多个(新)样本中的一个相同。
36.例如，第一类特征记为xc，在预设区间内的取值包括0,1,2,3
…
(n-1)，原始样本的
xc特征的取值为0,1,2,3
…
(n-1)中一个，根据原始样本生成n个(新)样本，(新)样本的xc特征的取值分别为0,1,2,3
…
(n-1)，并且每个(新)样本对应的非xc特征以及样本标签(标注信息)，均与原始样本保持一致。经过该过程，每个原始样本均转化成了n个(新)样本与1个原始样本。
37.当然，也可以不生成与原始样本相同的样本，直接将原始样本作为多个样本中的一个即可。
38.在一些实施例中，在第一类特征的取值为连续值的情况下，将第一类特征的取值的预设区间划分为多个子区间，并设置各个子区间对应的转换值；将原始样本的第一类特征的原始值替换为所在的子区间对应的转换值，作为原始样本的第一类特征的值；将各个子区间的转换值作为多个样本中各个样本的第一类特征的值。
39.取值连续的第一类特征可以先分箱，例如，将0-100区间划分为(0,18)，(18,25)，(25,50)，(50,100)等子区间，然后设置各个子区间对应的转换值为0，1，2，3，这样将连续的区间转换为离散值，便于生成新样本和计算后续的第一损失函数。分箱方式可以采用等频或者等距分箱等方式，不限于所举示例。
40.在步骤s104中，将样本组输入机器学习模型，得到输出的样本组中各个样本对应的结果。
41.机器学习模型例如为深度学习模型、线性模型等，不限于所举示例。例如，将样本组中原始样本和多个(新)样本分别通过机器学习模型的向前计算，即可得到对应n+1个结果，分别记为其中前n项为(新)样本对应的结果，第n+1项为原始样本对应的结果。
42.在步骤s106中，根据各个样本对应的结果确定第一损失函数的值。
43.在一些实施例中，第一损失函数根据单调约束条件构建，各个样本对应的结果越符合单调约束条件，第一损失函数的值越小，单调约束条件为各个样本的第一类特征的值在预设区间内与各个样本对应的结果单调相关，即单调约束条件为各个样本对应的结果关于各个样本的第一类特征的值在预设区间内单调递增或单调递减。如果各个样本的第一类特征的值和各个样本对应的结果在不同预设区间上的单调性不同，则单调约束条件可以包括多个，第一损失函数根据多个单调页数条件构建。
44.在一些实施例中，将各个(新)样本对应的结果按照预设顺序排列，其中，预设顺序为按照各个(新)样本的第一类特征的值由小到大或由大到小的顺序；根据每相邻两个(新)样本对应的结果的差值确定第一损失函数的值。
45.例如，对n项新样本对应的结果根据xc特征的值从小到大排序，得到在具体应用时，由于在多个新样本生成环节可以直接生成符合该排序关系的样本，因此只需保证通过机器学习模型得到的结果的顺序不被打乱即可。
46.计算每相邻两个(新)样本对应的结果的差值，可以采用后一个样本对应的结果减去前一个样本对应的结果的方式，也可以采用前一个样本对应的结果减去后一个样本对应的结果的方式，只要保证每个差值的计算方式一致即可。例如，计算后一个样本对应的结果减去前一个样本对应的结果，共生成差值n-2项，可以采用以下公式表示。
gradient descent，随机梯度下降)等优化算法对模型进行优化，最终便可得到符合特定单调约束条件的模型。
60.可以将训练样本划分为多批(batch)，每批包括多个样本组。在一次迭代中，针对每个样本组，得到输出的样本组中各个样本对应的结果，根据各个样本组中各个样本对应的结果确定总损失函数的值，根据总损失函数调整机器学习模型的参数，重复上述过程直至达到预设收敛条件。
61.上述实施例的方法中样本组包括第一类特征的值互不相同，第二类特征的值相同的多个样本，将样本组输入机器学习模型，得到输出的样本组中各个样本对应的结果，根据各个样本对应的结果确定第一损失函数的值，并调整机器学习模型的参数。由于第一损失函数根据单调约束条件构建，训练过程中可以使机器学习模型学习第一类特征和结果的单调相关的特性，训练得到的机器学习模型可以更加符合单调约束条件，提高了训练后模型的准确性和合理性。
62.下面描述本公开的训练方法的一些具体实施例。
63.本公开的方法可以应用于资源分配等场景。对用户分配资源可以设置相应的资源占用时间，达到时间后用户主动归还资源。例如，为用户分配服务器资源、带宽资源等各种实物或虚拟资源。为了保证资源的分配合理和可持续分配性需要预测用户资源占用超过期限的概率，以判断该资源是否可以分配给后续用户。基于先验知识发现，用户的知识水平评价指标的值越高，资源占用超过期限的概率越低，因此，可以基于该先验知识设置单调约束条件。
64.在一些实施例中，第一类特征为用户的知识水平评价指标，第二类特征包括用户的历史行为信息，机器学习模型为风险预测模型，各个样本对应的结果为各个样本对应的资源占用超过期限的概率。
65.例如，(1)获取用于训练的样本组，其中，样本组包括对应于一个用户的多个样本，多个样本的知识水平评价指标的值互不相同，第二类特征的值相同，第二类特征包括用户的历史行为信息；(2)将样本组输入风险预测，得到输出的样本组中各个样本对应的资源占用超过期限的概率；(3)根据各个样本对应的资源占用超过期限的概率确定第一损失函数的值，其中，第一损失函数根据单调约束条件构建，各个样本对应的资源占用超过期限的概率越符合单调约束条件，第一损失函数的值越小，单调约束条件为各个样本对应的资源占用超过期限的概率关于各个样本的知识水平评价指标的值在预设区间内单调递减；(4)根据第一损失函数的值调整风险预测模型的参数。风险预测模型例如为深度学习模型，具体可以是mlp(多层感知机)等，不限于所举示例。
66.在一些实施例中，样本组还包括原始样本，即用户的原始数据；根据原始样本对应的资源占用超过期限的概率与原始样本的标注信息确定第二损失函数的值；将第一损失函数的值和第二损失函数的值进行加权求和，得到总损失函数的值；根据总损失函数的值调整风险预测模型的参数。第一损失函数和总损失函数的计算方式可以参考前述实施例。
67.第二类特征还可以包括用户的其他属性信息，例如，年龄、地域、性别、婚姻状况、信用情况等，具体的属性信息可以根据实际需求进行选择。历史行为信息例如包括，历史各次资源占用和归还的相关信息。例如，历史各次资源占用超期的天数、资源占用量、归还时间、资源占用超期次数、占用超期的资源占用总量、最大超期天数等，不限于所举示例。
68.在一些实施例中，风险预测模型训练完成之后，将待预测用户的特征信息输入风险预测模型，获取风险预测模型输出的待预测用户对资源占用超过期限的概率。待预测用户的信特征息包括：待预测用户的知识水平评价指标，以及待预测用户的历史行为信息，还可以包括待预测用户的其他属性信息，例如，年龄、地域、性别、婚姻状况、信用情况等。
69.通过上述实施例的方法可以提高风险预测模型的准确性和合理性，进而提高风险预测的准确性。
70.本公开的方法可以应用于对象推荐场景，例如，新闻、视频、音乐、产品等推荐场景。基于先验知识发现，用户关于对象的历史访问次数，向用户推荐该对象的概率越高，这样推荐的对象更加符合用户需求，可以获得更高的点击率，因此，可以基于该先验知识设置单调约束条件。
71.在一些实施例中，第一类特征为用户关于对象的历史访问次数，第二类特征包括用户的属性信息，机器学习模型为对象推荐模型，各个样本对应的结果为各个样本对应的对象的推荐概率。
72.例如，(1)获取用于训练的样本组，其中，样本组包括对应于一个用户的多个样本，多个样本的关于对象的历史访问次数互不相同，第二类特征的值相同，第二类特征包括用户的属性信息；(2)将样本组输入对象推荐模型，得到输出的样本组中各个样本对应的对象的推荐概率；(3)根据各个样本对应的对象的推荐概率确定第一损失函数的值，其中，第一损失函数根据单调约束条件构建，各个样本对应的对象的推荐概率越符合单调约束条件，第一损失函数的值越小，单调约束条件为各个样本对应的对象的推荐概率关于各个样本的历史访问次数的值在预设区间内单调递增；(4)根据第一损失函数的值调整对象推荐模型的参数。对象模型例如为深度学习模型，不限于所举示例。
73.用户关于对象的历史访问次数包括：用户关于对象的点击次数、搜索次数、评论次数、购买次数，收藏次数中至少一项。用户的属性信息例如包括年龄、地域、性别、婚姻状况、学历等，不限于所举示例。
74.在一些实施例中，样本组还包括原始样本，即用户的原始数据；根据原始样本对应的对象的推荐概率与原始样本的标注信息确定第二损失函数的值；将第一损失函数的值和第二损失函数的值进行加权求和，得到总损失函数的值；根据总损失函数的值调整对象推荐模型的参数。第一损失函数和总损失函数的计算方式可以参考前述实施例。
75.在一些实施例中，将待推荐用户的特征信息输入对象推荐模型，根据对象推荐模型输出的对象的推荐概率，确定是否向待推荐用户推荐对象。其中，待推荐用户的特征信息包括：待推荐用户关于对象的历史访问次数以及待推荐用户的属性信息。
76.通过上述实施例的方法可以提高对象推荐模型的准确性和合理性，进而提高推荐的对象的准确性和合理性。
77.本公开的方法可以应用于为用户进行预测的场景，例如，预测用户是否会出现某种症状。基于先验知识发现，针对某些预设症状，用户的年龄越大出现这些症状的概率越高，因此，可以基于该先验知识设置单调约束条件。
78.在一些实施例中，第一类特征为用户的年龄，第二类特征包括用户的历史问诊信息和病例信息中至少一项，机器学习模型为预测模型，各个样本对应的结果为各个样本对应的用户的出现预设症状概率。
79.例如，(1)获取用于训练的样本组，其中，样本组包括对应于一个用户的多个样本，多个样本的年龄的取值互不相同，第二类特征的值相同，第二类特征包括用户的历史问诊信息和病例信息中至少一项；(2)将样本组输入预测模型，得到输出的样本组中各个样本对应的出现预设症状概率；(3)根据各个样本对应的出现预设症状概率确定第一损失函数的值，其中，第一损失函数根据单调约束条件构建，各个样本对应的出现预设症状概率越符合单调约束条件，第一损失函数的值越小，单调约束条件为各个样本对应的出现预设症状概率关于各个样本的年龄在预设区间内单调递增；(4)根据第一损失函数的值调整预测模型的参数。对象模型例如为深度学习模型，不限于所举示例。
80.用户的历史问诊信息例如包括：历史各次问诊的科室、医生、症状、诊断结果等，不限于所举示例。在一些实施例中，样本组还包括原始样本，即用户的原始数据；根据原始样本对应的出现预设症状概率与原始样本的标注信息确定第二损失函数的值；将第一损失函数的值和第二损失函数的值进行加权求和，得到总损失函数的值；根据总损失函数的值调整预测模型的参数。第一损失函数和总损失函数的计算方式可以参考前述实施例。
81.在一些实施例中，将待预测用户的特征信息输入预测模型，获取预测模型输出的待预测用户出现预设症状的概率。待预测用户的特征信息包括：待预测用户的历史问诊信息，以及待预测用户的年龄。
82.通过上述实施例的方法可以提高预测模型的准确性和合理性，进而提高预测用户出现预设症状的准确性。
83.本公开的方案还可以应用于其他场景，只要各个样本对应的结果于各个样本的第一类特征的值在预设区间内单调相关即可。
84.本公开还提供一种训练装置，下面结合图3进行描述。
85.图3为本公开训练装置的一些实施例的结构图。如图3所示，该实施例的装置30包括：获取模块310，输入模块320，确定模块330，调整模块340。
86.获取模块310用于获取用于训练的样本组，其中，样本组包括多个样本，多个样本的第一类特征的值互不相同，第二类特征的值相同。
87.输入模块320用于将样本组输入机器学习模型，得到输出的样本组中各个样本对应的结果。
88.确定模块330用于根据各个样本对应的结果确定第一损失函数的值，其中，第一损失函数根据单调约束条件构建，各个样本对应的结果越符合单调约束条件，第一损失函数的值越小，单调约束条件为各个样本的第一类特征的值在预设区间内与各个样本对应的结果单调相关。
89.在一些实施例中，确定模块330用于将各个样本对应的结果按照预设顺序排列，其中，预设顺序为按照各个样本的第一类特征的值由小到大或由大到小的顺序；根据每相邻两个样本对应的结果的差值确定第一损失函数的值。
90.在一些实施例中，确定模块330用于针对每相邻两个样本对应的结果的差值，确定差值是否满足单调约束条件；将不满足单调约束条件的各个差值相加，得到求和结果；根据求和结果确定第一损失函数的值。
91.调整模块340用于根据第一损失函数的值调整机器学习模型的参数。
92.在一些实施例中，样本组还包括原始样本，原始样本与多个样本中的一个相同，确
定模块330还用于根据原始样本对应的结果与原始样本的标注信息确定第二损失函数的值；调整模块340用于将第一损失函数的值和第二损失函数的值进行加权求和，得到总损失函数的值；根据总损失函数的值调整机器学习模型的参数。
93.在一些实施例中，调整模块340用于根据总损失函数的值确定是否达到预设收敛条件；在未达到预设收敛条件的情况下，根据总损失函数和预设参数调整方法，调整机器学习模型的参数。
94.在一些实施例中，装置30还包括：生成模块350用于获取原始样本；根据原始样本的第一类特征的值和第二类特征的值，生成多个样本；将原始样本和多个新样本组成样本组。
95.在一些实施例中，生成模块350用于在第一类特征的取值为连续值的情况下，将第一类特征的取值的预设区间划分为多个子区间，并设置各个子区间对应的转换值；将原始样本的第一类特征的原始值替换为所在的子区间对应的转换值，作为原始样本的第一类特征的值；将各个子区间的转换值作为多个样本中各个样本的第一类特征的值。
96.在一些实施例中，第一类特征为用户的知识水平评价指标，第二类特征包括用户的历史行为信息，机器学习模型为风险预测模型，各个样本对应的结果为各个样本对应的资源占用超过期限的概率。装置30还包括：风险预测模块，用于将待预测用户的特征信息输入风险预测模型，其中，待预测用户的信特征息包括：待预测用户的知识水平评价指标，以及待预测用户的历史行为信息；获取风险预测模型输出的待预测用户对资源占用超过期限的概率。
97.在一些实施例中，第一类特征为用户关于对象的历史访问次数，第二类特征包括用户的属性信息，机器学习模型为对象推荐模型，各个样本对应的结果为各个样本对应的对象的推荐概率。装置30还包括：对象推荐模块，用于将待推荐用户的特征信息输入对象推荐模型，其中，待推荐用户的特征信息包括：待推荐用户关于对象的历史访问次数以及待推荐用户的属性信息；根据对象推荐模型输出的对象的推荐概率，确定是否向待推荐用户推荐对象。
98.在一些实施例中，第一类特征为用户的年龄，第二类特征包括用户的历史问诊信息，机器学习模型为预测模型，各个样本对应的结果为各个样本对应的用户的出现预设症状概率。装置30还包括：预测模块，用于将待预测用户的特征信息输入预测模型，其中，待预测用户的特征信息包括：待预测用户的历史问诊信息，以及待预测用户的年龄；获取预测模型输出的待预测用户出现预设症状的概率。
99.本公开的实施例中的训练装置可各由各种计算设备或计算机系统来实现，下面结合图4以及图5进行描述。
100.图4为本公开训练装置的一些实施例的结构图。如图4所示，该实施例的装置40包括：存储器410以及耦接至该存储器410的处理器420，处理器420被配置为基于存储在存储器410中的指令，执行本公开中任意一些实施例中的训练方法。
101.其中，存储器410例如可以包括系统存储器、固定非易失性存储介质等。系统存储器例如存储有操作系统、应用程序、引导装载程序(boot loader)、数据库以及其他程序等。
102.图5为本公开训练装置的另一些实施例的结构图。如图5所示，该实施例的装置50包括：存储器510以及处理器520，分别与存储器410以及处理器420类似。还可以包括输入输
出接口530、网络接口540、存储接口550等。这些接口530，540，550以及存储器510和处理器520之间例如可以通过总线560连接。其中，输入输出接口530为显示器、鼠标、键盘、触摸屏等输入输出设备提供连接接口。网络接口540为各种联网设备提供连接接口，例如可以连接到数据库服务器或者云端存储服务器等。存储接口550为sd卡、u盘等外置存储设备提供连接接口。
103.需要说明的是本公开的技术方案中所涉及的用户个人信息的获取，存储和应用等均符合相关法律法规的规定，且不违背公序良俗。
104.本领域内的技术人员应当明白，本公开的实施例可提供为方法、系统、或计算机程序产品。因此，本公开可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用非瞬时性存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
105.本公开是参照根据本公开实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解为可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
106.这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
107.这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
108.以上所述仅为本公开的较佳实施例，并不用以限制本公开，凡在本公开的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本公开的保护范围之内。

技术特征：
1.一种训练方法，包括：获取用于训练的样本组，其中，所述样本组包括多个样本，所述多个样本的第一类特征的值互不相同，第二类特征的值相同；将所述样本组输入机器学习模型，得到输出的所述样本组中各个样本对应的结果；根据所述各个样本对应的结果确定第一损失函数的值，其中，所述第一损失函数根据单调约束条件构建，所述各个样本对应的结果越符合所述单调约束条件，所述第一损失函数的值越小，所述单调约束条件为所述各个样本的第一类特征的值在预设区间内与所述各个样本对应的结果单调相关；根据所述第一损失函数的值调整所述机器学习模型的参数。2.根据权利要求1所述的训练方法，其中，所述根据所述各个样本对应的结果确定第一损失函数的值包括：将所述各个样本对应的结果按照预设顺序排列，其中，所述预设顺序为按照所述各个样本的第一类特征的值由小到大或由大到小的顺序；根据每相邻两个样本对应的结果的差值确定所述第一损失函数的值。3.根据权利要求2所述的训练方法，其中，所述根据每相邻两个样本对应的结果的差值确定所述第一损失函数的值包括：针对每相邻两个样本对应的结果的差值，确定所述差值是否满足所述单调约束条件；将不满足所述单调约束条件的各个差值相加，得到求和结果；根据所述求和结果确定所述第一损失函数的值。4.根据权利要求1所述的训练方法，其中，所述样本组还包括原始样本，所述原始样本与所述多个样本中的一个相同，所述方法还包括：根据所述原始样本对应的结果与所述原始样本的标注信息确定第二损失函数的值；所述根据所述第一损失函数的值调整所述机器学习模型的参数包括：将所述第一损失函数的值和所述第二损失函数的值进行加权求和，得到总损失函数的值；根据所述总损失函数的值调整所述机器学习模型的参数。5.根据权利要求4所述的训练方法，其中，所述根据所述总损失函数的值调整所述机器学习模型的参数包括：根据所述总损失函数的值确定是否达到预设收敛条件；在未达到预设收敛条件的情况下，根据所述总损失函数和预设参数调整方法，调整所述机器学习模型的参数。6.根据权利要求4所述的训练方法，还包括：获取所述原始样本；根据所述原始样本的第一类特征的值和第二类特征的值，生成所述多个样本；将所述原始样本和所述多个新样本组成样本组。7.根据权利要求6所述的训练方法，其中，在所述第一类特征的取值为连续值的情况下，将所述第一类特征的取值的所述预设区间划分为多个子区间，并设置各个子区间对应的转换值；将所述原始样本的第一类特征的原始值替换为所在的子区间对应的转换值，作为所述
原始样本的第一类特征的值；将各个子区间的转换值作为所述多个样本中各个样本的第一类特征的值。8.根据权利要求1所述的训练方法，其中，所述第一类特征为用户的知识水平评价指标，所述第二类特征包括所述用户的历史行为信息，所述机器学习模型为风险预测模型，所述各个样本对应的结果为各个样本对应的资源占用超过期限的概率。9.根据权利要求1所述的训练方法，其中，所述第一类特征为用户关于对象的历史访问次数，所述第二类特征包括所述用户的属性信息，所述机器学习模型为对象推荐模型，所述各个样本对应的结果为各个样本对应的所述对象的推荐概率。10.根据权利要求1所述的训练方法，其中，所述第一类特征为用户的年龄，所述第二类特征包括所述用户的历史问诊信息，所述机器学习模型为预测模型，所述各个样本对应的结果为各个样本对应的所述用户的出现预设症状概率。11.根据权利要求8所述的训练方法，还包括：将待预测用户的特征信息输入所述风险预测模型，其中，所述待预测用户的信特征息包括：所述待预测用户的知识水平评价指标，以及所述待预测用户的历史行为信息；获取所述风险预测模型输出的所述待预测用户对资源占用超过期限的概率。12.根据权利要求9所述的训练方法，还包括：将待推荐用户的特征信息输入所述对象推荐模型，其中，所述待推荐用户的特征信息包括：所述待推荐用户关于对象的历史访问次数以及所述待推荐用户的属性信息；根据所述对象推荐模型输出的所述对象的推荐概率，确定是否向所述待推荐用户推荐所述对象。13.根据权利要求10所述的训练方法，还包括：将待预测用户的特征信息输入所述预测模型，其中，所述待预测用户的特征信息包括：所述待预测用户的历史问诊信息，以及所述待预测用户的年龄；获取所述预测模型输出的所述待预测用户出现预设症状的概率。14.一种训练装置，包括：获取模块，用于获取用于训练的样本组，其中，所述样本组包括多个样本，所述多个样本的第一类特征的值互不相同，第二类特征的值相同；输入模块，用于将所述样本组输入机器学习模型，得到输出的所述样本组中各个样本对应的结果；确定模块，用于根据所述各个样本对应的结果确定第一损失函数的值，其中，所述第一损失函数根据单调约束条件构建，所述各个样本对应的结果越符合所述单调约束条件，所述第一损失函数的值越小，所述单调约束条件为所述各个样本的第一类特征的值在预设区间内与所述各个样本对应的结果单调相关；调整模块，用于根据所述第一损失函数的值调整所述机器学习模型的参数。15.一种训练装置，包括：处理器；以及
耦接至所述处理器的存储器，用于存储指令，所述指令被所述处理器执行时，使所述处理器执行如权利要求1-13任一项所述的训练方法。16.一种非瞬时性计算机可读存储介质，其上存储有计算机程序，其中，该程序被处理器执行时实现权利要求1-13任一项所述方法的步骤。

技术总结
本公开涉及一种训练方法、装置和计算机可读存储介质，涉及人工智能技术领域。本公开的方法包括：获取用于训练的样本组，其中，样本组包括多个样本，多个样本的第一类特征的值互不相同，第二类特征的值相同；将样本组输入机器学习模型，得到输出的样本组中各个样本对应的结果；根据各个样本对应的结果确定第一损失函数的值，其中，第一损失函数根据单调约束条件构建，各个样本对应的结果越符合单调约束条件，第一损失函数的值越小，单调约束条件为各个样本的第一类特征的值在预设区间内与各个样本对应的结果单调相关；根据第一损失函数的值调整机器学习模型的参数。值调整机器学习模型的参数。值调整机器学习模型的参数。

技术研发人员：高俊杰汪冬冬郑邦祺黄志翔杨恺
受保护的技术使用者：京东科技控股股份有限公司
技术研发日：2023.04.06
技术公布日：2023/7/7

版权声明

本文仅代表作者观点，不代表航空之家立场。
本文系作者授权航家号发表，未经原创作者书面授权，任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时，须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的，航空之家将依法追究其法律责任。（航空之家官方QQ：2926969996）

飞行汽车 https://www.autovtol.com/

上一篇：一种双船吊装拆除海上平台用光学定位机构及方法 下一篇：一种可变二维码数据采集装置的制作方法

训练方法、装置和计算机可读存储介质与流程

版权声明

航空之家

相关推荐

文章排行

最近发表

标签列表

训练方法、装置和计算机可读存储介质与流程

版权声明

相关文章

航空之家

相关推荐

文章排行

最近发表

标签列表