物品序列推荐方法、装置、电子设备和存储介质与流程

未命名 08-14 阅读：77 评论：0

1.本发明涉及人工智能技术领域，具体而言，涉及一种物品序列推荐方法、装置、电子设备和存储介质。

背景技术：

2.现在app的场景多数为信息流推荐场景，每一个栏目页面中展示的物品，都会占据一个资源位。依据场景的不同，展示的物品的类型可能有多种多样。
3.如何将物品按照合理的序列地放置于资源位，以达到更好的推荐效果是本领域技术人员亟待解决的技术问题。

技术实现要素：

4.本发明的目的在于提供了一种物品序列推荐方法、装置、电子设备和存储介质，其能够得到物品的合理序列，以方便按照合理序列将物品放置于资源位。
5.本发明的实施例可以这样实现：
6.第一方面，本发明提供一种物品序列推荐方法，所述方法包括：
7.获取多种类型的多个物品，每一所述物品均有表征其特征的画像属性，不同类型的物品包括不同的画像属性；
8.根据所述多个物品，生成多个物品序列，每一所述物品序列包括不同类型的物品；
9.将每一所述物品序列包括的物品的画像属性进行统一化处理，得到每一所述物品序列的特征属性，不同类型的物品包括相同的特征属性；
10.将每一所述物品序列的特征属性分别输入预先训练的评分模型，得到每一所述物品序列的评分分数；
11.将评分分数最高的物品序列作为推荐序列。
12.在可选的实施方式中，所述根据所述多个物品，生成多个物品序列的步骤包括：
13.从所述多个物品中选择多个目标物品，并将选出的每一目标物品分别作为位于一个物品序列首个位置的物品；
14.从所述多个物品中分别为每一所述目标物品选择与其相邻的多个相邻物品，得到所有目标物品的相邻物品；
15.将每一所述相邻物品重新作为所述目标物品，重复从所述多个物品中分别为每一所述目标物品选择与其相邻的多个相邻物品，得到所有目标物品的相邻物品的步骤，直至每一所述物品序列中的物品个数均达到预设个数。
16.在可选的实施方式中，所述从所述多个物品中分别为每一所述目标物品选择与其相邻的多个相邻物品，得到所有目标物品的相邻物品的步骤包括：
17.从所述多个物品中分别为每一所述目标物品选择与其相邻的候选物品，得到候选物品集，所述候选物品集包括所有目标物品的候选物品；
18.从所述候选物品集中确定待删除物品；
19.将所述待删除物品从所述候选物品集中删除，所述候选物品集中剩余的物品作为所有目标物品的相邻物品。
20.在可选的实施方式中，所述从所述多个物品中分别为每一所述目标物品选择与其相邻的候选物品，得到候选物品集的步骤包括：
21.将任一所述目标物品作为待处理物品，从所述多个物品中选取第一预设个数的初选物品；
22.对每一所述初选物品在所述待处理物品所属的待处理物品序列中的概率进行评分，得到每一所述初选物品在所述待处理物品序列中的序列评分；
23.按照序列评分从高到低，依次选取第二预设个数的初选物品作为所述待处理物品的候选物品；
24.将所有目标物品的候选物品组成的集合作为所述候选物品集。
25.在可选的实施方式中，所述将每一所述物品序列包括的物品的画像属性进行统一化处理，得到每一所述物品序列的特征属性的步骤包括：
26.获取预先建立的画像属性和特征属性之间的映射关系，所述映射关系是将不同类型的物品的表征相同含义的画像属性映射至同一个特征属性；
27.根据所述映射关系，将每一所述物品序列的物品的画像属性转换成对应的特征属性。
28.在可选的实施方式中，所述评分模型包括特征处理层、自注意力机制层和评分计算层，所述将每一所述物品序列的特征属性分别输入预先训练的评分模型，得到每一所述物品序列的评分分数的步骤包括：
29.对于任一目标物品序列，将所述目标物品序列输入所述特征处理层，得到所述目标物品序列的目标序列特征向量，所述目标序列特征向量包括所述目标物品序列中每一物品的特征属性的特征向量；
30.利用所述自注意力机制层，对所述目标序列特征向量进行处理，得到自注意力结果；
31.将所述自注意力结果和预先获取的目标相关特征向量输入至所述评分计算层，得到所述目标物品序列的评分分数，最终得到每一所述物品序列的评分分数，所述目标相关特征向量是根据表征与所述目标物品序列相关度的特征向量化后得到的。
32.在可选的实施方式中，所述利用所述自注意力机制层，对所述序列特征向量进行处理，得到自注意力结果的步骤包括：
33.从所述目标物品序列中物品的特征属性的特征向量中确定目标物品的目标特征向量；
34.将所述序列特征向量和所述目标特征向量输入至所述自注意力机制层，得到所述自注意力结果。
35.第二方面，本发明提供一种物品序列推荐装置，所述装置包括：
36.获取模块，用于获取多种类型的多个物品，每一所述物品均有表征其特征的画像属性，不同类型的物品包括不同的画像属性；
37.处理模块，用于根据所述多个物品，生成多个物品序列，每一所述物品序列包括不同类型的物品；
38.所述处理模块，还用于将每一所述物品序列包括的物品的画像属性进行统一化处理，得到每一所述物品序列的特征属性，不同类型的物品包括相同的特征属性；
39.推荐模块，用于将每一所述物品序列的特征属性分别输入预先训练的评分模型，得到每一所述物品序列的评分分数；
40.所述推荐模块，还用于将评分分数最高的物品序列作为推荐序列。
41.第三方面，本发明提供一种电子设备，包括处理器和存储器，所述存储器用于存储程序，所述处理器用于在执行所述程序时，实现如前述实施方式中任一项所述的物品序列推荐方法。
42.第四方面，本发明提供一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如前述实施方式中任一项所述的物品序列推荐方法。
43.与现有技术相比，本发明实施例首先获取多种类型的多个物品，每一物品均有表征其特征的画像属性，不同类型的物品包括不同的画像属性，然后，根据多个物品，生成多个物品序列，每一物品序列包括不同类型的物品，接下来将每一物品序列包括的物品的画像属性进行统一化处理，得到每一物品序列的特征属性，不同类型的物品包括相同的特征属性，最后将每一物品序列的特征属性分别输入预先训练的评分模块，得到每一物品序列的评分分数，将评分分数最高的物品序列作为推荐序列，本发明实施例通过生成物品序列，并将物品序列中不同类型的物品的画像属性统一处理为相同的特征属性，再利用评分模型对物品序列进行评分，将评分分数最高的物品序列作为推荐序列，使最终得到的推荐序列是综合不同类型物品的特征得到的较为合理的、全局最优的物品序列。
附图说明
44.为了更清楚地说明本发明实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本发明的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。
45.图1为本发明实施例提供的一种物品推荐方式的示意图。
46.图2为本发明实施例提供的图1中物品推荐方式的实现方案的示意图。
47.图3为本发明实施例提供的物品序列推荐方式的实现方案的示意图。
48.图4为本发明实施例提供的物品序列推荐方法的流程示例图。
49.图5为本发明实施例提供的物品序列生成的示例图。
50.图6为本发明实施例画像属性和特征属性之间的映射关系示例图。
51.图7为本发明实施例提供的常见的评分模型的示例图。
52.图8为本发明实施例提供的改进后的评分模型的示例图。
53.图9为本发明实施例提供的物品序列推荐装置的方框示例图。
54.图10为本发明实施例提供的电子设备的方框示意图。
55.图标：10-电子设备；11-处理器；12-存储器；13-总线；100-物品序列推荐装置；110-获取模块；120-处理模块；130-推荐模块。
具体实施方式
56.为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
57.因此，以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围，而是仅仅表示本发明的选定实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
58.应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步定义和解释。
59.在本发明的描述中，需要说明的是，若出现术语“上”、“下”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系，或者是该发明产品使用时惯常摆放的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。
60.此外，若出现术语“第一”、“第二”等仅用于区分描述，而不能理解为指示或暗示相对重要性。
61.需要说明的是，在不冲突的情况下，本发明的实施例中的特征可以相互结合。
62.在信息流推荐场景中，每一个栏目中展示的物品都会占据一个资源位，例如，在页面的预设区域内，按照顺序显示各种物品，物品可以是有声书、广告视频、公开课等多种类型，不同类型的物品的属性信息可能相差甚远，有些属性在一种类型的物品中有，在另一种类型的物品中没有，例如，广告类型的物品，有广告主、出价、保量要求等属性信息，而在非广告类型的物品中是没有的，有声书类型的物品，有小说作者、连载天数、出版商等属性信息，这些属性信息在广告类型的物品中是没有的。
63.随着业务的增长，物品的类型越来越多，在将专辑、声音、广告等多种类型的物品推荐给用户时，需要考虑保量、限面、优惠等活动，还要考虑整体页面的展示情况，如排版、logo色系、队列主题(例如，整个页面物品的整体风格，是搞笑还是悬疑等)。如何对物品进行按序合理展示是本领域人员亟待解决的问题。
64.针对该问题，一种解决方案是，对于页面中的资源位按照预设方式进行排列，针对特定资源位按照固定任务进行处理，任务之间彼此不相关。请参照图1，图1为本发明实施例提供的一种物品推荐方式的示意图，图1中，资源位1、5、6固定展示专辑；资源位2、4固定展示声音片段；资源位3固定展示广告。将整个页面的推荐任务拆分成3个独立任务，分别训练各自的模型并进行物品推荐，彼此推荐结果不相关。即按照物品的类型进行推荐，得到同一个类型的物品的推荐结果，再按照预先设置的不同类型的资源位的排列方式，将推荐结果放在对应的资源位，请参照图2，图2为本发明实施例提供的图1中物品推荐方式的实现方案的示意图，图2中，基于用户请求分别对不同类型的物品进行召回，对每一种类型召回的物品进行画像处理，得到该类型的评分模型所需要的特征，再将每种类型物品的特征输入各自的评分模型进行模型打分，最后再将各模型的打分结果进行合并，按照预设顺序将其置于对应的资源位，这种方式存在以下问题：
65.1.随着物品类型的增多，需要启动更多模型进行打分。模型增多会带来整体页面推荐耗时增加，影响用户体验。
66.2.无法做到全局最优，资源位靠前的转换率会很高，而限制了位置展现会造成好的物料无法得到充足曝光。
67.3.模型之间信息隔离，会造成整体推荐结果割裂，比如图1中专辑类型主题偏严肃、声音类型主题偏休闲，影响用户整体体验。同时由于强制资源位展示，跨资源位插入其他类型物品，也会造成同一模型推荐结果割裂。如上图中资源位234，资源位3插入广告，也造成了体验不佳。
68.4.模型优化的目标往往为单个物品，但整个序列的价值并非单物品效果的累计，如何使得序列价值最大化，使得用户体验和app推荐结果取得双赢，需要重构模型训练流程。
69.针对上述问题，一种常见的优化方案是采用打散策略。但打散策略往往是一种强制策略，如强制规定广告不能连续出现、带logo不连续出现，每页保证特定物品出现1次以上等。此类策略可能解决一部分问题，但因为其不可控和强制性，尤其是打散处理往往在整体推荐流程最后，不符合需求结果不能再重新生成，基本上不能实现上面提到的推荐全局最优目标。
70.有鉴于此，本实施例提供一种物品序列推荐方法、装置、电子设备和存储介质，基于不同类型的物品生成物品序列，再使用统一的一个模型做推荐支持，并结合序列生成技术将基于物品的单点打分最优目标改为全序列最优。下面将对其进行详细描述。
71.为了便于先从整体上了解一下本实施例提供的方案，请参照图3，图3为本发明实施例提供的物品序列推荐方式的实现方案的示意图，图3中，首先，基于用户请求进行物品召回，作为具体实现方式，可以是按照类型召回，也可以不区分类型，进行混合召回，例如，不区分类型，统一按照向量召回，召回结果可以进行合并，合并后再统一进行后续处理；其次，按照场景需要，生成多种类型物品混合的排序序列，序列个数和长度可以根据场景需要进行配置，选择其中最优的序列进行后续处理；接下来，将选择出的最优序列进行统一画像处理，即将不同类型物品统一映射到一个虚拟item类型物品domain上，以使不同类型物品在特征维度上进行对齐，这样离线的物品属性和线上的物品属性的画像获取和处理均简化成相同一个操作流程，提升了效率。此外，基于指定的多条序列，以及指定的序列长度后，对物料统一进行画像处理及转换，避免了多次查询及转换操作；再其次，构建以序列综合打分最优为目标的模型，一种实施方式是，在物品维度增加序列上下文注意力机制，做到序列维度全局最优，模型打分返回每个序列的打分后，选择最优的序列进行后续的展示；最后，在界面上展示模型返回的最优序列，作为一种实现方式，可以根据需要进一步调整，例如，对其中的物品进行去除、交换位置等操作。
72.基于图3的整体方案示例，下面详细描述本实施例提供的物品序列推荐方法、装置、电子设备和存储介质，请参考图4，图4为本发明实施例提供的物品序列推荐方法的流程示例图，该方法包括以下步骤：
73.步骤s101，获取多种类型的多个物品，每一物品均有表征其特征的画像属性，不同类型的物品包括不同的画像属性。
74.在本实施例中，多个物品包括多种类型，例如，类型1的物品为100个，类型2的物品
为50个，类型3个物品为30个，物品的画像属性用于表征物品的特征，不同类型的物品包括不同的画像属性，例如，有声书类型的物品《毛毛的故事》的画像属性包括作者、连载天数、出版商、有声书标识，其对应的画像属性值分别为毛毛、5天、a出版商、111，广告类型的物品xx产品的画像属性包括广告主、出价、保量，其对应的画像属性值分别为a公司、10万、1万。
75.步骤s102，根据多个物品，生成多个物品序列，每一物品序列包括不同类型的物品。
76.在本实施例中，多个物品序列中的物品个数是相同的，物品序列的个数和一个物品序列中物品的个数可以根据实际场景而定，各物品序列中包括的物品的类型可以相同，也可以不同，例如，物品序列中物品的个数为5，物品序列1中包括2个类型1的物品、2个类型2的物品和1个类型3的物品，物品序列2中包括3个类型1的物品、2个类型4的物品。
77.可以理解的是，具体实现时，根据实际生成过程和实际场景的需要，生成的多个物品序列中也可能包括同一个类型物品的物品序列和不同类型物品的物品序列，例如，物品序列中物品的个数为5，物品序列1中包括1个类型1的物品、4个类型2的物品，物品序列2中包括5个类型3的物品。
78.步骤s103，将每一物品序列包括的物品的画像属性进行统一化处理，得到每一物品序列的特征属性，不同类型的物品包括相同的特征属性。
79.在本实施例中，特征属性是虚拟化的属性，一种实现方式是：建立画像属性和特征属性之间映射关系，根据映射关系将画像属性虚拟映射至特征属性，不同类型的物品的画像属性进行虚拟映射后的特征属性是相同的。
80.步骤s104，将每一物品序列的特征属性分别输入预先训练的评分模型，得到每一物品序列的评分分数。
81.在本实施例中，由于每一物品序列中不同类型的特征属性是相同的，因此可以避免按物品的类型构建不同的评分模型，而是将包括不同类型的物品序列的特征属性输入至评分模型，得到每一物品序列的评分分数，由此可以在对物品序列评价时考虑各物品之间的影响、从整体上评价物品序列是否是一个较优的序列。
82.步骤s105，将评分分数最高的物品序列作为推荐序列。
83.在本实施例中，若存在多个评分分数相同、且最高的物品序列，可以将其均作为推荐序列提供给信息流平台的管理员，由其决定选择哪一个作为最终的展示序列，也可以将评分分数从高到低排列，从中选择预设个数的物品序列作为推荐序列，由管理员从中确定最终的展示序列，或者由管理员根据推荐序列，对推荐序列中的物品进行重新排序，得到最终的展示序列。
84.本发明实施例提供的上述方法，通过生成物品序列，并将物品序列中不同类型的物品的画像属性统一处理为相同的特征属性，再利用评分模型对物品序列进行评分，将评分分数最高的物品序列作为推荐序列，使最终得到的推荐序列是综合不同类型物品的特征得到的较为合理的、全局最优的物品序列。
85.在可选的实施方式中，一种生成多个物品序列的方式是：
86.首先，从多个物品中选择多个目标物品，并将选出的每一目标物品分别作为位于一个物品序列首个位置的物品；
87.其次，从多个物品中分别为每一目标物品选择与其相邻的多个相邻物品，得到所
有目标物品的相邻物品；
88.第三，将每一相邻物品重新作为目标物品，重复从多个物品中分别为每一目标物品选择与其相邻的多个相邻物品，得到所有目标物品的相邻物品的步骤，直至每一物品序列中的物品个数均达到预设个数。
89.在本实施例中，预设个数为一个物品序列中的物品个数，预设个数可以根据实际需要确定，例如，可以根据资源位的个数确定，具体实现方式可以为等于或者大于资源位的个数。
90.需要说明的是，在每一物品序列中的物品个数均达到预设个数之后，最终可以从生成的物品序列中选择指定个数的物品序列作为后续模型的输入。
91.为了更清楚地说明生成物品序列的过程，请参照图5，图5为本发明实施例提供的物品序列生成的示例图，图5中，预设个数即序列长度为3，每次从多个物品中选择的物品个数为2，物品个数为20个，第一次，从20个物品中选择2个目标物品，第二次，对于每一个目标物品，从20个物品中选择2个相邻物品，第三次，将每一个相邻物品作为目标物品，继续从20个物品中为每一个目标物品选择2个相邻物品，最终得到8条物品序列。
92.在本实施例中，物品个数为m个时，预设个数为n，则潜在的推荐列表往往在anm(≈mn)的量级(如m＝1000、n＝10)，出于性能考虑，计算出所有可能的排序方式是不现实的，故，本实施例提供了一种得到所有目标物品的相邻物品的实现方式：
93.首先，从多个物品中分别为每一目标物品选择与其相邻的候选物品，得到候选物品集，候选物品集包括所有目标物品的候选物品；
94.在本实施例中，除了按照预先指定的物品个数为每一目标物品选择与其相邻的候选物品，为了使选出的候选物品更加合理，本实施例提供了一种候选物品集的实现方式：
95.(1)将任一目标物品作为待处理物品，从多个物品中选取第一预设个数的初选物品；
96.在本实施例中，第一预设个数可以根据实际需要、例如物品个数进行设置，例如，物品个数为100，第一预设个数设置为20。
97.(2)对每一初选物品在待处理物品所属的待处理物品序列中的概率进行评分，得到每一初选物品在待处理物品序列中的序列评分；
98.在本实施例中，为了提高物品序列的合理度，本实施例给出一种评分机制，序列评分＝权重a*(物品质量分+召回粗排分)-权重b*(规则惩罚分之和)+随机因子分。
99.物品质量分和召回粗排分在物品召回阶段可以直接获取，并且进行正则化处理，正则化处理后的分数在0-1之间。物品质量分和物品本身的质量相关，例如，有声书的物品质量分可以根据有声书的音频的清晰度和有声书的音频内容的丰富度进行评价，召回粗排分可以根据召回的情况而定，例如，从上架到召回之间的时间越短，则召回粗排分越低，否则，召回粗排分越高。
100.规则惩罚分依据场景设定，常见的有第一项出现广告惩罚、连续出现3类相同物料惩罚等。
101.权重a和权重b也可以依照不同场景设置，一般是0.5:0.5或者是0.4:0.6。
102.随机因子分是从预设候选集合中随机选取的，在每次计算分数时随机抽取，用于带入一定随机性，例如，预设候选集合(0.05、0.1、0.2)。
103.在序列评分计算过程中，权重a*(物品质量分+召回粗排分)是固定的，可以在第一次计算后将其保存，后续在生成物品序列的过程中，只需要计算权重b*(规则惩罚分之和)+随机因子分，进一步简化了计算量，有助于提升性能。
104.(3)按照序列评分从高到低，依次选取第二预设个数的初选物品作为待处理物品的候选物品；
105.在本实施例中，第二预设个数可以根据实际需要、例如物品个数进行设置，例如，物品个数为100，第一预设个数设置为20，第二预设个数设置为10。
106.(4)将所有目标物品的候选物品组成的集合作为候选物品集。
107.其次，从候选物品集中确定待删除物品；
108.在本实施例中，为了进一步简化计算，在确定候选物品集中的候选物品后，不会将所有候选物品均作为目标物品的相邻物品，需要按照预设丢弃率计算出待删除物品，将待删除物品从候选物品集中删除后，得到最终目标物品的相邻物品。
109.需要说明的是，根据实际需要，确定并从候选物品集中删除待删除物品，可以在第二次迭代计算开始，也可以在第三次迭代计算开始。和第一预设个数、第二预设个数一样，预设丢弃率可以根据需求和总计算量的要求设置，如第一预设个数、第二预设个数均比较小的话，预设丢弃率也可以设置较小一些，反之需要设置较大的预设丢弃率保证整体运算量符合需求。
110.最后，将待删除物品从候选物品集中删除，候选物品集中剩余的物品作为所有目标物品的相邻物品。
111.为了从整体流程上说明物品序列的生成过程，本实施例提供一个物品序列的生成过程的示例：
112.假设召回池中有100个不同类型混合的物品，需要生成长度为5的多条物品序列，最终选择序列评分最高的50条序列输入评分模型进行打分排序，流程如下：
113.因为序列长度为5，因此需要进行5次迭代计算。每次迭代，会按照上述步骤选择物品、并针对选出的物品使用公式计算序列评分、然后按照预设丢弃率进行部分随机丢弃，最后得到物品序列，并且和前后相应物品产生序列关联关系。
114.以每次选取10个物品，搜集抽样设置为20，从第2次迭代开始预设丢弃率设置为70％，计算流程如下：
115.第一次迭代：针对100个物品，进行随机抽样选取20个物品，对其进行公式计算打分，选择得分最高的10个物品(k＝10)作为第一次迭代的结果。
116.第二次迭代：基于第一次迭代的10个物品，针对每一个物品，进行如下计算：
117.100个召回池排除该物品，随机抽样20个物品，基于这第一个物品的前置条件，进行公式打分，选择得分最高的10个物品(k＝10)作为此次该物品的迭代结果。
118.10个物品依次计算完成后，第2个位置理论上会生成10*10个物品，每10个物品和前一个位置的物品有序列关系。针对这100个物品，随机丢弃其中70个(丢弃率70％)。因此第二次迭代在位置2总计生成30个物品，产生序列长度为2的30条序列。
119.第三次迭代：基于第二次迭代生成的30个物品，重复进行第二次迭代类似计算。完成后在位置3总计生成90个物品，产生序列长度为3的90条序列。
120.不断重复到第五次迭代结束，每次迭代会生成(10、30、90、270、810)个对应位置物
品候补以及序列。最终基于810条长度为5的序列，综合其每次迭代计算的公式打分之和，得到分数最高的50条序列。
121.实际运行该流程时，会根据场景需要和计算耗时，对物品的序列评分公式、k、抽样召回数、预设丢弃率、物品序列的序列得分的计算方式等这些参数进行灵活指定，取一个中间状态。
122.在得到生成的物品序列后，由于一个物品序列中包括不同类型的物品，在用预先训练的评分模型对生成的每一物品序列进行评分时会遇到如下技术障碍：(1)不同类型物品，所拥有的画像往往不同，如广告物品，有广告主、出价、保量要求等画像属性；专辑有声书，有小说作者、连载天数等画像。就会造成具体画像属性不一致，物品的画像属性的长度不一致等问题。(2)在模型搭建环节，具体画像和个数不一致，就无法按照序列处理，增加模型复杂度甚至无法构建相应模型。(3)在画像特征获取环节，不同画像特征的存储位置不一致。如果按照在序列中按照每个物品类型来获取具体画像属性的获取方式，会增加获取复杂度并且造成性能降低。(4)不同物品的画像属性往往也有很多相同部分，如id、名称等，在实际实现时需要考虑到存储复用以及获取成本的均衡。
123.针对上述技术障碍，本实施例还需要对物品序列中的物品的画像属性进行统一化处理，本实施例提供了一种统一化的处理方式：
124.首先，获取预先建立的画像属性和特征属性之间的映射关系，映射关系是将不同类型的物品的表征相同含义的画像属性映射至同一个特征属性；
125.其次，根据映射关系，将每一物品序列的物品的画像属性转换成对应的特征属性。
126.在本实施例中，不同类型的画像属性可能是不相同的，但是会有些画像属性不同、但是表征的含义相同的情况，对于此类画像属性，可以将其虚拟成同一个特征属性，例如，专辑类型的画像属性包括专辑id，广告类型的画像属性包括广告id、博客类型的画像属性包括博客id，虽然三者名称不同，但是都是表征对应物品的标识，因此，可以将这三者虚拟成一个特征属性：标识属性，建立各类型的表征标识的画像属性和该标识属性之间的映射关系。请参照图6，图6为本发明实施例画像属性和特征属性之间的映射关系示例图，图6中，有3种物品类型：物品a、物品b和物品c，每种类型均有个数不定的画像属性，其中白色表示与其他画像属性含义一致，物品a中除白色图形外的图形为物品a的特有属性、物品b中除白色图形外的图形为物品b的特有属性、物品c中除白色图形外的图形为物品c的特有属性。统一化后的特征属性，包括白色图形及每类物品的特有属性。即，对于含义一致的画像属性，会保存每种画像属性和对应特征属性的映射关系。而对于含义不一致画像属性，仅保存有效映射关系，其他类型画像属性直接返回默认值，而不用额外进行画像属性的查询，能够进一步提高了性能。
127.在进行混排画像属性选择时，不再基于多类型物品，而是基于虚拟的特征属性选择其中的一个子集，利用评分模型进行评分。这样，在进行多类型物品序列混排时，不同类型的物品的特征属性的名称及含义一致、个数一致。
128.例如，图6中的3中物品类型及其画像属性分别为：
129.物品a为专辑album，有6个画像属性，分别是：id、名称、类别、总点击数、专辑logo、专辑简介，其中最后二个是专辑类型的物品独有。
130.物品b为广告ads，有6个画像属性，分别是：id、名称、广告主id、广告出价、保量次
数。其中最后3个为广告类型的物品独有。
131.物品c为播客podcast。有4个画像属性，分别是：id、名称、类别、关注用户数。其中最后一个是播客类型的物品独有。
132.物品c的画像属性的表结构如下表1所示：
133.表1
134.podcast.id名称类别用户数1a社会20002b新闻5000
…
c休闲10000
135.一种映射关系的表示如表2所示：
136.表2
[0137][0138]
图6中，对于含义一致的album.id，ads.id，podcast.id，统一用id表示，并建立两者的映射关系，对于album.logo独有的画像属性，则用logo表示，并且为没有该画像属性的其他类型的物品设置默认值：
“”
，其他画像属性类似，不再一一赘述。
[0139]
本实施例提供的上述映射方式，在多种类型的物品混排时，各种物品均使用特征属性，且特征属性的长度固定，对齐，如有新增物品类型时，仅需补充更新映射关系即可，由此能在不新增存储成本、获取方式的前提下，统一了不同类型物品的画像属性及个数，使得长序列多物品混排的模型构建成本降低。
[0140]
在本实施例中，常用的评分模型是针对物品类型的模型，即对同一物品类型的物品进行打分，例如，对于召回池中的物品，依次利用模型打分，得到每个物品的点击概率，由
高到低排序，然后按照序列插入到指定资源位中。常用的评分模型输入的是一个物品的全部画像，输出是其点击概率打分。请参照图7，图7为本发明实施例提供的常见的评分模型的示例图，图7中，评分模型包括向量处理层、池化层、目标注意力层(target-attention层)和多层感知器(即mlp结构)，同一类型的物品的画像特征ft11～ft14，用户及上下文相关的画像特征ft21～ft26，所有画像特征分别通过向量处理层进行向量化处理，得到特征向量emb，ft11～ft14输入池化层进行池化，池化后的结果和ft21～ft26池化/拼接后的结果进行点乘或者其他计算后，将计算的结果输入模型的多层感知器，最终得到物品的预估点击率。
[0141]
由于本实施例是针对包括不同类型物品的物品序列进行评分，因此，图7的评分模型不能直接适配，本发明实施例对图7中的评分模型进行了改进，请参照图8，图8为本发明实施例提供的改进后的评分模型的示例图，图8中，改进后的评分模型包括特征处理层、自注意力机制层和评分计算层，其中，特征处理层是对物品序列中每一物品的特征属性进行向量化处理，得到该物品序列的序列特征向量，自注意力机制层是对序列特征向量进行处理，得到该序列特征向量的自注意力结果，评分计算层包括目标注意力层(target-attention层)和多层感知器，目标注意力层将自注意力结果和用户及上下文相关的特征向量池化后的结果进行点乘或者其他计算，得到计算结果，再将计算结果输入多层感知器，得到物品序列的评分分数，用户及上下文相关的特征包括、但不限于用户点击行为的时间、用户进入页面的app入口等，由于同时利用了物品序列的序列特征向量和用户及上下文相关的特征向量，因此，采用评分模型对于物品序列进行评分时，考虑了物品序列中物品的相关性、用户、上下文等各种因素，最终使得推荐出的物品序列更合理。
[0142]
基于图8的评分模型，本实施例提供了一种得到每一物品序列的评分分数的方式，本实施例以生成的物品序列中的任一目标物品序列为例进行说明：
[0143]
首先，对于任一目标物品序列，将目标物品序列输入特征处理层，得到目标物品序列的目标序列特征向量，目标序列特征向量包括目标物品序列中每一物品的特征属性的特征向量；
[0144]
其次，利用自注意力机制层，对目标序列特征向量进行处理，得到自注意力结果；
[0145]
在本实施例中，每一物品的特征向量在自注意力机制层的相关权重均与该物品序列中其他物品的特征向量相关。
[0146]
最后，将自注意力结果和预先获取的目标相关特征向量输入至评分计算层，得到目标物品序列的评分分数，最终得到每一物品序列的评分分数，目标相关特征向量是根据表征与目标物品序列相关度的特征向量化后得到的。
[0147]
在可选的实施方式中，为了更充分地利用物品序列中各物品的特征向量及各物品之间的关系，利用自注意力机制层，对序列特征向量进行处理，得到自注意力结果的实现是：
[0148]
(1)从目标物品序列中物品的特征属性的特征向量中确定目标物品的目标特征向量；
[0149]
(2)将序列特征向量和目标特征向量输入至自注意力机制层，得到自注意力结果。
[0150]
在本实施例中，输入自注意力机制层的序列特征向量可以是池化后的池化结果、目标特征向量可以不经过池化直接输入至自注意力机制层，目标特征向量可以是根据用户
需要从目标物品序列中物品的特征向量中确定的，例如，序列特征向量包括向量1、向量2、向量3，目标特征向量为向量3，则自注意力机制层的输入为向量1的池化结果、向量2的池化结果、向量3的池化结果及向量3。
[0151]
还需要说明的是，改进后的评分模型将训练时采用的优化损失函数，从常见的二分类交叉熵改成回归mse，代表一个物品序列的整体得分，即listreward分数。其训练样本的评分分数由用户在展示序列的点击、收看、继续流量等行为总和计算得到，分数越高代表其序列质量越好，序列越合理。
[0152]
为了执行上述实施例及各个可能的实施方式中的相应步骤，下面给出一种物品序列推荐装置的实现方式。请参照图9，图9为本发明实施例提供的物品序列推荐装置100的方框示意图。需要说明的是，本实施例所提供的物品序列推荐装置100，其基本原理及产生的技术效果和上述实施例相同，为简要描述，本实施例部分未提及指出。
[0153]
物品序列推荐装置100包括获取模块110、处理模块120及推荐模块130。
[0154]
获取模块110，用于获取多种类型的多个物品，每一物品均有表征其特征的画像属性，不同类型的物品包括不同的画像属性。
[0155]
处理模块120，用于根据多个物品，生成多个物品序列，每一物品序列包括不同类型的物品。
[0156]
处理模块120，还用于将每一物品序列包括的物品的画像属性进行统一化处理，得到每一物品序列的特征属性，不同类型的物品包括相同的特征属性。
[0157]
推荐模块130，用于将每一物品序列的特征属性分别输入预先训练的评分模型，得到每一物品序列的评分分数。
[0158]
推荐模块130，还用于将评分分数最高的物品序列作为推荐序列。
[0159]
在可选的实施方式中，处理模块120具体用于：从多个物品中选择多个目标物品，并将选出的每一目标物品分别作为位于一个物品序列首个位置的物品；从多个物品中分别为每一目标物品选择与其相邻的多个相邻物品，得到所有目标物品的相邻物品；将每一相邻物品重新作为目标物品，重复从多个物品中分别为每一目标物品选择与其相邻的多个相邻物品，得到所有目标物品的相邻物品的步骤，直至每一物品序列中的物品个数均达到预设个数。
[0160]
在可选的实施方式中，处理模块120具体用于从多个物品中分别为每一目标物品选择与其相邻的多个相邻物品，得到所有目标物品的相邻物品时，具体用于：从多个物品中分别为每一目标物品选择与其相邻的候选物品，得到候选物品集，候选物品集包括所有目标物品的候选物品；从候选物品集中确定待删除物品；将待删除物品从候选物品集中删除，候选物品集中剩余的物品作为所有目标物品的相邻物品。
[0161]
在可选的实施方式中，处理模块120具体用于从多个物品中分别为每一目标物品选择与其相邻的候选物品，得到候选物品集时，具体用于：将任一目标物品作为待处理物品，从多个物品中选取第一预设个数的初选物品；对每一初选物品在待处理物品所属的待处理物品序列中的概率进行评分，得到每一初选物品在待处理物品序列中的序列评分；按照序列评分从高到低，依次选取第二预设个数的初选物品作为待处理物品的候选物品；将所有目标物品的候选物品组成的集合作为候选物品集。
[0162]
在可选的实施方式中，处理模块120具体还用于：获取预先建立的画像属性和特征
属性之间的映射关系，映射关系是将不同类型的物品的表征相同含义的画像属性映射至同一个特征属性；根据映射关系，将每一物品序列的物品的画像属性转换成对应的特征属性。
[0163]
在可选的实施方式中，评分模型包括特征处理层、自注意力机制层和评分计算层，推荐模块130具体用于：对于任一目标物品序列，将目标物品序列输入特征处理层，得到目标物品序列的目标序列特征向量，目标序列特征向量包括目标物品序列中每一物品的特征属性的特征向量；利用自注意力机制层，对目标序列特征向量进行处理，得到自注意力结果；将自注意力结果和预先获取的目标相关特征向量输入至评分计算层，得到目标物品序列的评分分数，最终得到每一物品序列的评分分数，目标相关特征向量是根据表征与目标物品序列相关度的特征向量化后得到的。
[0164]
在可选的实施方式中，推荐模块130在用于利用自注意力机制层，对序列特征向量进行处理，得到自注意力结果时具体用于：从目标物品序列中物品的特征属性的特征向量中确定目标物品的目标特征向量；将序列特征向量和目标特征向量输入至自注意力机制层，得到自注意力结果。
[0165]
本实施例还提供了一种电子设备10的方框示意图，请参照图10，图10为本发明实施例提供的电子设备10的方框示意图，电子设备10包括处理器11、存储器12、总线13。处理器11、存储器12通过总线13连接。
[0166]
处理器11可能是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法的各步骤可以通过处理器11中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器11可以是通用处理器，包括中央处理器(central processing unit，简称cpu)、网络处理器(network processor，简称np)等；还可以是数字信号处理器(dsp)、专用集成电路(asic)、现成可编程门阵列(fpga)或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
[0167]
存储器12用于存储程序，例如图9中的物品序列推荐装置100，物品序列推荐装置100均包括至少一个可以软件或固件(firmware)的形式存储于存储器12中的软件功能模块，处理器11在接收到执行指令后，执行程序以实现本发明实施例中的物品序列推荐方法。
[0168]
存储器12可能包括高速随机存取存储器(ram：random access memory)，也可能还包括非易失存储器(non-volatile memory)。可选地，存储器12可以是内置于处理器11中的存储装置，也可以是独立于处理器11的存储装置。
[0169]
总线13可以是isa总线、pci总线或eisa总线等。图10仅用一个双向箭头表示，但并不表示仅有一根总线或一种类型的总线。
[0170]
本发明实施例还提供一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如前述实施方式中任一项的物品序列推荐方法。
[0171]
综上所述，本发明实施例提供了一种物品序列推荐方法、装置、电子设备和存储介质，方法包括：获取多种类型的多个物品，每一物品均有表征其特征的画像属性，不同类型的物品包括不同的画像属性；根据多个物品，生成多个物品序列，每一物品序列包括不同类型的物品；将每一物品序列包括的物品的画像属性进行统一化处理，得到每一物品序列的特征属性，不同类型的物品包括相同的特征属性；将每一物品序列的特征属性分别输入预先训练的评分模型，得到每一物品序列的评分分数；将评分分数最高的物品序列作为推荐序列。与现有技术相比，本实施例提供的物品序列推荐方法、装置、电子设备和存储介质，至
少具有以下优势：(1)自动生成包括不同类型物品的物品序列，再将物品序列中物品的画像属性统一化处理为特征属性后输入评分模型进行评分，将不同类型物料使用多个评分模型的方案转为使用统一一个评分模型做推荐，简化了评分模型的复杂度；(2)在生成物品序列时，一方面，采用权重a、权重b、物品质量分、召回粗排分、规则惩罚分及随机因子分，使得对物品序列的评价更为合理，另一方面，每次迭代抽取一部分物品、且根据需要设置预设丢弃概率，根据预设丢弃概率进行序列丢弃，以满足线上计算量的要求，保证整体运算量符合性能需求；(3)采用映射关系，将不同类型具有的不同画像属性统一化为特征属性，使得不同类型的特征属性在长度、维度上均统一，以方便后续输入评分模型进行处理，特征属性本身不需要占用存储空间，减少了空间占用，并且有新增类型时，只需要补充对应的映射关系即可，提高了维护的方便性。
[0172]
以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。

技术特征：
1.一种物品序列推荐方法，其特征在于，所述方法包括：获取多种类型的多个物品，每一所述物品均有表征其特征的画像属性，不同类型的物品包括不同的画像属性；根据所述多个物品，生成多个物品序列，每一所述物品序列包括不同类型的物品；将每一所述物品序列包括的物品的画像属性进行统一化处理，得到每一所述物品序列的特征属性，不同类型的物品包括相同的特征属性；将每一所述物品序列的特征属性分别输入预先训练的评分模型，得到每一所述物品序列的评分分数；将评分分数最高的物品序列作为推荐序列。2.如权利要求1所述的物品序列推荐方法，其特征在于，所述根据所述多个物品，生成多个物品序列的步骤包括：从所述多个物品中选择多个目标物品，并将选出的每一目标物品分别作为位于一个物品序列首个位置的物品；从所述多个物品中分别为每一所述目标物品选择与其相邻的多个相邻物品，得到所有目标物品的相邻物品；将每一所述相邻物品重新作为所述目标物品，重复从所述多个物品中分别为每一所述目标物品选择与其相邻的多个相邻物品，得到所有目标物品的相邻物品的步骤，直至每一所述物品序列中的物品个数均达到预设个数。3.如权利要求2所述的物品序列推荐方法，其特征在于，所述从所述多个物品中分别为每一所述目标物品选择与其相邻的多个相邻物品，得到所有目标物品的相邻物品的步骤包括：从所述多个物品中分别为每一所述目标物品选择与其相邻的候选物品，得到候选物品集，所述候选物品集包括所有目标物品的候选物品；从所述候选物品集中确定待删除物品；将所述待删除物品从所述候选物品集中删除，所述候选物品集中剩余的物品作为所有目标物品的相邻物品。4.如权利要求3所述的物品序列推荐方法，其特征在于，所述从所述多个物品中分别为每一所述目标物品选择与其相邻的候选物品，得到候选物品集的步骤包括：将任一所述目标物品作为待处理物品，从所述多个物品中选取第一预设个数的初选物品；对每一所述初选物品在所述待处理物品所属的待处理物品序列中的概率进行评分，得到每一所述初选物品在所述待处理物品序列中的序列评分；按照序列评分从高到低，依次选取第二预设个数的初选物品作为所述待处理物品的候选物品；将所有目标物品的候选物品组成的集合作为所述候选物品集。5.如权利要求1所述的物品序列推荐方法，其特征在于，所述将每一所述物品序列包括的物品的画像属性进行统一化处理，得到每一所述物品序列的特征属性的步骤包括：获取预先建立的画像属性和特征属性之间的映射关系，所述映射关系是将不同类型的物品的表征相同含义的画像属性映射至同一个特征属性；
根据所述映射关系，将每一所述物品序列的物品的画像属性转换成对应的特征属性。6.如权利要求1所述的物品序列推荐方法，其特征在于，所述评分模型包括特征处理层、自注意力机制层和评分计算层，所述将每一所述物品序列的特征属性分别输入预先训练的评分模型，得到每一所述物品序列的评分分数的步骤包括：对于任一目标物品序列，将所述目标物品序列输入所述特征处理层，得到所述目标物品序列的目标序列特征向量，所述目标序列特征向量包括所述目标物品序列中每一物品的特征属性的特征向量；利用所述自注意力机制层，对所述目标序列特征向量进行处理，得到自注意力结果；将所述自注意力结果和预先获取的目标相关特征向量输入至所述评分计算层，得到所述目标物品序列的评分分数，最终得到每一所述物品序列的评分分数，所述目标相关特征向量是根据表征与所述目标物品序列相关度的特征向量化后得到的。7.如权利要求6所述的物品序列推荐方法，其特征在于，所述利用所述自注意力机制层，对所述序列特征向量进行处理，得到自注意力结果的步骤包括：从所述目标物品序列中物品的特征属性的特征向量中确定目标物品的目标特征向量；将所述序列特征向量和所述目标特征向量输入至所述自注意力机制层，得到所述自注意力结果。8.一种物品序列推荐装置，其特征在于，所述装置包括：获取模块，用于获取多种类型的多个物品，每一所述物品均有表征其特征的画像属性，不同类型的物品包括不同的画像属性；处理模块，用于根据所述多个物品，生成多个物品序列，每一所述物品序列包括不同类型的物品；所述处理模块，还用于将每一所述物品序列包括的物品的画像属性进行统一化处理，得到每一所述物品序列的特征属性，不同类型的物品包括相同的特征属性；推荐模块，用于将每一所述物品序列的特征属性分别输入预先训练的评分模型，得到每一所述物品序列的评分分数；所述推荐模块，还用于将评分分数最高的物品序列作为推荐序列。9.一种电子设备，其特征在于，包括处理器和存储器，所述存储器用于存储程序，所述处理器用于在执行所述程序时，实现如权利要求1-7中任一项所述的物品序列推荐方法。10.一种计算机可读存储介质，其特征在于，其上存储有计算机程序，该计算机程序被处理器执行时实现如权利要求1-7中任一项所述的物品序列推荐方法。

技术总结
本发明涉及人工智能技术领域，提供了一种物品序列推荐方法、装置、电子设备和存储介质，方法包括：获取多种类型的多个物品，每一物品均有表征其特征的画像属性，不同类型的物品包括不同的画像属性；根据多个物品，生成多个物品序列，每一物品序列包括不同类型的物品；将每一物品序列包括的物品的画像属性进行统一化处理，得到每一物品序列的特征属性，不同类型的物品包括相同的特征属性；将每一物品序列的特征属性分别输入预先训练的评分模型，得到每一物品序列的评分分数；将评分分数最高的物品序列作为推荐序列。本发明能够推荐出更合理的物品序列。的物品序列。的物品序列。

技术研发人员：李超
受保护的技术使用者：北京喜禾电子科技有限公司
技术研发日：2023.06.06
技术公布日：2023/8/13

版权声明

本文仅代表作者观点，不代表航空之家立场。
本文系作者授权航家号发表，未经原创作者书面授权，任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时，须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的，航空之家将依法追究其法律责任。（航空之家官方QQ：2926969996）

飞行汽车 https://www.autovtol.com/

上一篇：一种具有主动均衡的可重构电池控制电路 下一篇：基础连梁梁底模板简易拆除的施工方法与流程

物品序列推荐方法、装置、电子设备和存储介质与流程

版权声明

航空之家

相关推荐

文章排行

最近发表

标签列表

物品序列推荐方法、装置、电子设备和存储介质与流程

版权声明

相关文章

航空之家

相关推荐

文章排行

最近发表

标签列表