一种信息推荐方法、装置、设备及存储介质、程序产品与流程

未命名 07-22 阅读：77 评论：0

1.本技术涉及云技术，尤其涉及一种信息推荐方法、装置、设备及存储介质、程序产品。

背景技术：

2.信息推荐的目的是根据用户的兴趣、喜好，推荐其可能感兴趣信息，以使用户发生信息投放方所期望的转化行为的过程。例如，根据用户的兴趣推荐商品链接，以吸引用户下单，或者是根据用户的喜欢的公众人物推荐相关的文章，以吸引用户转发、收藏等等。
3.相关技术中，信息推荐大多是基于人工智能技术实现的，例如，利用信息的曝光、点击、转化等数据，用户的特征等数据在线下训练深度学习模型，然后利用训练好的深度学习模型在线上筛选出用户感兴趣的信息，并将感兴趣的信息返回给用户，以完成信息推荐过程。
4.然而，通过这种方式训练出的模型，学习到的更多是用户的泛性特征，即学习的到是用户的共性，从而，通过这种模型所选择出的信息并不一定是用户感兴趣的，最终使得信息推荐的准确度较低。

技术实现要素：

5.本技术实施例提供一种信息推荐方法、装置、设备及计算机可读存储介质、程序产品，能够提高信息推荐的准确度。
6.本技术实施例的技术方案是这样实现的：
7.本技术实施例提供一种信息推荐方法，包括：
8.响应于目标对象的信息请求，获取预训练推荐模型、所述目标对象的历史关联信息，以及所述目标对象对于所述历史关联信息的历史行为信息；
9.针对所述目标对象，筛选出候选推荐信息；
10.基于所述历史关联信息的特征、所述目标对象的特征以及所述历史行为信息，对所述预训练推荐模型进行微调，得到所述目标对象对应的目标预测模型；
11.通过所述目标预测模型，预测所述目标对象针对所述候选推荐信息的兴趣参数；
12.基于所述兴趣参数，从所述候选推荐信息中筛选出目标推荐信息，并将所述目标推荐信息返回给所述目标对象。
13.本技术实施例提供一种信息推荐装置，包括：
14.信息获取模块，用于响应于目标对象的信息请求，获取预训练推荐模型、所述目标对象的历史关联信息，以及所述目标对象对于所述历史关联信息的历史行为信息；
15.信息筛选模块，用于针对所述目标对象，筛选出候选推荐信息；
16.模型微调模块，用于基于所述历史关联信息的特征、所述目标对象的特征以及所述历史行为信息，对所述预训练推荐模型进行微调，得到所述目标对象对应的目标预测模型；
17.参数预测模块，用于通过所述目标预测模型，预测所述目标对象针对所述候选推荐信息的兴趣参数；
18.所述信息筛选模块，还用于基于所述兴趣参数，从所述候选推荐信息中筛选出目标推荐信息，并将所述目标推荐信息返回给所述目标对象。
19.在本技术的一些实施例中，所述模型微调模块，还用于基于所述历史关联信息的特征和所述目标对象的特征，生成嵌入特征和微调特征；基于对所述嵌入特征和所述微调特征的融合进行控制，生成所述预训练推荐模型的输入特征；依据所述输入特征和所述历史行为信息，对所述预训练推荐模型进行参数调整，直至达到微调结束条件时，得到所述目标预测模型。
20.在本技术的一些实施例中，所述模型微调模块，还用于对所述嵌入特征进行参数预测，得到控制参数；所述控制参数用于表征所述嵌入特征和所述微调特征是否进行特征融合；依据所述控制参数，对所述微调特征和所述嵌入特征的融合进行控制，得到所述预训练推荐模型的所述输入特征。
21.在本技术的一些实施例中，所述模型微调模块，还用于当所述控制参数表征进行特征融合时，将所述嵌入特征和所述微调特征的融合结果，确定为所述预训练推荐模型的所述输入特征；当所述控制参数表征不进行特征融合时，将所述嵌入特征确定为所述预训练推荐模型的所述输入特征。
22.在本技术的一些实施例中，所述历史行为信息包括：表征所述目标对象针对所述历史关联信息是否进行了转换操作的历史转化信息；所述模型微调模块，还用于利用所述预训练推荐模型，从所述输入特征中预测出所述目标对象针对所述历史关联信息的预测转化结果；依据所述预测转化结果和所述历史转化信息之间的差异，对所述预训练推荐模型进行参数调整，直至达到所述微调结束条件时，得到所述目标预测模型。
23.在本技术的一些实施例中，所述模型微调模块，还用于对所述历史关联信息的特征和所述目标对象的特征进行整合，得到整合稀疏特征；将所述整合稀疏特征进行稠密特征的变换，得到所述嵌入特征；对所述嵌入特征进行特征提取，得到所述微调特征。
24.在本技术的一些实施例中，所述信息筛选模块，还用于利用召回模型，从信息库中初步筛选出多个召回信息；通过粗排模型，对多个所述召回信息进行排序，得到粗排信息序列；将所述粗排信息序列中的前n个信息，确定为所述候选推荐信息；n≥1。
25.在本技术的一些实施例中，所述兴趣参数包括：预估点击率和预估转化率；所述信息筛选模块，还用于基于所述预估点击率和所述预估转化率，计算出预估推荐收益指标；将所述预估推荐收益指标最大的k个候选推荐信息，确定为所述目标推荐信息；其中，k≥1。
26.在本技术的一些实施例中，所述信息推荐装置还包括：模型训练模块；所述模型训练模块，用于获取信息库中的各个信息的操作数据，以及初始推荐模型；其中，所述操作数据至少包括曝光数据、点击数据和转化数据；利用所述信息库中的所述各个信息的特征和所述操作数据，定时对所述初始推荐模型进行训练，得到所述预训练推荐模型。
27.在本技术的一些实施例中，所述参数预测模块，还用于对所述目标对象的特征和所述候选推荐信息的特征进行转换，得到转换特征，并从所述转换特征中抽取出调整特征；针对所述转换特征和所述调整特征生成融合参数，并利用所述融合参数对所述转换特征和所述调整特征的融合进行控制，得到待预测特征；通过所述目标预测模型对所述待预测特
征进行预测，预测出所述目标对象针对所述候选推荐信息的所述兴趣参数。
28.在本技术的一些实施例中，所述针对所述转换特征和所述调整特征生成融合参数，是通过参数预测模型实现的，所述对所述嵌入特征进行参数预测，得到控制参数，是通过初始参数模型实现的；
29.所述模型训练模块，还用于针对生成的所述控制参数，生成服从预设分布的样本值；依据所述样本值，计算出所述控制参数的更新分量；将所述控制参数和所述更新分量求和，得到所述更新参数；利用所述更新参数的归一化结果，对所述初始参数模型进行参数优化，直至达到优化结束条件时，得到所述参数预测模型。
30.本技术实施例提供一种信息推荐设备，包括：
31.存储器，用于存储可执行指令；
32.处理器，用于执行所述存储器中存储的可执行指令时，实现本技术实施例提供的信息推荐方法。
33.本技术实施例提供一种计算机可读存储介质，存储有可执行指令，用于引起处理器执行时，实现本技术实施例提供的信息推荐方法。
34.本技术实施例提供一种计算机程序产品，包括计算机程序或指令，所述计算机程序或指令被处理器执行时实现本技术实施例提供的信息推荐方法。
35.本技术实施例具有以下有益效果：信息推荐设备是在接收到目标对象的信息请求时，在已经学习了用户的共性特征的预训练推荐模型的基础上，利用目标对象的特征、目标对象的历史关联信息的特征以及历史行为信息进行微调，以得到学习了目标对象的个性特征的目标预测模型，实现对目标对象进行模型的定制化，最后利用目标预测模型更加准确地预测出目标对象针对候选推荐信息的兴趣参数，利用兴趣参数筛选出符合目标对象的喜好的目标推荐信息，最终使得信息推荐的准确度得以提高。
附图说明
36.图1是本技术实施例提供的信息推荐系统的架构示意图；
37.图2是本技术实施例提供的图1中的服务器的结构示意图；
38.图3是本技术实施例提供的信息推荐方法的流程示意图一；
39.图4是本技术实施例提供的目标推荐信息的展示示意图；
40.图5是本技术实施例提供的信息推荐方法的流程示意图二；
41.图6是本技术实施例提供的预测控制参数的过程示意图；
42.图7是本技术实施例提供的输入特征的生成过程示意图；
43.图8是本技术实施例提供的信息推荐方法的流程示意图三；
44.图9是本技术实施例提供的广告推送时的数据流程图；
45.图10是本技术实施例提供的微调时的模型结构图；
46.图11是本技术实施例提供的auc对比示意图；
47.图12是本技术实施例提供的mse对比示意图。
具体实施方式
48.为了使本技术的目的、技术方案和优点更加清楚，下面将结合附图对本技术作进
一步地详细描述，所描述的实施例不应视为对本技术的限制，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本技术保护的范围。
49.在以下的描述中，涉及到“一些实施例”，其描述了所有可能实施例的子集，但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集，并且可以在不冲突的情况下相互结合。
50.除非另有定义，本文所使用的所有的技术和科学术语与属于本技术的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本技术实施例的目的，不是旨在限制本技术。
51.对本技术实施例进行进一步详细说明之前，对本技术实施例中涉及的名词和术语进行说明，本技术实施例中涉及的名词和术语适用于如下的解释。
52.1)云技术(cloud technology)是指在广域网或局域网内将硬件、软件、网络等系列资源统一起来，实现数据的计算、存储、处理和共享的一种托管技术。
53.云技术是基于云计算商业模式应用的网络技术、信息技术、整合技术、管理平台技术、应用技术等的总称，可以组成资源池，按需所用，灵活便利。云计算技术将变成重要支撑。技术网络系统的后台服务需要大量的计算、存储资源，如视频网站、图片类网站和更多的门户网站。伴随着互联网行业的高度发展和应用，将来每个物品都有可能存在自己的识别标识，都需要传输到后台系统进行逻辑处理。不同程度级别的数据将会分开处理，各类行业数据皆需要强大的系统后盾支撑，只能通过云计算来实现。
54.2)人工智能(artificial intelligence，ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。
55.人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习、自动驾驶、智慧交通等几大方向。
56.3)机器学习(machine learning，ml)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
57.4)因子分解机(factorization machine，fm)是一种基于矩阵分解的机器学习算法，旨在解决稀疏数据下的特征组合的问题，被广泛应用于点击率预估模型中。
58.5)深度神经网络(deep neural network，dnn)是一种拥有多个隐藏层的神经网络，是最有效的点击率预测模型之一。
59.6)嵌入转换，将离散向量转换为连续向量的方法。一般来说，dnn模型可以将离散
特征转换为嵌入向量，并在拼接或者进行其他处理之后作为模型的输入层。
60.7)重参数化技巧(re-parameterization trick)是一种解决深度学习模型中采样不可导问题的方法。
61.8)微调(fine-tuning)是把已经训练好的模型(例如预训练模型)的参数迁移到新的模型，以帮助新模型训练的过程。一般做法是冻结预训练模型的部分层、训练剩下的网络层和全连接层。
62.9)千次展示收益(empirical cost-per-thousand impressions，ecpm)指的是千次展示的有效收益，是评估收益的关键定量指标。
63.10)点击率(click-through-rate，ctr)是指信息在展示之后被点击的次数，与信息的展示次数的比率。点击率通常用来衡量信息的收到关注的程度。
64.11)转化率(conversion rate，cvr)是指点击了推荐信息的用户中，发生信息投放方所期望的转化行为的用户的比率，其中，转化行为可以是下单、收藏、转发等能够信息带来正面影响的行为。
65.12)响应于，用于表示所执行的操作所依赖的条件或者状态，当满足所依赖的条件或状态时，所执行的一个或多个操作可以是实时的，也可以具有设定的延迟；在没有特别说明的情况下，所执行的多个操作不存在执行先后顺序的限制。
66.信息推荐的目的是根据用户的兴趣、喜好，推荐其可能感兴趣信息，以使用户发生信息投放方所期望的转化行为的过程。例如，根据用户的兴趣推荐商品链接，以吸引用户下单，或者是根据用户的喜欢的公众人物推荐相关的文章，以吸引用户转发、收藏等等。
67.相关技术中，信息推荐大多是基于人工智能技术实现的，例如，利用信息的曝光、点击、转化等数据，用户的特征等数据在线下训练深度学习模型，然后利用训练好的深度学习模型在线上筛选出用户感兴趣的信息，并将感兴趣的信息返回给用户，以完成信息推荐过程。
68.通过这种方式训练出的模型，学习到的更多是用户的泛性特征，即学习的到是用户的共性，从而，通过这种模型所选择出的信息，缺乏对用户的个性化推荐，最终使得信息推荐的准确度较低。
69.进一步的，相关技术中，用户的特征的数据量一般较小，利用用户的特征训练模型时，极易出现过拟合的现象，从而给模型训练带来困难。对此，相关技术中，一般通过对利用大数据集训练好的模型进行微调的策略来解决。其中，利用较大的源领域数据集对模型进行预训练，再基于较小的目标领域数据集对预训练模型进行微调，不仅能够解决训练困难的问题，还能够将在源领域数据集上学习到的知识，迁移到目标领域的模型上，使得模型的性能更好。
70.常见的基于目标领域数据集微调模型的策略包括：基于正则化项进行微调、基于知识蒸馏进行微调、基于门控网络控制微调等。
71.基于正则化项进行微调，是指在模型从零开始学习时，通过正则化隐式限制网络的容量，即搜索空间的有效大小，促进优化并避免过拟合。微调的起点传达了与源领域和源任务有关的信息，因此，预训练模型设置了一个起点(st arting point，sp)，可用于定于在微调期间有效搜索的功能空间。该方法一般从l2正则化项向入手，以解决小数据集在微调过程中过拟合的问题，常用的l2正则化项如式(1)所示：
[0072][0073]
而引入预训练模型的起点的正则化项为式(2)所示：
[0074][0075]
其中，sp为起点，即希望通过约束权重w，不要离起点那么远，即原来已经学习到的知识w0去抵抗过拟合的情况。这种惩罚比常用的l2惩罚有效的多，也比冻结网络第一层的策略更有效，更容易实施。实验表明，l2-sp保留了在源数据集上学习的特征的记忆，对于过拟合的问题采取的比较通用的正则化方法，使得不会在小数据集上学偏，不需要更改模型结构、实现简单，结果有效。
[0076]
基于知识蒸馏进行微调是知识蒸馏技术和微调技术的结合。知识蒸馏可以训练一个较小的网络，使之可以在源数据集上或者大量无标签的数据集上达到一个复杂网络的性能。对于新任务中的每一个样本，使用预训练模型作为教师模型(teacher model)。与传统的微调相比起来，使用教师模型输出的回归对新任务中的样本进行了约束。这种方式的训练过程如下：
[0077]
第一步：记录新的数据在原始网络上的输出，共享参数记作θs，用于特殊任务的参数记作θo，对于新增的类，增加相应的全连接层的节点个数，并随机初始化权重θn。
[0078]
第二步：训练网络并优化在所有任务上的损失函数。在训练时，首先冻结θs和θo，然后训练θn，指导其收敛，然后再训练所有的θs、θo和θn，直至收敛。
[0079]
基于知识蒸馏进行微调是在微调方法和微调优化方法上均有所改善，在效率和性能上都所有优化，并且利用教师模型去训练新的数据，可以有效地保留源领域所学习的知识。基于知识蒸馏进行微调的上界是联合学习，不过其采取了一个更加高效的方法，输入的数据只需要目标数据即可。
[0080]
基于门控网络控制微调方法中，模型包含了三个网络：第一个是训练好的预训练网络，其参数被冻结，不会被训练和更新；第二个是微调网络，其利用预训练模型进行初始化，可被微调和更新；第三个是门控网络，用于控制特征以及网络层的路径。
[0081]
门控网络分为两个部分，分别为特征控制部分和网络控制部分。其中，特征控制部分用于决定哪些特征需要保留或微调，网络控制部分用于控制上层网络的每一层是否需要微调。特征控制部分的公式如式(3)所示：
[0082][0083]
其中，是预训练时的学习到的特征，是预训练时的输入，是微调时的输入，是第i个特征的决策值，取值为0或1，i是特征域的个数，x
hot,i
是第i个特征的温度特征，是特征控制部分的输出。
[0084]
虽然基于正则化项进行微调、基于知识蒸馏进行微调能够解决由于数据量过小所导致的过拟合的问题，但是这两种方式针对数据特征的，没有进行一个选择性的更新，例如当用户数据有一些新增的特征，或者一些特殊的行业特征和源数据集不同时，基于正则化项进行微调、基于知识蒸馏进行微调学习到的知识难以指导新的用户特征，从而微调出的
模型并不能取得较好的性能，即微调效果较差。
[0085]
再进一步的，虽然基于门控网络控制微调能够对特征进行选择性的微调更新，但是这种方式需要同时保存预训练模型和微调模型这两套模型的参数，从而使得模型的参数量较大，如此，模型在计算时需要消耗更多的内存资源。
[0086]
除此之外，为了在信息推荐时考虑到不同用户的个性，需要在线下针对不同用户各自训练出适配的模型并存储，以在线上预测时使用，从而需要占据较多的存储资源。
[0087]
本技术实施例提供一种信息推荐方法、装置、设备和计算机可读存储介质、程序产品，能够提高信息推荐的准确度。下面说明本技术实施例提供的信息推荐设备的示例性应用，本技术实施例提供的信息推荐设备可以实施为笔记本电脑，平板电脑，台式计算机，机顶盒，移动设备(例如，移动电话，便携式音乐播放器，个人数字助理，专用消息设备，便携式游戏设备)等各种类型的用户终端，也可以实施为服务器，还可以实施为由服务器和终端组成的设备集群。下面，将说明信息推荐设备实施为或服务器时示例性应用。
[0088]
参见图1，图1是本技术实施例提供的信息推荐系统的架构示意图，为实现支撑一个信息推荐应用，在信息推荐系统100中，终端400通过网络300连接服务器200，网络300可以是广域网或者局域网，又或者是二者的组合。在信息推荐系统100中，还设置有数据库500，以用于给服务器200提供数据支持。数据库500可以是独立于服务器200的，也可以是配置在服务器200中的。图1示出的是数据库500独立于服务器200的示例。
[0089]
终端400用于响应目标对象(即用户)在图形界面410上的操作，生成信息请求，并通过网络300将信息请求发送给服务器200。
[0090]
服务器200用于响应于目标对象的信息请求，获取预训练推荐模型，并从数据库500中，获取目标对象的历史关联信息，以及目标对象对于历史关联信息的历史行为信息；针对目标对象，筛选出候选推荐信息；基于历史关联信息的特征、目标对象的特征以及历史行为信息，对预训练模型进行微调，得到目标对象对于的目标预测模型；通过目标预测模型，预测出目标对象针对候选推荐信息的兴趣参数；基于兴趣参数，从候选推荐信息中筛选出目标推荐信息，并将目标推荐信息返回给目标对象，即返回给终端400。
[0091]
终端400还用于在图形界面410上展示目标推荐信息。
[0092]
在一些实施例中，服务器200可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、cdn、以及大数据和人工智能平台等基础云计算服务的云服务器。终端400可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等，但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接，本发明实施例中不做限制。
[0093]
参见图2，图2是本技术实施例提供的图1中的服务器的结构示意图，图2所示的服务器200包括：至少一个处理器210、存储器250、至少一个网络接口220和用户接口230。服务器200中的各个组件通过总线系统240耦合在一起。可理解，总线系统240用于实现这些组件之间的连接通信。总线系统240除包括数据总线之外，还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见，在图2中将各种总线都标为总线系统240。
[0094]
处理器210可以是一种集成电路芯片，具有信号的处理能力，例如通用处理器、数字信号处理器(dsp，digital signal processor)，或者其他可编程逻辑器件、分立门或者
晶体管逻辑器件、分立硬件组件等，其中，通用处理器可以是微处理器或者任何常规的处理器等。
[0095]
用户接口230包括使得能够呈现媒体内容的一个或多个输出装置231，包括一个或多个扬声器和/或一个或多个视觉显示屏。用户接口230还包括一个或多个输入装置232，包括有助于用户输入的用户接口部件，比如键盘、鼠标、麦克风、触屏显示屏、摄像头、其他输入按钮和控件。
[0096]
存储器250可以是可移除的，不可移除的或其组合。示例性的硬件设备包括固态存储器，硬盘驱动器，光盘驱动器等。存储器250可选地包括在物理位置上远离处理器210的一个或多个存储设备。
[0097]
存储器250包括易失性存储器或非易失性存储器，也可包括易失性和非易失性存储器两者。非易失性存储器可以是只读存储器(rom，read only me mory)，易失性存储器可以是随机存取存储器(ram，random access memor y)。本技术实施例描述的存储器250旨在包括任意适合类型的存储器。
[0098]
在一些实施例中，存储器250能够存储数据以支持各种操作，这些数据的示例包括程序、模块和数据结构或者其子集或超集，下面示例性说明。
[0099]
操作系统251，包括用于处理各种基本系统服务和执行硬件相关任务的系统程序，例如框架层、核心库层、驱动层等，用于实现各种基础业务以及处理基于硬件的任务；
[0100]
网络通信模块252，用于经由一个或多个(有线或无线)网络接口220到达其他计算设备，示例性的网络接口220包括：蓝牙、无线相容性认证(wi-fi)、和通用串行总线(usb，universal serial bus)等；
[0101]
呈现模块253，用于经由一个或多个与用户接口230相关联的输出装置231(例如，显示屏、扬声器等)使得能够呈现信息(例如，用于操作外围设备和显示内容和信息的用户接口)；
[0102]
输入处理模块254，用于对一个或多个来自一个或多个输入装置232之一的一个或多个用户输入或互动进行检测以及翻译所检测的输入或互动。
[0103]
在一些实施例中，本技术实施例提供的信息推荐装置可以采用软件方式实现，图2示出了存储在存储器250中的信息推荐装置255，其可以是程序和插件等形式的软件，包括以下软件模块：信息获取模块2551、信息筛选模块2552、模型微调模块2553、参数预测模块2554和模型训练模块2555，这些模块是逻辑上的，因此根据所实现的功能可以进行任意的组合或进一步拆分。将在下文中说明各个模块的功能。
[0104]
在另一些实施例中，本技术实施例提供的信息推荐装置可以采用硬件方式实现，作为示例，本技术实施例提供的信息推荐装置可以是采用硬件译码处理器形式的处理器，其被编程以执行本技术实施例提供的信息推荐方法，例如，硬件译码处理器形式的处理器可以采用一个或多个应用专用集成电路(asic，application specific integrated circuit)、dsp、可编程逻辑器件(pld，progra mmable logic device)、复杂可编程逻辑器件(cpld，complex programmabl e logic device)、现场可编程门阵列(fpga，field-programmable gate array)或其他电子元件。
[0105]
在一些实施例中，终端或服务器可以通过运行计算机程序来实现本技术实施例提供的权限发放方法。举例来说，计算机程序可以是操作系统中的原生程序或软件模块；可以
是本地(native)应用程序(app，application)，即需要在操作系统中安装才能运行的程序，如信息推荐app；也可以是小程序，即只需要下载到浏览器环境中就可以运行的程序；还可以是能够嵌入至任意app中的小程序。总而言之，上述计算机程序可以是任意形式的应用程序、模块或插件。
[0106]
本技术实施例可以应用于云技术、人工智能、智慧交通、车载等各种场景。下面，将结合本技术实施例提供的终端的示例性应用和实施，说明本技术实施例提供的信息推荐方法。
[0107]
参见图3，图3是本技术实施例提供的信息推荐方法的流程示意图一，将结合图3示出的步骤进行说明。
[0108]
s101、响应于目标对象的信息请求，获取预训练推荐模型、目标对象的历史关联信息，以及目标对象对于历史关联信息的历史行为信息。
[0109]
本技术实施例是在向目标对象进行信息推荐的场景下实现的，例如，向目标对象推荐其感兴趣的商品的下单链接，或者是向目标对象其想要了解的领域的文章。本技术实施例中，信息推荐设备通过推荐请求的接收情况，判定是否需要向目标对象开始信息推荐过程。当信息推荐设备接收到来自目标对象的信息请求时，就会响应该信息请求，获取已经经过预训练的预训练推荐模型，与目标对象有关联的历史关联信息，以及目标对象针对历史关联信息的历史行为信息。
[0110]
需要说明的是，预训练推荐模型是学习了用户针对信息的共性特征的模型，例如，学习了用户的兴趣、喜好的共性的模型。进一步的，预训练推荐模型可以是利用已经推荐过的信息的历史操作数据训练出的(从历史操作数据明确何种类型的信息容易流行)，也可以是结合历史操作数据和所有已经推荐过信息的用户的画像信息共同训练出来的(结合历史操作数据和所有用户的画像信息，能够明确在不同的客群中所流行的信息的类型)。
[0111]
换句话说，本技术实施例中的预训练推荐模型，缺少对目标对象的个性特征的学习，从而若是直接利用预训练推荐模型筛选出的信息，可能并不是目标对象真正感兴趣的。
[0112]
可以理解的是，目标对象的历史关联信息，指的是目标对象在历史时期进行过操作的信息，即信息库中与目标对象有关联的信息。目标对象对历史关联信息的历史行为信息，指的是目标对象针对这些信息所进行的操作，该操作可以是点击、转化、屏蔽等等，本技术在此不作限定。
[0113]
本技术实施例中，目标对象是发出信息请求的任意线上用户。
[0114]
预训练预测模型可以是卷积神经网络(convolutional neural network)模型，也可以是深度神经网络(deep neural network)模型，本技术在此不作限定。
[0115]
s102、针对目标对象，筛选出候选推荐信息。
[0116]
信息推荐设备会先对信息库中的各个信息进行初步筛选，得到目标对象的候选推荐信息，以便于后续再从候选推荐信息中筛选出需要给推荐目标对象的推荐信息。
[0117]
可以理解的是，信息推荐设备将信息库中的最新的信息确定为候选推荐信息，也可以是将信息库中与历史关联信息较为相似的信息筛选出来，确定为候选推荐信息，本技术在此不作限定。
[0118]
进一步的，在一些实施例中，信息推荐设备可以直接利用召回模型从信息库所召回的信息，作为候选推荐信息，在另一些实施例中，信息推荐设备可以是将召回模型所召回
的信息进行粗排，将粗排之后所得到的结果确定为候选推荐信息。
[0119]
可以理解的是，候选推荐信息可以包含歌曲、小视频(时长小于5分钟的视频)、文章、图片、长视频(时长大于5分钟的视频)、商品链接、商品推广等等，本技术在此不作限定。
[0120]
进一步的，候选推荐信息并不是特指一个信息，而是泛指所有初步筛选出的信息。换句话说，候选推荐信息中可以包括一个或多个初步筛选出的信息，这些信息的类型可以相同，例如同为歌曲、文章等，也可以不相同，例如一些信息为文章，另一些信息为下单链接等，本技术在此不作限定。
[0121]
s103、基于历史关联信息的特征、目标对象的特征以及历史行为信息，对预训练推荐模型进行微调，得到目标对象对应的目标预测模型。
[0122]
信息推荐设备在确定出历史关联信息之后，会利用历史关联信息的特征、目标对象的特征作为预训练推荐模型的输入，将历史行为信息作为预训练推荐模型的监督项，对预训练推荐推荐模型进行微调，得到目标预测模型。
[0123]
需要说明的是，历史关联信息和历史行为信息，都是与目标对象强相关的，能够表明目标对象对于不同类型的信息的喜好情况，因此，将历史关联信息的特征、目标对象的特征和历史行为信息相结合对预训练推荐模型进行微调，不仅能够保留不同用户的共性特征，还能够使得预训练推荐模型充分学习到目标对象的对于不同类型的信息的个性特征，从而实现在预训练推荐模型的基础上，针对目标对象实现模型定制化，以后续便于利用目标对象的定制化模型针对目标对象筛选出其感兴趣的信息。
[0124]
可以理解的是，目标对象的特征可以是目标对象的年龄、地域、性别等基础特征，也可以是目标对象在其他的平台点击、或者是转化过的信息的特征，本技术在此不作限定。
[0125]
需要说明的是，筛选候选推荐信息和对预训练推荐模型进行微调的顺序，并不会影响最终兴趣参数的计算，因此，在一些实施例中，信息推荐设备还可以先执行s103，再执行s102，也可以同时执行s102和s103，本技术在此不作限定。
[0126]
s104、通过目标预测模型，预测出目标对象针对候选推荐信息的兴趣参数。
[0127]
信息推荐设备在得到目标预测模型之后，就会利用目标预测模型对候选推荐信息进行分析，以确定出目标对象针对候选推荐信息是否感兴趣，或者是感兴趣的程度，从而得到目标对象的兴趣参数，以便于后续根据兴趣程度选出需要推荐给目标对象的信息。
[0128]
在一些实施例中，信息推荐设备可以针对候选推荐信息进行特征提取，然后将候选推荐信息的特征输入到目标预测模型中，以分析出目标对象的兴趣参数。在另一些实施例中，信息推荐设备除了将候选推荐信息的特征输入到目标预测模型中之外，还可以同时将目标对象的特征输入到目标预测模型中，以得到兴趣参数，本技术在此不作限定。
[0129]
可以理解的是，候选推荐信息的特征，可以是候选推荐信息的类型标签的编码特征，也可以是候选推荐信息的字数、时长的编码特征，还可以是通过人工智能技术所确定出的候选推荐信息的语义特征，本技术在此不作限定。
[0130]
兴趣参数可以是目标对象针对推荐候选信息的感兴趣程度，例如，0.8、0.5等，还可以是目标对象针对候选推荐信息是否感兴趣的标记，例如，不感兴趣、非常感兴趣等等，本技术在此不作限定。
[0131]
s105、基于兴趣参数，从候选推荐信息中筛选出目标推荐信息，并将目标推荐信息返回给目标对象。
[0132]
信息推荐设备将候选推荐信息的兴趣参数相比进行比较，筛选出最大的兴趣参数，从候选推荐信息中将最大的兴趣参数所对应的信息确定为目标推荐信息；或者是将兴趣参数与参数阈值进行比较，从候选推荐信息中将高于参数阈值的信息筛选出来，作为针对目标对象的目标推荐信息。接着，信息推荐设备会通过网络将目标推荐信息发送给目标对象，以完成针对信息请求的响应，实现信息推荐过程。
[0133]
示例性的，图4是本技术实施例提供的目标推荐信息的展示示意图。在目标对象的终端的展示界面4-1中，显示了信息推荐设备针对目标对象所筛选出的目标推荐信息，该目标推荐信息中包括目标对象感兴趣的商品的链接4-11，以及该商品的图文简介4-12。
[0134]
需要说明的是，信息推荐设备所筛选出的目标推荐信息是符合目标对象的兴趣和喜好的，因此，目标对象会有极大的可能针对目标推荐信息发生转化行为，从而，所推荐的信息更加准确。
[0135]
可以理解的是，相比于相关技术中在线下训练模型时更多的学习用户的泛性特征，使得利用训练好的模型进行信息推荐时缺乏对用户的个性化推荐，本技术实施例中，信息推荐设备是在接收到目标对象的信息请求时，在已经学习了用户的共性特征的预训练推荐模型的基础上，利用目标对象的特征、目标对象的历史关联信息的特征以及历史行为信息进行微调，以得到学习了目标对象的个性特征的目标预测模型，实现对目标对象进行模型的定制化，最后利用目标预测模型更加准确地预测出目标对象针对候选推荐信息的兴趣参数，利用兴趣参数筛选出符合目标对象的喜好的目标推荐信息，最终使得信息推荐的准确度得以提高。进一步的，本技术实施例是在接收到目标对象的请求时才开始模型微调过程，即在线上实时进行微调，从而，无需在线下针对不同的用户各自训练出适配的模型并存储，从而，还能够节省存储资源。
[0136]
基于图3，参见图5，图5是本技术实施例提供的信息推荐方法的流程示意图二。在本技术的一些实施例中，基于历史关联信息的特征、目标对象的特征以及历史行为信息，对预训练推荐模型进行微调，得到目标对象对应的目标预测模型，即s103的具体实现过程，可以包括：s1031-s1033，如下：
[0137]
s1031、基于历史关联信息的特征和目标对象的特征，生成嵌入始特征和微调特征。
[0138]
信息推荐设备在对预训练推荐模型进行微调时，会先对历史关联信息的特征和目标对象的特征进行特征处理，以得到嵌入特征和微调特征。
[0139]
在一些实施例中，信息推荐设备可以先将历史关联信息的特征和目标对象的特征转换成嵌入特征，再从嵌入特征中抽取出微调特征。在另一些实施例中，信息推荐设备还可以同时从历史关联信息的特征和目标对象的特征中抽取出嵌入特征和微调特征。
[0140]
s1032、基于对嵌入特征和微调特征的融合进行控制，生成预训练推荐模型的输入特征。
[0141]
信息推荐设备在得到嵌入特征和微调特征之后，会通过对嵌入特征和微调特征的融合进行控制，以明确预训练推荐模型是同时从嵌入特征和微调特征中进行知识的学习，还是从嵌入特征进行知识的学习。
[0142]
在一些实施例中，信息推荐设备可以通过对嵌入特征进行分析，明确其是否需要和微调特征进行融合。在另一些实施例中，信息推荐设备可以通过对历史关联信息的特征
和目标对象的特征进行信息量的估计，通过估计出的信息量和相应的阈值的大小关系，决定是否要将嵌入特征和微调特征进行融合，例如，在信息量小于阈值时进行融合，在信息量大于阈值时不进行融合等等，本技术实施例在此不作限定。
[0143]
s1033、依据输入特征和历史行为信息，对预训练推荐模型进行参数调整，得到目标预测模型。
[0144]
最后，信息推荐设备将所得到的输入特征输入至预训练推荐模型中进行预测，再利用预测结果和历史行为信息之间的差异，来对预训练推荐模型的参数进行调整，直至达到微调结束条件时，得到针对目标对象所定制化的目标预测模型。
[0145]
需要说明的是，微调结束条件可以是训练迭代次数达到预定的次数，例如10000次，也可以是训练迭代时的准确率达到预定的准确率，例如99.99％等，本技术在此不作限定。
[0146]
可以理解的是，本技术实施例中，无论是将嵌入特征和微调特征进行融合以得到输入特征来进行微调，还是直接基于嵌入特征得到输入特征来进行微调，信息推荐设备都是仅需要保存预训练推荐模型的参数，无需生成并保存微调模型的参数，从而使得模型的参数量较少，这样，模型在计算时所需要消耗的内存资源也会较少。
[0147]
在本技术的一些实施例中，基于对嵌入特征和微调特征的融合进行控制，生成预训练推荐模型的输入特征，即s1032的具体实现过程，可以包括：s1032a-s1032b，如下：
[0148]
s1032a、对嵌入特征进行参数预测，得到控制参数。
[0149]
在一些实施例中，信息推荐设备可以将嵌入特征输入到进行参数预测的模型中，以实现参数预测，得到控制参数；在另一些实施例中，信息推荐设备可以将嵌入特征与不同的控制参数所对应的特征模板进行匹配，以确定出嵌入特征的控制参数。
[0150]
示例性的，图6是本技术实施例提供的预测控制参数的过程示意图。信息推荐设备将嵌入特征6-1(多维特征，包含多个特征分量6-11)输入至用于进行参数预测的模型6-2中，得到各个嵌入特征6-1的控制参数6-3。模型6-2由特征提取层6-21和重参数计算层6-22所组成。
[0151]
需要说明的是，控制参数用于表征嵌入特征和微调特征是否进行特征融合。示例性的，当控制参数为1时，表征嵌入特征和微调特征需要进行融合，当控制参数为0时，则表示嵌入特征和微调特征不需要融合。
[0152]
s1032b、依据控制参数，对微调特征和嵌入特征的融合进行控制，得到预训练模型的输入特征。
[0153]
信息推荐设备在得到控制参数之后，就会依据控制参数所表征的嵌入特征和微调特征是否融合，来针对嵌入特征和微调特征进行相应的操作，从而得到预训练模型的输入特征。
[0154]
本技术实施例中，信息推荐设备可以从嵌入特征中预测出控制参数，然后基于控制参数实现对嵌入特征和微调特征的融合控制，得到输入特征，以便于后续利用输入特征进行微调。
[0155]
在本技术的一些实施例中，依据控制参数，对微调特征和嵌入特征的融合进行控制，得到预训练模型的输入特征，即s1032b的具体实现过程，可以包括：s201或s202，如下：
[0156]
s201、当控制参数表征进行特征融合时，将嵌入特征和微调特征的融合结果，确定
为预训练推荐模型的输入特征。
[0157]
信息推荐设备对控制参数进行解析，明确控制参数表征需要对嵌入特征和微调特征进行融合时，就会通过叠加，或者是拼接的方式，将嵌入特征和微调特征融合为一个特征，该特征就是输入特征。
[0158]
s202、当控制参数表征不进行特征融合时，将嵌入特征确定为预训练模型的预训练推荐模型的输入特征。
[0159]
当信息推荐设备明确控制参数表征的是嵌入特征和微调特征不需要进行特征融合时，就会舍弃微调特征，直接将嵌入特征确定为输入特征。
[0160]
示例性的，基于图6，参见图7，图7是本技术实施例提供的输入特征的生成过程示意图。在嵌入特征6-1输入到模型6-2中，得到控制参数6-3之后，信息推荐设备就会结合控制参数6-3的具体数值，来确定出嵌入特征6-1是否要与微调特征7-1进行融合，从而得到输入特征。当控制参数6-3的数值为1时，信息推荐设备会将嵌入特征6-1和微调特征7-1的融合结果7-2确定为输入特征，而当控制参数6-3的数值为0时，信息推荐设备就会直接将嵌入特征6-1确定为输入特征。如此，就完成了输入特征的生成。
[0161]
本技术实施例中，信息推荐设备会在控制参数表征进行特征融合时，对嵌入特征和微调特征进行融合，得到输入特征，而在控制参数表征不进行特征融合时，直接将嵌入特征作为输入特征。如此，只需要利用预训练模型对融合所得到的输入特征，或者直接是对嵌入特征进行计算，而无需从嵌入特征和微调特征中二选一来前向传输，从而微调特征所对应的参数无需参与计算，也就减少了计算时所需要的参数的数量，节省了内存资源。
[0162]
在本技术的一些实施例中，历史行为信息包括：表征目标对象针对历史关联信息是否进行了转换操作的历史转化信息。此时，依据输入特征和历史行为信息，对预训练推荐模型进行参数调整，直至达到微调结束条件时，得到目标预测模型，即s1033的具体实现过程，可以包括：s1033a-s1033b，如下：
[0163]
s1033a、利用预训练推荐模型，从输入特征中预测出目标对象针对历史关联信息的预测转化结果。
[0164]
信息推荐设备将输入特征输入至预训练推荐模型中，预训练推荐模型的输出，即是针对目标对象所预测出的预测转化结果，从而，预测转化结果表征了目标对象是否会针对历史关联信息发生转化操作。
[0165]
在本技术的一些实施例中，历史关联信息至少包括：目标对象查看过的历史曝光信息和目标对象点击过的历史点击信息。也就是说，信息推荐设备是利用预训练推荐模型，先预测目标对象对历史时期看过的信息，以及目标对象对历史时期点击过的信息是否会进行转化操作。
[0166]
s1033b、依据预测转化结果和历史转化信息之间的差异，对预训练推荐模型进行参数调整，直至达到微调结束条件时，得到推荐预测模型。
[0167]
信息推荐设备分析出预测转化结果，和目标对象对于历史关联信息的真实的转化情况，即历史转化信息之间的差异，然后通过对该差异进行反向传播，以实现对预训练推荐模型的参数调整，从而完成一次迭代，直至达到微调结束条件时，完成针对目标对象的模型定制化，得到目标推荐。
[0168]
本技术实施例中，信息推荐设备可以通过输入特征作为预训练推荐模型的输入将
历史转化信息作为监督项，实现对预训练推荐模型的有监督微调，以使得预训练推荐模型能够充分学习到目标对象的个性特征。
[0169]
在本技术的一些实施例中，基于历史关联信息的特征和目标对象的特征，生成嵌入特征和微调特征，即s1031的具体实现过程，可以包括：s1031a-s1031c，如下：
[0170]
s1031a、对历史关联信息的特征和目标对象的特征进行整合，得到整合稀疏特征。
[0171]
需要说明的是，本技术实施例中，历史关联信息的特征和目标对象的特征均为稀疏特征，信息推荐设备通过拼接，或者是融合，将历史关联信息的特征和目标对象的特征整合为一个特征，该特征就是整合稀疏特征。
[0172]
进一步的，当历史关联信息的特征和目标对象的特征中存在连续值的特征时，信息推荐设备会针对连续值的特征进行离散化，得到离散化的稀疏特征，然后再进行整合，得到整合稀疏特征。
[0173]
s1031b、将整合稀疏特征进行稠密特征的变换，得到嵌入特征。
[0174]
在一些实施例中，信息推荐设备会通过特征变化矩阵对整合稀疏特征进行转换运算，以得到较为稠密的嵌入特征。在另一些实施例中，信息推荐设备会将整合稀疏特征输入至特征提取模型中，得到较为稠密的嵌入特征。
[0175]
s1031c、对嵌入特征进行特征提取，得到微调特征。
[0176]
最后，信息推荐设备可以通过特征抽取模型或下采样，继续对嵌入特征进行特征抽取，所抽取出的结果，就是微调特征。
[0177]
本技术实施例中，信息推荐设备会从历史关联信息的特征和目标对象的特征中，先生成整合稀疏特征，然后再将整合稀疏特征转换为较为稠密的嵌入特征，最后在嵌入特征的基础上抽取出微调特征。如此，信息推荐设备就完成了嵌入特征和微调特征的生成过程，以便于后续基于嵌入特征和微调特征生成输入特征。
[0178]
基于图3，参见图8，图8是本技术实施例提供的信息推荐方法的流程示意图三。在本技术的一些实施例中，针对目标对象，筛选出候选推荐信息，即s102的具体实现过程，可以包括：s1021-s1023，如下：
[0179]
s1021、利用召回模型，从信息库中初步筛选出多个召回信息。
[0180]
s1022、通过粗排模型，对多个召回信息进行排序，得到粗排信息序列。
[0181]
信息推荐设备获取召回模型，利用召回模型对信息库中的各个信息进行分析，以提取出多个召回信息。接着，信息推荐设备会利用获取到的粗排模型，对提取出的多个召回信息再次进行打分，并按照打分结果从高向低，将多个召回信息排成序列，如此，就得到了粗排信息序列。
[0182]
s1023、将粗排信息序列中的前n个信息，确定为候选推荐信息。
[0183]
最后，信息推荐设备将粗排信息序列中分数最高的n个信息提取出来，作为候选推荐信息，其中，n≥1。
[0184]
本技术实施例中，信息推荐设备可以通过召回和粗排，为目标对象确定出候选推荐信息，以便于后续从候选推荐信息中提取出目标推荐信息。
[0185]
在本技术的一些实施例中，兴趣参数包括：预估点击率和预估转化率，此时，基于兴趣参数，从候选推荐信息中筛选出目标推荐信息，即s105的具体实现过程，可以包括：s1051-s1052，如下：
[0186]
s1051、基于预估点击率和预估转化率，计算出预估推荐收益指标。
[0187]
在一些实施例中，信息推荐设备可以将预估点击率和预估转化率相乘，得到预估推荐收益指标。在另一些实施例中，信息推荐设备可以对预估点击率和预估转换率进行加权，得到预估推荐收益指标。
[0188]
需要说明的，预估推荐收益指标表征了目标对象对候选推荐信息进行了转化操作之后所能够带来的收益情况。
[0189]
s1052、将预估推荐收益指标最大的k个候选推荐信息，确定为目标推荐信息。
[0190]
信息推荐设备从计算出的预估推荐收益指标中，筛选出最大的k个预估推荐收益指标，然后对这k个预估推荐收益指标所对应的候选推荐信息进行提取，如此，就得到了目标推荐信息。其中，k≥1。
[0191]
本技术实施例中，信息推荐设备能够基于兴趣参数中所包含的预估点击率和预估转化率，计算出预估推荐收益指标，然后将预估推荐收益指标较大的信息推荐给目标对象，如此，能够确保推荐给目标对象的信息能够带来较为合理的收益。
[0192]
在本技术的一些实施例中，在获取预训练推荐模型之前，即s101之前，该方法还可以包括：s106-s107，如下：
[0193]
s106、获取信息库中的各个信息的操作数据，以及初始推荐模型。
[0194]
需要说明的是，操作数据至少包括曝光数据、点击数据和转化数据。其中，曝光数据是指信息的曝光次数、曝光时间等数据，点击数据是指信息的点击次数、点击时间等数据，转化数据是指信息的转化次数、转化时间等信息。
[0195]
可以理解的是，初始推荐模型可以是通过参数随机初始化所得到的模型，即完全未训练过的模型，也可以是在历史时间内已经训练过的模型，本技术在此不作限定。
[0196]
s107、利用信息库中的各个信息的特征和操作数据，定时对初始推荐模型进行训练，得到预训练推荐模型。
[0197]
在一些实施例中，信息推荐设备利用各个信息的特征作为初始推荐模型的输入，将操作数据作为监督项，定时对初始推荐模型进行有监督的训练，得到预训练推荐模型。在另一些实施例中，信息推荐设备还可以将各个信息的特征和操作数据同时作为输入，对初始推荐模型进行无监督训练，得到预训练推荐模型。
[0198]
本技术实施例中，信息库中的信息是会发生变化的，相对应的操作数据也是会发生变化的，从而，信息推荐设备会利用各个信息的特征和操作数据，定时对初始推荐模型进行训练，相当于对初始训练模型进行定时更新，以确保针对目标对象进行模型定制化时所使用的基础模型总是最新的。
[0199]
在本技术的一些实施例中，通过目标预测模型，预测目标对象针对候选推荐信息的兴趣参数，即s104的具体实现过程，可以包括：s1041-s1043，如下：
[0200]
s1041、对目标对象的特征和候选推荐信息的特征进行转换，得到转换特征，并从转换特征中抽取出调整特征。
[0201]
可以理解的是，本技术实施例中，转换特征的生成过程和嵌入特征的生成过程类似，调整特征的生成过程和微调特征的生成过程类似，在此不再赘述。
[0202]
s1042、针对转换特征和调整特征生成融合参数，并利用融合参数对转换特征和调整特征的融合进行控制，得到待预测特征。
[0203]
信息推荐设备对转换特征进行预测，得到表征是否将转换特征和融合特征进行特征融合的融合参数，同时基于融合参数来对转换特征和融合特征的融合进行控制，以得到待预测特征。
[0204]
示例性的，式(4)是本技术实施例示出的计算待预测特征的过程：
[0205]
embedding
new
＝embedding
old
+p(x)
×
f(embedding
old
)
ꢀꢀꢀ
(4)
[0206]
其中，embedding
old
是转换特征，p(x)是输出的融合参数，f()是隐层变换，f(embedding
old
)是调整特征，embedding
new
是待预测特征。
[0207]
s1043、通过目标预测模型对待预测特征进行预测，预测出目标对象针对候选推荐信息的兴趣参数。
[0208]
最后，信息推荐设备将待预测特征输入到目标预测模型中进行计算，目标预测模型的输出，就是目标对象针对候选推荐信息的兴趣参数。
[0209]
本技术实施例中，信息推荐设备会通过与模型微调时的预测阶段相同的方式，确定出目标对象针对候选推荐信息的兴趣参数，以便于后续利用兴趣参数来为目标对象筛选出目标推荐信息。
[0210]
在本技术的一些实施例中，针对转换特征和调整特征生成融合参数，是通过参数预测模型实现的，对嵌入特征进行参数预测，得到控制参数，是通过初始参数模型实现的，此时，对嵌入特征进行参数预测，得到控制参数之后，针对转换特征和调整特征生成融合参数之前，即在s1032a之后，在s1042之前，该方法还可以包括：s301-s304，如下：
[0211]
s301、针对生成的控制参数，生成服从预设分布的样本值。
[0212]
控制参数的数量是与嵌入特征、微调特征的数量相同的，此时，信息推荐设备会针对每个控制参数，生成一个样本值，从而会得到控制参数的数量个样本值，其中，这些样本值是符合预设分布的。
[0213]
可以理解的是，预设分布可以是指u(0,1)分布，也可以是指高斯分布，还可以是其他类型的分布，本技术在此不作限定。
[0214]
示例性的，信息推荐设备可以针对n个控制参数，生成服从(0,1)分布的独立的样本值∈1,
…
，∈n。
[0215]
s302、依据样本值，计算出控制参数的更新分量。
[0216]
信息推荐设备可以通过对每个样本值进行对数运算，得到每个样本值对应的更新分量，也可以是针对每个样本值的对数运算的结果再次进行对数运算，得到每个样本值的更新分量，本技术在此不作限定。
[0217]
示例性的，式(5)是本技术实施例提供的计算更新分量的公式，如下：
[0218]gi
＝-log(-log(∈i))
ꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(5)
[0219]
其中，∈i是指每个样本值，gi是指每个控制参数所对应的更新分量。
[0220]
s303、将控制参数和更新分量求和，得到更新参数。
[0221]
信息推荐设备将每个控制参数和其所对应的更新分量相加，得到每个控制参数所对应的更新参数。
[0222]
示例性的，当样本值为∈1,
…
,∈n，更新分量为g1,..,gn时，每个控制参数所对应的更新参数，可以表示为v
′
＝[v1+g1,v2+g2,...,vn+gn]。
[0223]
s304、利用更新参数的归一化结果，对初始参数模型进行参数优化，直至满足优化
结束条件时，得到参数预测模型。
[0224]
最后，信息推荐设备会将针对每个更新参数进行归一化计算，以得到给每个更新参数的归一化结果，然后将归一化结果作为损失值，对获取到的初始参数模型进行反向传播计算，以优化初始参数模型中的参数。如此循环迭代，直至达到优化结束条件时停止，得到参数预测模型。
[0225]
示例性的，本技术实施例提供了归一化计算的公式示意，参见式(6)：
[0226][0227]
其中，v
′i表示每个控制参数所对应的更新参数，τ是温度参数，τ越小，温度越低，采样得到的样本就更接近独热(one-hot)向量，σ
τ
(v
′i)是归一化结果。
[0228]
可以理解的是，优化结束条件可以与微调结束条件相同，也可以与微调结束条件不同，本技术在此不作限定。
[0229]
本技术实施例中，信息推荐设备可以通过对每个控制参数计算出更新分量，然后计算出每个控制参数的更新参数，最后基于更新参数的归一化结果来对初始参数模型进行参数优化，如此，即使是在控制参数之间不连续而导致求导困难的情况下，也能够正常对初始参数模型进行训练，得到能够在生成融合参数的参数预测模型。
[0230]
下面，将说明本技术实施例在一个实际的应用场景中的示例性应用。
[0231]
本技术实施例是在针对用户进行广告的个性化推荐的场景下实现的，即当用户打开资讯页面并刷新列表时，广告系统接受广告请求(信息请求)，从广告库中筛选出合适的广告(目标推荐信息)进行展示。当广告展示给用户获知用户对广告进行点击甚至发生下单、激活app等行为(转化行为)时，广告系统会自动对广告主进行扣费。
[0232]
参见图9，图9是本技术实施例提供的广告推送时的数据流程图。在线广告业务场景中，广告平台9-1接收用户(目标对象)发出的广告请求9-2，对该用户针对之前投放给其的广告(历史关联信息)的曝光、点击、转化数据9-3(历史行为信息)，进行特征抽取和标签生成9-4，得到该广告的特征(历史关联信息的特征)，进而得到样本数据，将所得到的样本数据送入到目标域数据库9-5中，结合预训练的源模型9-6(预训练推荐模型)，使用本技术实施例提供的微调方法9-7进行微调，得到目标模型9-8(目标推荐模型)。最终目标模型输出预测结果(目标推荐信息)，返回给用户，以进行广告响应9-9。
[0233]
其中，之前投放过的所有广告(信息库中的各个信息)的曝光、点击和转化数据(操作数据)都会被存储到源数据库中，以用于定时的模型训练。每次重新训练好的模型都会被加载到广告平台的服务器(信息推荐设备)中，以实时为用户进行模型的定制化。
[0234]
在生成样本数据时，服务器会将用户的单个广告点击记录确定为输入样本，将用户是否转换确定为标签。对于用户的每个转化，如果能找到在此转换之前一个给定窗口内的点击，那么该点击被标记为正样本，其他的所有点击被标记为负样本。每个输入样本的特征包括：用户侧特征、广告侧特征和上下文特征，所有的特征都是离散的，对于原本是连续值的特征，将其转换为离散特征。例如对于身高(178至179之间有无数个值)，可以将其离散化，变为离散特征。
[0235]
本技术实施例所提供的微调方法，是利用类似残差的方法去微调特征，从而不需
要保存两套模型参数，可以降低模型的参数量。
[0236]
参见图10，图10是本技术实施例提供的微调时的模型结构图。首先，服务器会对稀疏特征10-1进行预处理，即将稀疏的用户的特征和广告的特征(整合稀疏特征)转换为稠密的固定长度为k维的embedding向量10-2(嵌入特征)，并且在微调的过程中该embedding向量10-2保持不变。接着，服务器对特征进行旁路微调(在模型预训练时并没有这一条旁路，仅在模型微调时增加特征微调旁路)，对embedding向量10-2进行微调。具体是将embedding向量10-2通过dnn隐层变换，得到微调特征10-3，然后门控网络(初始参数模型)会输出针对embedding向量10-2和微调特征10-3的一个0/1决策，1是该旁路断开，原embedding向量10-2加上微调特征10-3成为新的embedding特征；0是该旁路断开，新的embedding特征就是原始的embedding向量10-2，如此，就能够得到稠密向量生成层10-4的输入10-5(输入特征)。接着服务器将输入10-5向前传递，以经过dnn层10-6，并将最终得到的特征通过输出层的softmax函数得到一个逻辑值，表明用户对该商品的意向分10-7(预测转化结果)，然后结合标签(历史转化信息)开始反向传播，完成微调。
[0237]
其中，门控网络是一个轻量级的网络，其输入是稀疏特征预处理之后的原始embedding向量，输出包含n个0/1的二值向量，n是特征的个数或分量的个数，用于控制每一个特征或分量的特征微调旁路是否需要更新。这里涉及了策略网络输出离散值不可导的问题，此时，可以利用gumbel-softmax技巧去解决不可导的问题。
[0238]
稠密向量生成层是对所有的n个输入两两做内积，得到(n-1)n/2个k维的embedding，然后通过叠加的方式生成一个k维稠密向量，作为dnn层的输入。dnn层构建出的多层全连接神经网络模型。输出层是对dnn层中加工出的特征通过softmax函数得到一个逻辑值。
[0239]
在微调过程中，除了原始embedding向量是不变的，门控网络和其他网络参数一起学习(对初始参数模型进行参数优化，直至达到优化结束条件时，得到参数预测模型)。这里针对门控网络的输出不连续所导致的求导困难的问题，本技术实施例使用gumbel-softmax技巧来进行求解。gumbel-softmax技巧的核心思想是重参数技巧(reparameterization trick)。深度学习中，经常会使用神经网络a生成一个概率分布，这个概率分布一般是事先规定好的，神经网络只需要生成这个分布的统计参数d即可。接下来，会从这个概率分布里面采样得到一个样本s，然后再把这个样本输入到后续的神经网络b里面处理，并且计算得到一个可到的损失函数l。但是由于这个采样步骤的存在，没有办法做到端到端的训练，从而可以得到l关于s的导数，也可以得到d关于a的参数的导数，但是一般来说无法得到s关于d的导数。要得到s关于d的导数就需要使用参数重定向方法。该方法过程计算过程如下：
[0240]
1、针对门控网络输出的一个n维向量v(包含了每个控制参数)，生成n个服从均匀分布u(0,1)的∈1,..,∈n；
[0241]
2、通过式(4)计算得到gi；
[0242]
3、对应相加得到新的值向量(包含每个控制参数的更新参数)；
[0243]
4、通过式(6)计算出的函数进行归一化，计算概率大小并得到最终的类别。
[0244]
在线上预测过程中，服务器会每隔一小时训练一个新模型(定时对初始推荐模型进行训练，得到预训练推荐模型)并向线上推送。具体的流程为：
[0245]
1、请求方，即用户发出广告请求，召回和粗排模型对广告进行初步筛选之后返回
给精排系统一个广告集合(候选推荐信息)。
[0246]
2、精排系统查询用户侧和广告侧特征，经过预处理后输入图10所示的网络结构，计算pctr(预估点击率)和pcvr(预估转化率)。
[0247]
3、通过(2)计算出的pctr和pcvr值计算ecpm(预估推荐收益指标)，对集合中的所有广告进行排序，选择topk(最大的k个候选推荐信息作为目标推荐信息)进行曝光。
[0248]
为了验证本技术实施例中的广告推荐的效果，在广告推荐常用的criteo广告点击数据集和movielens电影评分数据集上进行实验。预训练模型采用nf m和deepfm模型，在criteo广告点击数据集上的任务是预测用户是否点击该广告，评价指标是测试集的曲线下面积(area under curve，auc)。在movi elens电影评分数据集上的任务是预测用户给电影的评分，属于回归任务，评价指标是测试集的均分损失(mean square error，mse)。
[0249]
参见图11，图11是本技术实施例提供的auc对比示意图。在criteo广告点击数据集中使用nfm预训练模型，由图11可见(横轴是迭代周期epochs，纵轴是auc)，传统的微调方法的auc是0.7438，本技术实施例的auc是0.7569，提高了0.0131。
[0250]
图12是本技术实施例提供的mse对比示意图。在movielens电影评分数据集中使用的是deepfm预训练模型，由图12可见(横轴是迭代周期epochs，纵轴是mse)，传统的微调方法的mse是0.9049，本技术实施例的mse是0.8941，误差率降低了0.0108。
[0251]
通过上述方法，能够提高针对用户推荐广告的准确率，同时在微调模型时利用门控网络生成门控稀疏来确定是否进行特征融合，从而不需要保存两套模型参数，可以降低模型的参数量，并且在线上实时为用户定制化模型，无需线下训练并存储不同用户的模型，从而节省了线下的存储资源。
[0252]
可以理解的是，在本技术实施例中，涉及到用户特征、用户针对广告的点击、曝光和转化数据等相关的数据，当本技术实施例运用到具体产品或技术中时，需要获得用户许可或者同意，且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
[0253]
下面继续说明本技术实施例提供的信息推荐装置255的实施为软件模块的示例性结构，在一些实施例中，如图2所示，存储在存储器250的信息推荐装置255中的软件模块可以包括：
[0254]
信息获取模块2551，用于响应于目标对象的信息请求，获取预训练推荐模型、所述目标对象的历史关联信息，以及所述目标对象对于所述历史关联信息的历史行为信息；
[0255]
信息筛选模块2552，用于针对所述目标对象，筛选出候选推荐信息；
[0256]
模型微调模块2553，用于基于所述历史关联信息的特征、所述目标对象的特征以及所述历史行为信息，对所述预训练推荐模型进行微调，得到所述目标对象对应的目标预测模型；
[0257]
参数预测模块2554，用于通过所述目标预测模型，预测所述目标对象针对所述候选推荐信息的兴趣参数；
[0258]
所述信息筛选模块2552，还用于基于所述兴趣参数，从所述候选推荐信息中筛选出目标推荐信息，并将所述目标推荐信息返回给所述目标对象。
[0259]
在本技术的一些实施例中，所述模型微调模块2553，还用于基于所述历史关联信息的特征和所述目标对象的特征，生成嵌入特征和微调特征；基于对所述嵌入特征和所述
微调特征的融合进行控制，生成所述预训练推荐模型的输入特征；依据所述输入特征和所述历史行为信息，对所述预训练推荐模型进行参数调整，直至达到微调结束条件时，得到所述目标预测模型。
[0260]
在本技术的一些实施例中，所述模型微调模块2553，还用于对所述嵌入特征进行参数预测，得到控制参数；所述控制参数用于表征所述嵌入特征和所述微调特征是否进行特征融合；依据所述控制参数，对所述微调特征和所述嵌入特征的融合进行控制，得到所述预训练推荐模型的所述输入特征。
[0261]
在本技术的一些实施例中，所述模型微调模块2553，还用于当所述控制参数表征进行特征融合时，将所述嵌入特征和所述微调特征的融合结果，确定为所述预训练推荐模型的所述输入特征；当所述控制参数表征不进行特征融合时，将所述嵌入特征确定为所述预训练推荐模型的所述输入特征。
[0262]
在本技术的一些实施例中，所述历史行为信息包括：表征所述目标对象针对所述历史关联信息是否进行了转换操作的历史转化信息；所述模型微调模块2553，还用于利用所述预训练推荐模型，从所述输入特征中预测出所述目标对象针对所述历史关联信息的预测转化结果；依据所述预测转化结果和所述历史转化信息之间的差异，对所述预训练推荐模型进行参数调整，直至达到所述微调结束条件时，得到所述目标预测模型。
[0263]
在本技术的一些实施例中，所述模型微调模块2553，还用于对所述历史关联信息的特征和所述目标对象的特征进行整合，得到整合稀疏特征；将所述整合稀疏特征进行稠密特征的变换，得到所述嵌入特征；对所述嵌入特征进行特征提取，得到所述微调特征。
[0264]
在本技术的一些实施例中，所述信息筛选模块2552，还用于利用召回模型，从信息库中初步筛选出多个召回信息；通过粗排模型，对多个所述召回信息进行排序，得到粗排信息序列；将所述粗排信息序列中的前n个信息，确定为所述候选推荐信息；n≥1。
[0265]
在本技术的一些实施例中，所述兴趣参数包括：预估点击率和预估转化率；所述信息筛选模块2552，还用于基于所述预估点击率和所述预估转化率，计算出预估推荐收益指标；将所述预估推荐收益指标最大的k个候选推荐信息，确定为所述目标推荐信息；其中，k≥1。
[0266]
在本技术的一些实施例中，所述信息推荐装置255还包括：模型训练模块2555；所述模型训练模块2555，用于获取信息库中的各个信息的操作数据，以及初始推荐模型；其中，所述操作数据至少包括曝光数据、点击数据和转化数据；利用所述信息库中的所述各个信息的特征和所述操作数据，定时对所述初始推荐模型进行训练，得到所述预训练推荐模型。
[0267]
在本技术的一些实施例中，所述参数预测模块2554，还用于对所述目标对象的特征和所述候选推荐信息的特征进行转换，得到转换特征，并从所述转换特征中抽取出调整特征；针对所述转换特征和所述调整特征生成融合参数，并利用所述融合参数对所述转换特征和所述调整特征的融合进行控制，得到待预测特征；通过所述目标预测模型对所述待预测特征进行预测，预测出所述目标对象针对所述候选推荐信息的所述兴趣参数。
[0268]
在本技术的一些实施例中，所述针对所述转换特征和所述调整特征生成融合参数，是通过参数预测模型实现的，所述对所述嵌入特征进行参数预测，得到控制参数，是通过初始参数模型实现的；
[0269]
所述模型训练模块2555，还用于针对生成的所述控制参数，生成服从预设分布的样本值；依据所述样本值，计算出所述控制参数的更新分量；将所述控制参数和所述更新分量求和，得到所述更新参数；利用所述更新参数的归一化结果，对所述初始参数模型进行参数优化，直至达到优化结束条件时，得到所述参数预测模型。
[0270]
本技术实施例提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行本技术实施例上述的信息推荐方法。
[0271]
本技术实施例提供一种存储有可执行指令的计算机可读存储介质，其中存储有可执行指令，当可执行指令被处理器执行时，将引起处理器执行本技术实施例提供的信息推荐方法，例如，如图3示出的信息推荐方法。
[0272]
在一些实施例中，计算机可读存储介质可以是fram、rom、prom、ep rom、eeprom、闪存、磁表面存储器、光盘、或cd-rom等存储器；也可以是包括上述存储器之一或任意组合的各种设备。
[0273]
在一些实施例中，可执行指令可以采用程序、软件、软件模块、脚本或代码的形式，按任意形式的编程语言(包括编译或解释语言，或者声明性或过程性语言)来编写，并且其可按任意形式部署，包括被部署为独立的程序或者被部署为模块、组件、子例程或者适合在计算环境中使用的其它单元。
[0274]
作为示例，可执行指令可以但不一定对应于文件系统中的文件，可以可被存储在保存其它程序或数据的文件的一部分，例如，存储在超文本标记语言(html，hyper text markup language)文档中的一个或多个脚本中，存储在专用于所讨论的程序的单个文件中，或者，存储在多个协同文件(例如，存储一个或多个模块、子程序或代码部分的文件)中。
[0275]
作为示例，可执行指令可被部署为在一个计算设备(信息推荐设备)上执行，或者在位于一个地点的多个计算设备上执行，又或者，在分布在多个地点且通过通信网络互连的多个计算设备上执行。
[0276]
综上所述，通过本技术实施例，信息推荐设备是在接收到目标对象的信息请求时，在已经学习了用户的共性特征的预训练推荐模型的基础上，利用目标对象的特征、目标对象的历史关联信息的特征以及历史行为信息进行微调，以得到学习了目标对象的个性特征的目标预测模型，实现对目标对象进行模型的定制化，最后利用目标预测模型更加准确地预测出目标对象针对候选推荐信息的兴趣参数，利用兴趣参数筛选出符合目标对象的喜好的目标推荐信息，最终使得信息推荐的准确度得以提高；在接收到目标对象的请求时才开始模型微调过程，即在线上实时进行微调，从而，无需在线下针对不同的用户各自训练出适配的模型并存储，从而，还能够节省存储资源；信息推荐设备仅需要保存预训练推荐模型的参数，而无需生成并保存微调模型的参数，从而使得模型的参数量较少，这样，模型在计算时所需要消耗的内存资源也会较少。
[0277]
以上所述，仅为本技术的实施例而已，并非用于限定本技术的保护范围。凡在本技术的精神和范围之内所作的任何修改、等同替换和改进等，均包含在本技术的保护范围之内。

技术特征：
1.一种信息推荐方法，其特征在于，所述信息推荐方法包括：响应于目标对象的信息请求，获取预训练推荐模型、所述目标对象的历史关联信息，以及所述目标对象对于所述历史关联信息的历史行为信息；针对所述目标对象，筛选出候选推荐信息；基于所述历史关联信息的特征、所述目标对象的特征以及所述历史行为信息，对所述预训练推荐模型进行微调，得到所述目标对象对应的目标预测模型；通过所述目标预测模型，预测所述目标对象针对所述候选推荐信息的兴趣参数；基于所述兴趣参数，从所述候选推荐信息中筛选出目标推荐信息，并将所述目标推荐信息返回给所述目标对象。2.根据权利要求1所述的方法，其特征在于，所述基于所述历史关联信息的特征、所述目标对象的特征以及所述历史行为信息，对所述预训练推荐模型进行微调，得到所述目标对象对应的目标预测模型，包括：基于所述历史关联信息的特征和所述目标对象的特征，生成嵌入特征和微调特征；基于对所述嵌入特征和所述微调特征的融合进行控制，生成所述预训练推荐模型的输入特征；依据所述输入特征和所述历史行为信息，对所述预训练推荐模型进行参数调整，直至达到微调结束条件时，得到所述目标预测模型。3.根据权利要求2所述的方法，其特征在于，所述基于对所述嵌入特征和所述微调特征的融合进行控制，生成所述预训练推荐模型的输入特征，包括：对所述嵌入特征进行参数预测，得到控制参数；所述控制参数用于表征所述嵌入特征和所述微调特征是否进行特征融合；依据所述控制参数，对所述微调特征和所述嵌入特征的融合进行控制，得到所述预训练推荐模型的所述输入特征。4.根据权利要求3所述的方法，其特征在于，所述依据所述控制参数，对所述微调特征和所述嵌入特征的融合进行控制，得到所述预训练推荐模型的所述输入特征，包括：当所述控制参数表征进行特征融合时，将所述嵌入特征和所述微调特征的融合结果，确定为所述预训练推荐模型的所述输入特征；当所述控制参数表征不进行特征融合时，将所述嵌入特征确定为所述预训练推荐模型的所述输入特征。5.根据权利要求2至4任一项所述的方法，其特征在于，所述历史行为信息包括：表征所述目标对象针对所述历史关联信息是否进行了转换操作的历史转化信息；所述依据所述输入特征和所述历史行为信息，对所述预训练推荐模型进行参数调整，直至达到微调结束条件时，得到所述目标预测模型，包括：利用所述预训练推荐模型，从所述输入特征中预测出所述目标对象针对所述历史关联信息的预测转化结果；依据所述预测转化结果和所述历史转化信息之间的差异，对所述预训练推荐模型进行参数调整，直至达到所述微调结束条件时，得到所述目标预测模型。6.根据权利要求5所述的方法，其特征在于，所述历史关联信息至少包括：所述目标对象查看过的历史曝光信息和所述目标对象点击过的历史点击信息。
7.根据权利要求2至4任一项所述的方法，其特征在于，所述基于所述历史关联信息的特征和所述目标对象的特征，生成嵌入特征和微调特征，包括：对所述历史关联信息的特征和所述目标对象的特征进行整合，得到整合稀疏特征；将所述整合稀疏特征进行稠密特征的变换，得到所述嵌入特征；对所述嵌入特征进行特征提取，得到所述微调特征。8.根据权利要求1至4任一项所述的方法，其特征在于，所述针对所述目标对象，筛选出候选推荐信息，包括：利用召回模型，从信息库中初步筛选出多个召回信息；通过粗排模型，对多个所述召回信息进行排序，得到粗排信息序列；将所述粗排信息序列中的前n个信息，确定为所述候选推荐信息；n≥1。9.根据权利要求1至4任一项所述的方法，其特征在于，所述兴趣参数包括：预估点击率和预估转化率；所述基于所述兴趣参数，从所述候选推荐信息中筛选出目标推荐信息，包括：基于所述预估点击率和所述预估转化率，计算出预估推荐收益指标；将所述预估推荐收益指标最大的k个候选推荐信息，确定为所述目标推荐信息；其中，k≥1。10.根据权利要求1至4任一项所述的方法，其特征在于，所述获取预训练推荐模型之前，所述方法还包括：获取信息库中的各个信息的操作数据，以及初始推荐模型；其中，所述操作数据至少包括曝光数据、点击数据和转化数据；利用所述信息库中的所述各个信息的特征和所述操作数据，定时对所述初始推荐模型进行训练，得到所述预训练推荐模型。11.根据权利要求3或4所述的方法，其特征在于，所述通过所述目标预测模型，预测所述目标对象针对所述候选推荐信息的兴趣参数，包括：对所述目标对象的特征和所述候选推荐信息的特征进行转换，得到转换特征，并从所述转换特征中抽取出调整特征；针对所述转换特征和所述调整特征生成融合参数，并利用所述融合参数对所述转换特征和所述调整特征的融合进行控制，得到待预测特征；通过所述目标预测模型对所述待预测特征进行预测，预测出所述目标对象针对所述候选推荐信息的所述兴趣参数。12.根据权利要求11所述的方法，其特征在于，所述针对所述转换特征和所述调整特征生成融合参数，是通过参数预测模型实现的，所述对所述嵌入特征进行参数预测，得到控制参数，是通过初始参数模型实现的；所述对所述嵌入特征进行参数预测，得到控制参数之后，所述针对所述转换特征和所述调整特征生成融合参数之前，所述方法还包括：针对生成的所述控制参数，生成服从预设分布的样本值；依据所述样本值，计算出所述控制参数的更新分量；将所述控制参数和所述更新分量求和，得到所述更新参数；利用所述更新参数的归一化结果，对所述初始参数模型进行参数优化，直至达到优化
结束条件时，得到所述参数预测模型。13.一种信息推荐装置，其特征在于，所述信息推荐装置包括：信息获取模块，用于响应于目标对象的信息请求，获取预训练推荐模型、所述目标对象的历史关联信息，以及所述目标对象对于所述历史关联信息的历史行为信息；信息筛选模块，用于针对所述目标对象，筛选出候选推荐信息；模型微调模块，用于基于所述历史关联信息的特征、所述目标对象的特征以及所述历史行为信息，对所述预训练推荐模型进行微调，得到所述目标对象对应的目标预测模型；参数预测模块，用于通过所述目标预测模型，预测所述目标对象针对所述候选推荐信息的兴趣参数；所述信息筛选模块，还用于基于所述兴趣参数，从所述候选推荐信息中筛选出目标推荐信息，并将所述目标推荐信息返回给所述目标对象。14.一种信息推荐设备，其特征在于，所述信息推荐设备包括：存储器，用于存储可执行指令；处理器，用于执行所述存储器中存储的可执行指令时，实现权利要求1至12任一项所述的信息推荐方法。15.一种计算机可读存储介质，存储有可执行指令，其特征在于，所述可执行指令被处理器执行时实现权利要求1至12任一项所述的信息推荐方法。16.一种计算机程序产品，包括计算机程序或指令，其特征在于，所述计算机程序或指令被处理器执行时实现权利要求1至12任一项所述的信息推荐方法。

技术总结
本申请提供了一种信息推荐方法、装置、设备及存储介质、程序产品；本申请实施例可以应用于云技术、人工智能、智慧交通、车载等各种场景，涉及人工智能技术；该方法包括：响应于目标对象的信息请求，获取预训练推荐模型、目标对象的历史关联信息，以及目标对象对于历史关联信息的历史行为信息；针对目标对象，筛选出候选推荐信息；基于历史关联信息的特征、目标对象的特征以及历史行为信息，对预训练推荐模型进行微调，得到目标对象对应的目标预测模型；通过目标预测模型，预测目标对象针对候选推荐信息的兴趣参数；基于兴趣参数，从候选推荐信息中筛选出目标推荐信息，并将目标推荐信息返回给目标对象。通过本申请，能够提高信息推荐的准确度。的准确度。的准确度。

技术研发人员：邵哲蒋挺宇潘军伟张凌寒陈细华刘大鹏
受保护的技术使用者：腾讯科技（深圳）有限公司
技术研发日：2022.01.05
技术公布日：2023/7/20

版权声明

本文仅代表作者观点，不代表航空之家立场。
本文系作者授权航家号发表，未经原创作者书面授权，任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时，须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的，航空之家将依法追究其法律责任。（航空之家官方QQ：2926969996）

飞行汽车 https://www.autovtol.com/

上一篇：异位联合表达Atoh1和Tbx2基因促进内毛细胞再生及其应用 下一篇：通过硝酸磷肥装置联产磷酸的方法、产品及系统与流程

一种信息推荐方法、装置、设备及存储介质、程序产品与流程

版权声明

航空之家

相关推荐

文章排行

最近发表

标签列表

一种信息推荐方法、装置、设备及存储介质、程序产品与流程

版权声明

相关文章

航空之家

相关推荐

文章排行

最近发表

标签列表