一种长短期兴趣提取的个性化会话推荐方法
未命名
09-18
阅读:144
评论:0
1.本公开涉及会话推荐领域,且更为具体地,涉及一种长短期兴趣提取的个性化会话推荐方法。
背景技术:
2.随着互联网的发展和移动设备的广泛应用,人们的信息获取和消费方式发生了巨大变化。在这个信息爆炸的时代,用户面临着海量的信息和选择,如何在短时间内找到符合自己需求的内容成为了一个重要的问题。因此,推荐系统逐渐成为了电商、社交等领域中不可或缺的一部分。
3.然而,传统的推荐算法在面对用户的兴趣变化时存在一定的局限性。例如,基于用户最近行为的短期兴趣模型容易受到噪声和偶然性的影响,难以准确地反映用户的兴趣。因此,期待一种优化的推荐方案。
技术实现要素:
4.有鉴于此,本公开提出了一种长短期兴趣提取的个性化会话推荐方法,可以利用基于深度学习的自然语言处理技术,并结合用户的个性化信息和会话序列数据来优化个性化推荐方案,并在一定程度上克服传统推荐算法在面对用户兴趣变化时的局限性。
5.根据本公开的一方面,提供了一种长短期兴趣提取的个性化会话推荐方法,其包括:获取用户的个性化信息以及所述用户的会话序列;基于深度卷积神经网络模型对所述用户的个性化信息以及所述用户的会话序列进行特征提取与特征关联以得到融合特征向量;以及基于所述融合特征向量,确定推荐物品。
6.根据本公开的实施例,其首先获取用户的个性化信息以及所述用户的会话序列,接着,基于深度卷积神经网络模型对所述用户的个性化信息以及所述用户的会话序列进行特征提取与特征关联以得到融合特征向量,然后,基于所述融合特征向量,确定推荐物品。这样,可以在一定程度上克服传统推荐算法在面对用户兴趣变化时的局限性。
7.根据下面参考附图对示例性实施例的详细说明,本公开的其它特征及方面将变得清楚。
附图说明
8.包含在说明书中并且构成说明书的一部分的附图与说明书一起示出了本公开的示例性实施例、特征和方面,并且用于解释本公开的原理。
9.图1示出根据本公开的实施例的长短期兴趣提取的个性化会话推荐方法的流程图。
10.图2示出根据本公开的实施例的长短期兴趣提取的个性化会话推荐方法的架构示意图。
11.图3示出根据本公开的实施例的长短期兴趣提取的个性化会话推荐方法的子步骤
s120的流程图。
12.图4示出根据本公开的实施例的长短期兴趣提取的个性化会话推荐方法的子步骤s121的流程图。
13.图5示出根据本公开的实施例的长短期兴趣提取的个性化会话推荐系统的框图。
14.图6示出根据本公开的实施例的长短期兴趣提取的个性化会话推荐方法的应用场景图。
15.图7示出了根据本公开的另一实施例的rnn结构示意图。
16.图8示出了根据本公开的另一实施例的lstm结构示意图。
17.图9示出了根据本公开的另一实施例的gur网络结构示意图。
18.图10示出了根据本公开的另一实施例的普通注意力机制示意图。
19.图11示出了根据本公开的另一实施例的自注意力机制示意图。
20.图12示出了根据本公开的另一实施例的会话推荐模型性能对比图。
具体实施方式
21.下面将结合附图对本公开实施例中的技术方案进行清楚、完整地描述,显而易见地,所描述的实施例仅仅是本公开的部分实施例,而不是全部的实施例。基于本公开实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,也属于本公开保护的范围。
22.如本公开和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法或者设备也可能包含其他的步骤或元素。
23.以下将参考附图详细说明本公开的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面,但是除非特别指出,不必按比例绘制附图。
24.另外,为了更好的说明本公开,在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解,没有某些具体细节,本公开同样可以实施。在一些实例中,对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述,以便于凸显本公开的主旨。
25.针对上述技术问题,本技术的技术构思为利用基于深度学习的自然语言处理技术,并结合用户的个性化信息和会话序列数据来优化个性化推荐方案,并在一定程度上克服传统推荐算法在面对用户兴趣变化时的局限性。
26.图1示出根据本公开的实施例的长短期兴趣提取的个性化会话推荐方法的流程图。图2示出根据本公开的实施例的长短期兴趣提取的个性化会话推荐方法的架构示意图。如图1和图2所示,根据本公开实施例的长短期兴趣提取的个性化会话推荐方法,包括步骤:s110,获取用户的个性化信息以及所述用户的会话序列;s120,基于深度卷积神经网络模型对所述用户的个性化信息以及所述用户的会话序列进行特征提取与特征关联以得到融合特征向量;以及,s130,基于所述融合特征向量,确定推荐物品。
27.更具体地,在步骤s110中,获取用户的个性化信息以及所述用户的会话序列。其中,用户的个性化信息包括用户的个人信息、历史行为、兴趣爱好等。而会话序列则是用户
在特定时间段内的行为轨迹,可以反映其在特定时间段内的兴趣倾向和物品偏好。值得一提的是,个性化信息可以通过用户的注册信息、社交媒体等公开数据源获取,而会话序列数据则需要通过用户在网站或客户端上的行为记录来收集。需要说明的是,获取用户的个性化信息和会话序列是一个复杂的过程,其中很多细节需要依赖具体的应用场景和业务需求来进行处理和优化。
28.更具体地,在步骤s120中,基于深度卷积神经网络模型对所述用户的个性化信息以及所述用户的会话序列进行特征提取与特征关联以得到融合特征向量。相应地,在一种可能的实现方式中,如图3所示,基于深度卷积神经网络模型对所述用户的个性化信息以及所述用户的会话序列进行特征提取与特征关联以得到融合特征向量,包括:s121,对所述会话序列进行语义分析与理解以得到用户点击行为语义理解特征向量;s122,对所述用户的个性化信息进行语义分析与理解以得到用户个性化信息语义理解特征向量;以及,s123,融合所述用户点击行为语义理解特征向量和所述用户个性化信息语义理解特征向量以得到所述融合特征向量。
29.应可以理解,深度卷积神经网络(deep convolutional neural network,dcnn)是一种基于卷积神经网络(convolutional neural network,cnn)的深度学习模型。深度卷积神经网络在图像识别、语音识别、自然语言处理等领域有着广泛的应用,尤其在计算机视觉领域中,dcnn已经成为了图像识别、目标检测、图像分割等任务的主流模型。深度卷积神经网络的主要特点是利用卷积层和池化层来提取图像的特征。在卷积层中,网络通过卷积核对输入的图像进行卷积操作,从而提取出图像中的特征。在池化层中,网络通过对卷积后的特征图进行降采样操作,从而减少特征图的大小,提高模型的计算效率。深度卷积神经网络的深度可以通过增加卷积层和池化层的数量来实现。随着深度的增加,深度卷积神经网络可以学习到更加复杂的特征,从而提高模型的性能。
30.相应地,在一种可能的实现方式中,如图4所示,对所述会话序列进行语义分析与理解以得到用户点击行为语义理解特征向量,包括:s1211,基于所述会话序列生成用户点击的物品嵌入向量的序列;以及,s1212,将所述用户点击的物品嵌入向量的序列通过双向长短期记忆神经网络模型以得到用户点击行为语义理解特征向量。应当可以理解,当用户与推荐系统进行交互时,记录下来的会话序列中包含了用户在特定时间段内的行为信息,比如,用户浏览的物品、点击的物品、购买的物品等等。在本技术的技术方案中,期待利用所述会话序列来生成用户点击的物品嵌入向量的序列。这里,物品嵌入向量是一个低维、密集、连续的向量表示,每一个物品嵌入向量都能够代表一个物品。通过这样的方式,将用户在不同时刻点击过的物品信息在向量空间中表示出来。并且,考虑到用户点击行为包含着一定的语义信息。点击某个物品可以反映出用户对于该物品的兴趣和喜好,而用户点击的物品又是通过推荐系统展示给用户的,因此点击行为也包括一定的上下文信息。在本技术的技术方案中,将所述用户点击的物品嵌入向量的序列通过双向长短期记忆神经网络模型以得到用户点击行为语义理解特征向量。其中,双向长短期记忆神经网络模型(bi-lstm)是由长短期记忆神经网络模型(lstm)变化而来。与lstm不同的是,bi-lstm能够同时向前和向后处理序列数据,从而更容易捕捉到数据序列中的关系和依赖关系。在本场景中,使用双向lstm可以用来捕捉用户点击序列中的中距离依赖性和顺序性,并从中提取出用户兴趣爱好和行为特征。
31.相应地,在一种可能的实现方式中,对所述用户的个性化信息进行语义分析与理解以得到用户个性化信息语义理解特征向量,包括:对所述用户的个性化信息进行分词处理后通过基于gru的语义编码器以得到所述用户个性化信息语义理解特征向量。同样地,用户的个性化信息也包含了很多潜在的语义信息。在本技术的技术方案中,对所述用户的个性化信息进行分词处理后通过基于gru的语义编码器以得到用户个性化信息语义理解特征向量。这里,分词操作可以将个性化信息转化为一个词汇序列。也就是,将一段文本信息转化为离散的词汇,以便进行下一步的分析和建模。其次,利用基于gru的语义编码器对用户的个性化信息进行深入地语义分析和理解。具体而言,gru通常用于处理序列信息。gru是lstm 的一个变体,gru将遗忘门和输入门合并成一个更新门,以便简化模型,并提高训练速度和效率。与 lstm 类似,gru有一个隐藏层,可以记忆和更新之前的信息。gru采用一些称为重置门和更新门的门控机制来实现这一点。重置门通过考虑前一状态和当前输入来决定哪些信息在当前状态中应该被忽略,而更新门通过集成前一状态和当前输入的信息来计算当前状态的输出。gru的性能往往比lstm更快且模型大小更小。在本应用场景中,通过使用基于gru的语义编码器,可以对用户个性化信息序列进行编码,逐步提取出其中的语义信息和关联性。
32.在推荐系统中,用户点击行为语义理解特征向量和用户个性化信息语义理解特征向量都是非常重要的特征。前者可以反映用户的历史行为和偏好,后者则可以反映用户的个性化信息和喜好。因此,在本技术的技术方案中,进一步地融合所述用户点击行为语义理解特征向量和所述用户个性化信息语义理解特征向量以更全面的建立用户画像,从而得到融合特征向量。
33.在本技术的技术方案中,在融合所述用户点击行为语义理解特征向量和所述用户个性化信息语义理解特征向量得到所述融合特征向量时,考虑到所述用户点击行为语义理解特征向量和所述用户个性化信息语义理解特征向量分别表达所述用户点击的物品嵌入向量的序列和所述用户的个性化信息的基于分词的语义关联特征,因此其都具有基于局部片段语义的序列化分布属性。因此,为了提升所述用户点击行为语义理解特征向量和所述用户个性化信息语义理解特征向量的融合效果,本技术的申请人对所述用户点击行为语义理解特征向量,例如记为及所述用户个性化信息语义理解特征向量,例如记为进行局部序列语义的片段式富化融合,以获得所述融合特征向量,例如记为。
34.相应地,在一种可能的实现方式中,融合所述用户点击行为语义理解特征向量和所述用户个性化信息语义理解特征向量以得到所述融合特征向量,包括:以如下融合公式对所述用户点击行为语义理解特征向量及所述用户个性化信息语义理解特征向量进行局部序列语义的片段式富化融合以获得所述融合特征向量;其中,所述融合公式为:其中,为所述用户点击行为语义理解特征向量,为所述用户个性化信息语义理解特征向量,为所述用户个性化信息语义理解特征向量的转置向量,和均为列向量,为所述用户点击行为语义理解特征向量和所述用户个性化信息语义理解特征向量之间的距离矩阵,即,且是权重超参数,
和分别表示向量乘法和向量加法,为所述融合特征向量。
35.这里,所述局部序列语义的片段式富化融合基于序列的片段特征分布对序列的预定分布方向上的方向性语义的编码效果,来以序列片段之间的相似性嵌入作为用于序列间关联的重加权因数,从而对序列之间在各个片段级别的基于特征表象(feature appearance)的相似性进行捕获,实现了所述用户点击行为语义理解特征向量和所述用户个性化信息语义理解特征向量的局部片段级语义的富化式融合,从而提升了所述融合特征向量对所述用户点击行为语义理解特征向量和所述用户个性化信息语义理解特征向量的融合效果。
36.更具体地,在步骤s130中,基于所述融合特征向量,确定推荐物品。相应地,在一种可能的实现方式中,基于所述融合特征向量,确定推荐物品,包括:将所述融合特征向量通过分类器以得到分类结果,所述分类结果用于表示推荐物品的标签。也就是,利用分类器的软最大值函数来进行分类处理,从而得到分类结果。具体而言,将物品的标签作为分类结果,方便在实际应用中进行推荐结果的解释和展示。通过这样的方式来智能化地实现对用户偏好的推断,从而为用户进行更加准确和精准的推荐服务。
37.应可以理解,分类器的作用是利用给定的类别、已知的训练数据来学习分类规则和分类器,然后对未知数据进行分类(或预测)。逻辑回归(logistics)、svm等常用于解决二分类问题,对于多分类问题(multi-class classification),同样也可以用逻辑回归或svm,只是需要多个二分类来组成多分类,但这样容易出错且效率不高,常用的多分类方法有softmax分类函数。换言之,分类器是一种机器学习模型,用于将数据分为不同的类别。分类器是一种监督学习算法,需要使用带有标签的训练数据来训练模型,以便能够对新的未标记数据进行分类。分类器的输入通常是一组特征向量,而输出则是一个或多个类别标签。分类器的训练过程通常包括以下步骤:特征提取,从原始数据中提取有用的特征向量;特征选择,选择最相关的特征向量,以提高分类器的准确性和效率;训练模型,使用带有标签的训练数据来训练分类器模型;评估模型,使用测试数据来评估分类器的准确性和效率。常见的分类器算法包括决策树、朴素贝叶斯、支持向量机、逻辑回归、神经网络等。
38.相应地,在一种可能的实现方式中,将所述融合特征向量通过分类器以得到分类结果,所述分类结果用于表示推荐物品的标签,包括:使用所述分类器的全连接层对所述融合特征向量进行全连接编码以得到编码分类特征向量;以及,将所述编码分类特征向量输入所述分类器的softmax分类函数以得到所述分类结果。
39.综上,基于本公开实施例的长短期兴趣提取的个性化会话推荐方法,其可以利用基于深度学习的自然语言处理技术,并结合用户的个性化信息和会话序列数据来优化个性化推荐方案,并在一定程度上克服传统推荐算法在面对用户兴趣变化时的局限性。
40.图5示出根据本公开的实施例的长短期兴趣提取的个性化会话推荐系统100的框图。如图5所示,根据本公开实施例的长短期兴趣提取的个性化会话推荐系统100,包括:数据获取模块110,用于获取用户的个性化信息以及所述用户的会话序列;特征提取与特征关联模块120,用于基于深度卷积神经网络模型对所述用户的个性化信息以及所述用户的会话序列进行特征提取与特征关联以得到融合特征向量;以及,推荐物品确定模块130,用于基于所述融合特征向量,确定推荐物品。
41.这里,本领域技术人员可以理解,上述长短期兴趣提取的个性化会话推荐系统100中的各个单元和模块的具体功能和操作已经在上面参考图1到图4的长短期兴趣提取的个性化会话推荐方法的描述中得到了详细介绍,并因此,将省略其重复描述。
42.如上所述,根据本公开实施例的长短期兴趣提取的个性化会话推荐系统100可以实现在各种无线终端中,例如具有长短期兴趣提取的个性化会话推荐算法的服务器等。在一种可能的实现方式中,根据本公开实施例的长短期兴趣提取的个性化会话推荐系统100可以作为一个软件模块和/或硬件模块而集成到无线终端中。例如,该长短期兴趣提取的个性化会话推荐系统100可以是该无线终端的操作系统中的一个软件模块,或者可以是针对于该无线终端所开发的一个应用程序;当然,该长短期兴趣提取的个性化会话推荐系统100同样可以是该无线终端的众多硬件模块之一。
43.替换地,在另一示例中,该长短期兴趣提取的个性化会话推荐系统100与该无线终端也可以是分立的设备,并且该长短期兴趣提取的个性化会话推荐系统100可以通过有线和/或无线网络连接到该无线终端,并且按照约定的数据格式来传输交互信息。
44.图6示出根据本公开的实施例的长短期兴趣提取的个性化会话推荐方法的应用场景图。如图6所示,在该应用场景中,首先,获取用户的个性化信息(例如,图6中所示意的d1)以及所述用户的会话序列(例如,图6中所示意的d2),然后,将所述用户的个性化信息以及所述用户的会话序列输入至部署有长短期兴趣提取的个性化会话推荐算法的服务器中(例如,图6中所示意的s),其中,所述服务器能够使用所述长短期兴趣提取的个性化会话推荐算法对所述用户的个性化信息以及所述用户的会话序列进行处理以得到用于表示推荐物品的标签的分类结果。
45.进一步地,本公开示出了另一个示例,为了提高序列学习模块的个性化推荐能力,首先在会话的序列中引入用户标识。具体的,以表示当前会话序列的嵌入矩阵,其中表示当前会话序列的长度,为嵌入维度,该会话序列由用户点击的物品嵌入向量组成,同时,令表示当权用户的嵌入向量。上述用户、物品的嵌入向量均由异构图神经网络嵌入算法计算得到。用户的个性化信息和会话序列的融合方式如式(4.1)所示:其中,为可学习参数用于对会话序列及物品表示进行线性转换,函数将用户向量广播至与会话序列嵌入矩阵相同的维度,经过用户信息融合的序列会话推荐模型具有更高的个性化推荐能力。
46.循环神经网络最早被应用于自然语言处理领域,其特点是可以依据以往时刻的输入与当前输入信息预测下个时刻的输出,因而被广泛应用与时序数据预测任务中。如图 7所示,一个经典的rnn结构的输入是上一时刻输出的隐状态和当前时刻的观测值,其利用全连接层对隐状态和当前观测值进行转换,输出当前时刻的隐状态,其计算过程如式(4.2)所示:其中表示时刻的隐状态,表示时刻的输入,和为全连接层的何可学习参数,为偏置向量。由于隐状态依赖于计算得到,在反向传播计算梯度时将出现的指数项形式,当时,可能出现远距离处的梯度消失情况;而当时,则有可能出现梯度爆炸的情况。
47.如图8所示,lstm作为rnn的变种网络,其新增了一个中间状态称为细胞状态(cell state),同时设置了遗忘门、输入门和更新门三个门控机制来控制以往时刻和当前输入的影响权重。其计算过程如式(4.3)到式(4.8)所示:其中和分别表示时刻遗忘门、输入门和输出门的开度,为时刻的细胞状态,为时刻的隐状态,和为可学习参数。由式(4.6)及(4.8)可知,时刻输出的隐状态由计算得到,而则由和的线性组合得到,那么在反向传播时将有两条路径,其中一条由直接传至,那么即使另一条路线上出现了矩阵连乘造成的梯度小时,该条较短路径的梯度仍能对总体梯度进行正向补偿。解决梯度爆炸的方式一般是对梯度进行裁剪,防止出现过大的梯度值。
48.如图9所示,gru作为lstm的改进型网络进一步将门控数量降低到了两个,分别是重置门和更新门,计算过程如式(4.9)到式(4.12)所示:其中表示重置门,表示更新门和为网络中的可学习参数。相比与lstm,gru的网络结构具有更少的参数,从而加快了训练和推理的速度。用户的行为模式及短期兴趣表示可由进行表示即:
49.为了充分挖掘会话序列中存在的用户兴趣,首先使用gru网络对融合了用户信息的会话序列进行建模,其输出的最终隐状态可以作为用户的短期兴趣表示。同时,保留gru在序列的不同位置输出的所有隐状态,随后使用自注意力机制为不同的隐状态分配不同的权重,以此针对不同会话的特点保留用户在该会话中的主要目标和兴趣,减少序列中噪音物品对模型的影响。
50.如图10所示,以往的工作往往将会话序列中最后一个物品作为用户的短期兴趣,同时将该物品作物注意力计算中的询问项,以序列中的其他物品作为键值项,由此进行用户在本次会话中主要目标和兴趣的表示[32, 65, 66]。但是,这样的做法在序列的最后一个物品属于噪音干扰时将严重影响推荐的准确性。为此,本公开提出一种基于自注意力的用户兴趣提取方法。
[0051]
自注意力计算过程如图11所示。在本公开中,以融合了用户信息的会话序列为
输入,自注意力机制的计算过程如下所示:其中,,为可学习参数,通过自注意力计算之后的每个物品表示融合了序列中其他物品的表示,其中,通过与与其他物品表示向量进行点击运算,是的与自身相似的其他物品在新的表示中占据更高的影响。自注意力计算的好处在于可以根据会话序列中的不同自适应地为每个物品计算权重,这样学得的最终会话表示将更能反应当前会话中用户的主要目标和兴趣。最后对中的所有物品进行求均值作为用户在当前会话中的长期兴趣表示:
[0052]
在获取用户在当前会话的长期、短期兴趣向量表示后,需要在所有物品集合中挑选出符合用户兴趣的物品,推荐模块首先将用户长短期兴趣以及用户表示进行拼接,随后使用全连阶层将其映射到与物品嵌入空间相同大小的维度,最后使用矩阵乘法运算计算每个物品与用户兴趣的相似分数:在得到所有物品的相似度分数之后,推荐模块按照分数对物品逆序排序,取前个作为结果进行推荐。当取1时即为下个物品推荐。
[0053]
进一步地,关于训练损失函数,令为模型预测的下个时刻用户可能点击物品的概率分布,为用户下个时刻的真实点击物品概率分布。模型训练时使用交叉熵函数最小化预测分布和真实分布之间的损失,其数学计算过程如式(4.18)所示:随后,使用梯度下降算法计算模型网络中各个参数的导数并以梯度下降算法进行参数的更新学习。
[0054]
进一步地,在该示例中,对多个模型进行比对实验,具体地,实验涉及模型使用python3.8编写,并在dgl和pytorch框架下实现模型的构建、训练和预测。所使用的操作系统为centos 8.5.2111 64位,cpu型号为intel(r) core(tm) i9-10980xe @ 3.00ghz,内存为96gb。模型的加载以及梯度计算任务由一张3090(24gb)显卡执行。本章实验中将用户、物品的嵌入空间维度设置为128,使用adamw优化器对模型参数进行更新,设定学习率为10-3
。在模型训练时采用早停机制,在验证集效果连续两个轮次没有提升时结束训练,防止过拟合。每个轮次中使用的小批量训练大小为128。
[0055]
进一步地,在该示例中,对多个模型进行比对实验,具体地,实验涉及模型使用python3.8编写,并在dgl和pytorch框架下实现模型的构建、训练和预测。所使用的操作系统为centos 8.5.2111 64位,cpu型号为intel(r) core(tm) i9-10980xe @ 3.00ghz,内存为96gb。模型的加载以及梯度计算任务由一张3090(24gb)显卡执行。本章实验中将用户、物品的嵌入空间维度设置为128,使用adamw优化器对模型参数进行更新,设定学习率为10-3
。在模型训练时采用早停机制,在验证集效果连续两个轮次没有提升时结束训练,防止过拟合。每个轮次中使用的小批量训练大小为128。使用到的对比模型包括:itemknn模型,itemknn是一个受到广泛使用的会话推荐模型,其通过计算当前会话中最后一个物品与物品集中其他物品的相似度进行推荐。nextitnet模型,nextitnet使用空洞卷积神经网络对
用户的会话序列进行建模,相对普通卷积神经网络,空洞卷积神经网络在保持相同参数量的同时具有更大的感受野,能够捕获会话序列内的远距离依赖。narm模型,narm使用gru对会话序列进行建模,同时,其利用注意力机制计算会话序列中最后一个物品和其他物品的相似度建模用户的动态兴趣。该方法没有利用用户信息因而只适用于匿名会话任务。stamp模型,同样是适用于用户匿名情况下的会话推荐模型,其使用注意力机制建模用户短期兴趣表示。sr-gnn模型,将图神经网络应用于会话推荐任务中,其将会话序列构建为图网络结构,随后利用gru算子更新节点表示,同样将会话序列中的最后一个物品作为询问项计算其与序列中其他物品的相似度,以此学习用户的长短期兴趣表示。ssrm模型,利用基于矩阵分解的注意力机制构建的流式推荐模型,在会话推荐中同样具有优异的表现。dgrec模型,利用rnn结构对所有会话进行建模,输出向量作为用户的短期兴趣表示,同时依据会话发生的时间节点引入用户好友最近发生的会话信息,并利用图神经网络自适应地聚合不同好友在当前会话场景下对目标用户的影响。
[0056]
实验结果如表4.1所示:表4.1 会话推荐对比实验结果
[0057]
从上表结果可以看到,相较于传统会话推荐算法itemknn和nextitnet,基于深度神经网络的算法模型均取得了较为明显得优势,这印证了深度神经网络强大的数据拟合能力。使用循环神经网络的narm模型对比使用了空洞卷积网络的stamp模型在delicious数据集中效果差异不大,而在另外两个数据集则取得比较明显的优势地位,这表明在会话推荐任务中序列建模相对局部结构解析仍具备更明显的效果。sr-gnn相对narm一方面在delicous数据集上要表现更优一些,但在另外两个数据集中则更差一些,这可能和数据集中会话序列长度有关,gnn擅长于捕获复杂结构信息,但无法学习时序信息和行为模式。dgrec在三个数据集上均取得了次优的成绩,这是因为其引入了用户社交网络的影响,利用用户好友在最近发生的会话信息辅助本次会话推荐的预测,这表明引入社交网络对个性化会话推荐意义重大。最后本章所提模型pgran在三个数据集中均取得了最佳的结果,其相对于次优的dgrec在delicious、gowalla和foursquares数据集上的hr@10、mrr@10、hr@20以及mrr@20指标分别取得了平均2.67、1.36、2.61和1.37的绝对值提升,对应的百分比提升分别
为5.62%、5.13%、4.68%和5.06%的提升,这是因为pgran不仅利用异构神经网络引入了用户社交网络的影响,同时还利用基于改进型循环神经网络结构对会话序列中的时序模式进行学习,该结构更好地捕获用户在当前会话中动态的主要目标以及时刻变化的短期兴趣表示。各个模型的性能对比如图12所示。
[0058]
附图中的流程图和框图显示了根据本公开的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
[0059]
以上已经描述了本公开的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。
技术特征:
1.一种长短期兴趣提取的个性化会话推荐方法,其特征在于,包括:获取用户的个性化信息以及所述用户的会话序列;基于深度卷积神经网络模型对所述用户的个性化信息以及所述用户的会话序列进行特征提取与特征关联以得到融合特征向量;以及基于所述融合特征向量,确定推荐物品。2.根据权利要求1所述的长短期兴趣提取的个性化会话推荐方法,其特征在于,基于深度卷积神经网络模型对所述用户的个性化信息以及所述用户的会话序列进行特征提取与特征关联以得到融合特征向量,包括:对所述会话序列进行语义分析与理解以得到用户点击行为语义理解特征向量;对所述用户的个性化信息进行语义分析与理解以得到用户个性化信息语义理解特征向量;以及融合所述用户点击行为语义理解特征向量和所述用户个性化信息语义理解特征向量以得到所述融合特征向量。3.根据权利要求2所述的长短期兴趣提取的个性化会话推荐方法,其特征在于,对所述会话序列进行语义分析与理解以得到用户点击行为语义理解特征向量,包括:基于所述会话序列生成用户点击的物品嵌入向量的序列;以及将所述用户点击的物品嵌入向量的序列通过双向长短期记忆神经网络模型以得到用户点击行为语义理解特征向量。4.根据权利要求3所述的长短期兴趣提取的个性化会话推荐方法,其特征在于,对所述用户的个性化信息进行语义分析与理解以得到用户个性化信息语义理解特征向量,包括:对所述用户的个性化信息进行分词处理后通过基于gru的语义编码器以得到所述用户个性化信息语义理解特征向量。5.根据权利要求4所述的长短期兴趣提取的个性化会话推荐方法,其特征在于,融合所述用户点击行为语义理解特征向量和所述用户个性化信息语义理解特征向量以得到所述融合特征向量,包括:以如下融合公式对所述用户点击行为语义理解特征向量及所述用户个性化信息语义理解特征向量进行局部序列语义的片段式富化融合以获得所述融合特征向量;其中,所述融合公式为:其中,为所述用户点击行为语义理解特征向量,为所述用户个性化信息语义理解特征向量,为所述用户个性化信息语义理解特征向量的转置向量,和均为列向量,为所述用户点击行为语义理解特征向量和所述用户个性化信息语义理解特征向量之间的距离矩阵,且是权重超参数,和分别表示向量乘法和向量加法,为所述融合特征向量。6.根据权利要求5所述的长短期兴趣提取的个性化会话推荐方法,其特征在于,基于所述融合特征向量,确定推荐物品,包括:将所述融合特征向量通过分类器以得到分类结果,所述分类结果用于表示推荐物品的标签。
技术总结
公开了一种长短期兴趣提取的个性化会话推荐方法。其首先获取用户的个性化信息以及所述用户的会话序列,接着,基于深度卷积神经网络模型对所述用户的个性化信息以及所述用户的会话序列进行特征提取与特征关联以得到融合特征向量,然后,基于所述融合特征向量,确定推荐物品。这样,可以在一定程度上克服传统推荐算法在面对用户兴趣变化时的局限性。荐算法在面对用户兴趣变化时的局限性。荐算法在面对用户兴趣变化时的局限性。
技术研发人员:楼俊钢 刘卓杰 覃荣臻 张雄涛
受保护的技术使用者:湖州师范学院
技术研发日:2023.07.04
技术公布日:2023/9/14
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
