基于知识图谱深度学习的电子商务推荐方法及系统与流程

未命名 09-17 阅读:200 评论:0


1.本发明涉及电子商务技术领域,具体涉及一种基于知识图谱深度学习的电子商务推荐方法及系统。


背景技术:

2.目前,纺织品电子商务平台属于行业电商平台,多采用线上展览与线下交易相结合的b2b电商模式,商品种类繁多,顾客数量庞大。为了提升顾客的浏览效率和体验,需要开发一个商品推荐系统,根据顾客的偏好为其主动推荐商品。现有的推荐系统一般都是基于注册用户来进行组合推荐,但是在纺织品电子商务平台中顾客以未注册游客为主,其评价和交易记录稀缺,其偏好表现局限于浏览记录。这就为推荐系统的构建带来了顾客难标识、偏好特征难提取和推荐性能难保障等挑战。因此,设计一种能够提升推荐准确率的方案成为本领域技术人员亟待解决的技术问题。


技术实现要素:

3.针对所述缺陷,本发明实施例公开了一种基于知识图谱深度学习的电子商务推荐方法,其能够及时捕获顾客对商品的偏好特征,支持基于地址信息的个性化推荐,提升顾客对电子商务平台的商品浏览效率。
4.本发明实施例第一方面公开了基于知识图谱深度学习的电子商务推荐方法,包括:
5.接收应用接口端传输的浏览信息,所述浏览信息为相应用户电子商务平台处的操作内容,其中,所述浏览信息包括商品信息和浏览日志;所述浏览日志包括浏览器ip地址信息;并基于所述浏览器ip地址信息确定顾客信息;
6.将所述浏览信息发送至预先构建完成的商品关系图谱模型来进行实体关系抽取以得到顾客商品交互矩阵;在所述商品关系图谱模型中采用资源描述框架来对商品属性关系和商品归属关系进行描述,所述商品属性关系被表述为商品编号、属性关系和属性值编号的三元组形式,所述商品归属关系被表述为商品编号、归属于和店铺编号的三元组形式;
7.将所述浏览信息、顾客商品交互矩阵和商品关系图谱模型传输至推荐算法模型来进行推荐识别以确定相应顾客的商品推荐结果。
8.作为一种可选的实施方式,在本发明实施例第一方面中,在所述接收应用接口端传输的浏览信息之后,还包括:
9.对所述浏览信息进行数据清洗操作以对浏览日志中的非商品浏览记录以及商品字段缺失浏览记录进行过滤操作;
10.对经过过滤操作的浏览信息进行有效性判断,当对一顾客对同一商品的浏览次数或者浏览时间超过第一设定值时,则确定该商品对顾客有效,否则对相应的浏览信息进行过滤。
11.作为一种可选的实施方式,在本发明实施例第一方面中,所述商品关系图谱模型
通过如下步骤构建完成:
12.获取相应电子商务平台处的商品属性信息;
13.从所述商品属性信息中提取多个商品实体、商品属性以及店铺实体,并确定所述多个商品实体之间、商品实体与店铺实体之间以及商品实体与商品属性之间的关系;
14.基于多个商品实体之间、商品实体与店铺实体之间以及商品实体与商品属性之间的关系构建商品关系图谱模型。
15.作为一种可选的实施方式,在本发明实施例第一方面中,在从所述商品属性信息中提取多个商品实体、商品属性以及店铺实体之后,还包括:
16.从历史浏览信息中基于顾客商品的浏览关系以确定商品之间的浏览邻接关系;所述浏览邻接关系为在一个会话周期内若浏览多个商品,则多个商品之间互为浏览邻接关系;
17.当互为浏览邻接关系次数达到第二设定值时,则确定该商品之间存在浏览邻接关系。
18.作为一种可选的实施方式,在本发明实施例第一方面中,所述商品关系图谱模型还包括如下步骤:
19.若当前商品推荐图谱构建过程不是首次商品关系图谱模型构建过程,则将所述多个商品实体和所述多个商品实体之间的关系融合至上一商品关系图谱模型中以得到当前商品关系图谱模型的多个商品实体以及多个商品实体之间的关系。
20.作为一种可选的实施方式,在本发明实施例第一方面中,所述推荐算法模型包括预测函数模型,所述预测函数模型通过如下步骤构建得到:
21.基于浏览日志l将顾客-商品交互集(u,i)划分为交互正集和交互负集如果浏览日志l中存在顾客u对商品i的访问记录,则确定否则其形式化表示如下:
[0022][0023][0024]
将所述交互正集交互负集商品浏览邻接图谱ng、商品知识图谱kg输入至预先构建的预测函数公式来进行预测以得到相应的预测结果;所述预测函数公式为:
[0025][0026]
其中,表示的预测评分,f表示预测函数,u为顾客信息,u为顾客矩阵,且u={u1,u2,...,um},i为商品信息,i为商品矩阵,且i={i1,i2,...,in}。
[0027]
作为一种可选的实施方式,在本发明实施例第一方面中,在所述将所述浏览信息发送至预先构建完成的商品关系图谱模型来进行实体关系抽取以得到顾客商品交互矩阵之后,还包括:
[0028]
将所述浏览信息与商品关系图谱kg进行结合,并采用kgin算法来进行顾客-商品交互个体的意图提取以得到相应的个体意图特征;
[0029]
将访问日志l与商品浏览邻接图谱ng相结合,采用图聚合运算进行群体的顾客-商品交互群体意图提取以得到相应的群体意图特征;
[0030]
采用注意力机制将所述个体意图特征和群体意图特征进行特征融合以形成融合
特征,并根据所述融合特征评估顾客对商品的兴趣评分。
[0031]
作为一种可选的实施方式,在本发明实施例第一方面中,所述将所述浏览信息与商品关系图谱模型进行结合,并采用kgin算法来进行顾客-商品交互个体的意图提取以得到相应的个体意图集合,包括:
[0032]
将获取到的顾客-商品组(u,i)分解为意图集c={(u,p,i)|p∈p};将原有的顾客交互记录重组为意图图ig;
[0033]
采用kgin算法将意图与商品关系图谱kg进行关联,将顾客的意图p定义为知识图谱中不同关系的非线性组合,该意图的嵌入式表示为:
[0034][0035]
其中,er是关系r的初始表示向量,将关系r赋予注意力分数α(r,p)来量化其重要性,w
rp
是特定关系r和特定意图p的可训练权重,是d维随机初始的向量,wr′
p
表示同关系下其它的意图权重;
[0036]
在意图图ig中,使用nu={(p,i)|(u,p,i)∈c}来表示顾客u周围的意图感知历史和一阶连通性,通过嵌入公式来用历史的意图感知信息整合表示顾客的嵌入表示:
[0037][0038]
式中,是顾客u的kgin一阶路径聚合的特征表示,

表示点积运算,β(u,p)则是区分个体顾客意图的权重,e
pt
表示e
p
的转置向量,exp表示指数运算,e
p

t
表示其它意图向量的转置;
[0039]
kgin算法采用基于关系和节点的特征聚合方式以得到商品i的特征聚合
[0040][0041]
其中,ni是以商品i为头实体相关联的三元组集合,则是商品i对应的尾实体v嵌入表示,
[0042]
重复上述步骤获得更深层的信息表示,将每层信息采用多层聚合从而获得更广阔的感受野,获得kgin的最终商品和顾客特征表示如下:
[0043][0044][0045]
式中,q为聚合层数;
[0046]
所述将访问日志l与商品浏览邻接图谱ng相结合,采用图聚合运算进行群体的顾客-商品交互群体意图提取以得到相应的群体意图特征
[0047]
采取一阶聚合获取顾客和商品的浏览邻接关系特征,商品i的浏览邻接特征e
inei
表示如下:
[0048]
其中,n
inei
表示与商品i存在浏览邻接关系的所有商品集合,j是n
inei
中的商品,ej是商品j的初始表示向量;
[0049]
根据顾客-商品交互关系进行顾客偏好的描述以得到顾客浏览邻接特征,顾客u的浏览邻接特征e
unei
表示如下:
[0050][0051]
其中,nu是顾客u的浏览商品集合。
[0052]
作为一种可选的实施方式,在本发明实施例第一方面中,所述采用注意力机制将所述个体意图特征和群体意图特征进行特征融合以形成融合特征,并根据所述融合特征评估顾客对商品的兴趣评分,包括:
[0053]
根据拼接公式将浏览邻接特征和kgin特征在同维度上进行拼接操作以得到拼接特征向量,所述拼接公式为:
[0054]euconcat
=e
unei
||e
ukgin
[0055]eiconcat
=e
inei
||e
ikgin
[0056]
其中,e
uconcat
和e
iconcat
分别表示顾客u和商品i的拼接特征,||表示向量拼接运算;
[0057]
将所述拼接特征向量与注意力权重w
att
进行相乘并采用归一化,挑选出关键性特征的权重key
weight

[0058]
对顾客和商品特征采用相同的注意力权重w
att
,根据key
weight
与拼接特征进行点乘获得融合特征e
ufusion
和e
ifusion

[0059]
将所述融合特征输入至预测公式中来进行预测以得到顾客对商品的兴趣评分,所述预测公式为:
[0060]
本发明实施例第二方面公开一种基于知识图谱深度学习的电子商务推荐系统,包括:
[0061]
接收模块:用于接收应用接口端传输的浏览信息,所述浏览信息为相应用户电子商务平台处的操作内容,其中,所述浏览信息包括商品信息和浏览日志;所述浏览日志包括浏览器ip地址信息;并基于所述浏览器ip地址信息确定顾客信息;
[0062]
实体抽取模块:用于将所述浏览信息发送至预先构建完成的商品关系图谱模型来进行实体关系抽取以得到顾客商品交互矩阵;在所述商品关系图谱模型采用资源描述框架来对商品属性关系和商品归属关系进行描述,所述商品属性关系被表述为商品编号、属性关系和属性值编号的三元组形式,所述商品归属关系被表述为商品编号、归属于和店铺编号的三元组形式;
[0063]
推荐模块:用于将所述浏览信息和顾客商品交互矩阵传输至推荐算法模型来进行推荐识别以确定相应顾客的商品推荐结果。
[0064]
本发明实施例第三方面公开一种电子设备,包括:存储有可执行程序代码的存储器;与所述存储器耦合的处理器;所述处理器调用所述存储器中存储的所述可执行程序代码,用于执行本发明实施例第一方面公开的基于知识图谱深度学习的电子商务推荐方法。
[0065]
本发明实施例第四方面公开一种计算机可读存储介质,其存储计算机程序,其中,所述计算机程序使得计算机执行本发明实施例第一方面公开的基于知识图谱深度学习的电子商务推荐方法。
[0066]
与现有技术相比,本发明实施例具有以下有益效果:
[0067]
本发明实施例的基于知识图谱深度学习的电子商务推荐方法通过对知识图谱和浏览日志进行深度学习,输出反映顾客浏览偏好的推荐结果;应用接口模块则接受上层应用的对推荐结果的检索,实现推荐应用的集成;本实施例的推荐方法能捕获顾客对商品的偏好特征,支持个性化商品推荐,提升顾客对电子商务平台的商品浏览效率。
附图说明
[0068]
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0069]
图1是本发明实施例公开的基于知识图谱深度学习的电子商务推荐方法的流程示意图;
[0070]
图2是本发明实施例公开的对浏览信息进行过滤操作的流程示意图;
[0071]
图3是本发明实施例公开的商品关系图谱模型构建的流程示意图;
[0072]
图4是本发明实施例公开的推荐算法模型构建的流程示意图;
[0073]
图5是本发明实施例公开的推荐系统的技术框架图;
[0074]
图6是本发明实施例公开的商品知识图谱的本体模型图;
[0075]
图7是本发明实施例公开的kgcn模型的结构图;
[0076]
图8是本发明实施例公开的kgcn模型的信息传递图;
[0077]
图9是本发明实施例公开的kgcn模型的一阶聚合过程示意图;
[0078]
图10是本发明实施例公开的推荐原理示意图;
[0079]
图11是本发明实施例公开的电子商务推荐系统的部署图;
[0080]
图12是本发明实施例公开的纺织品电商知识图谱示例图;
[0081]
图13是本发明实施例公开的算法推荐准确率随学习迭代次数的变化曲线图;
[0082]
图14是本发明实施例公开的auc有无浏览邻接关系对比图;
[0083]
图15是本发明实施例公开的acc有无浏览邻接关系对比图;
[0084]
图16是本发明实施例公开的kgin-df算法框架图
[0085]
图17是本发明实施例公开的kgin特征提取示意图;
[0086]
图18是本发明实施例公开的浏览邻接特征提取示意图;
[0087]
图19是本发明实施例公开的注意力特征融合的示意图;
[0088]
图20是本发明实施例提供的一种基于知识图谱深度学习的电子商务推荐系统的结构示意图。
具体实施方式
[0089]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0090]
需要说明的是,本发明的说明书和权利要求书中的术语“第一”、“第二”、“第三”、“第四”等是用于区别不同的对象,而不是用于描述特定顺序。本发明实施例的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,示例性地,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0091]
经典推荐算法可分为内容过滤、协同过滤和模型过滤三类。三类经典算法均需要显式的顾客交易评分记录,对于缺乏评分记录的纺织品电商平台而言,需要将浏览日志转换为评分记录,如根据浏览次数或时长进行转换,而实际上浏览对顾客偏好的反映远远弱于交易和评分记录,从浏览到评分的转换将会引入大量噪声而导致推荐性能不佳。对于纺织品电子商务推荐而言,仍有以下问题需要解决:非注册游客的标识问题;适合于深度学习的知识图谱构建问题;支持多算法的深度学习框架设计问题。本发明实施例公开了基于知识图谱深度学习的电子商务推荐方法、系统、电子设备及存储介质,通过对知识图谱和浏览日志进行深度学习,输出反映顾客浏览偏好的推荐结果;应用接口模块则接受上层应用的对推荐结果的检索,实现推荐应用的集成;本实施例的推荐方法能捕获顾客对商品的偏好特征,支持个性化商品推荐,提升顾客对电子商务平台的商品浏览效率。
[0092]
本发明实施例的基于知识图谱的推荐方法不仅能根据历史浏览日志,还能结合商品关系进行推荐,是目前推荐技术的发展趋势。按照技术可以分为基于路径编码和基于深度学习两类推荐算法。基于路径编码的推荐算法依赖于人的经验,基于顾客和商品之间的关系设置推荐路径,然后以顾客访问的商品为起点,沿着推荐路径计算商品相似度,再基于相似度进行推荐。基于路径编码的推荐方法因依赖人的经验而推广性不足。
[0093]
基于深度学习的推荐方法以知识图谱和顾客交互记录为输入,通过深度学习来预测未知的顾客对商品的浏览概率,丰富了顾客到商品的推荐路径,能缓解评分记录缺失的影响,可视为基于内容和基于协同过滤的混合算法。目前主要包括三个经典模型:ripplenet、kgcn(knowledge graph convolutional networks)和kgat(knowledge graph attention network)及其衍生系列。ripplenet利用项目连接的多跳关系加强对节点的嵌入表示,kgcn通过对图谱关系进行加权实现更精准的推荐,kgat在知识图谱中引入顾客-商品交互矩阵并对图谱关系进行加权实现推荐。ckan(collaborative knowledge-aware attentive network)模型是一种新型的衍生知识图谱推荐算法,相比于上述三个经典模型而言,主要改进了顾客的初始表示,它用交互过的商品集来表达顾客,这样,只要顾客与商品有交互记录就可以进行推荐,不需要重新学习,提升了适用范围,减少了学习的频次。
[0094]
纺织品电子商务平台属于行业电商平台,多采用线上展览与线下交易相结合的b2b电商模式,商品种类繁多,顾客数量庞大,有着强烈的推荐需求。但顾客以未注册游客为主,评价和交易记录缺乏,其偏好特征提取只能依赖浏览记录。顾客偏好关联信息稀缺导致传统的基于顾客-商品评价矩阵的顾客协同过滤、商品协同过滤、奇异值分解等推荐算法效果不佳。本发明实施例提供了一个基于知识图谱深度学习的纺织品电子商务推荐系统,根据b2b电商顾客浏览端稳定性的特点,以浏览端ip地址标识顾客,解决未注册顾客的标识问题;
[0095]
通过商品属性和被浏览特征建立商品之间的相互关联,弥补顾客偏好关系信息的不足;通过建立一个支持多种知识图谱深度学习推荐算法的系统框架来保障推荐性能。系
统包括:知识图谱构建、深度学习、应用接口等三大模块,知识图谱构建模块基于纺织品电子商务平台的商品属性、店铺属性和浏览日志,经数据抽取、转换和加载后,构建了反映商品、店铺、顾客等实体关系的知识图谱。特别地,基于浏览日志定义商品之间的浏览邻接关系,建立了商品之间的直接关联。深度学习模块则在知识图谱关系三元组的基础上,构建统一的深度学习数据集和评价指标体系,并提供了ripplenet、kgcn、kgat、ckan等知识图谱深度学习推荐算法,基于知识图谱和浏览日志进行深度学习,输出反映顾客浏览偏好的推荐结果。应用接口模块则接受上层应用的对推荐结果的检索,实现推荐应用的集成。本推荐系统能捕获顾客对商品的偏好特征,支持个性化商品推荐,提升顾客对电子商务平台的商品浏览效率。
[0096]
实施例一
[0097]
请参阅图1,图1是本发明实施例公开的基于知识图谱深度学习的电子商务推荐方法的流程示意图。其中,本发明实施例所描述的方法的执行主体为由软件或/和硬件组成的执行主体,该执行主体可以通过有线或/和无线方式接收相关信息,并可以发送一定的指令。当然,其还可以具有一定的处理功能和存储功能。该执行主体可以控制多个设备,例如远程的物理服务器或云服务器以及相关软件,也可以是对某处安置的设备进行相关操作的本地主机或服务器以及相关软件等。在一些场景中,还可以控制多个存储设备,存储设备可以与设备放置于同一地方或不同地方。如图1所示,该基于知识图谱深度学习的电子商务推荐方法包括以下步骤:
[0098]
s101:接收应用接口端传输的浏览信息,所述浏览信息为相应用户电子商务平台处的操作内容,其中,所述浏览信息包括商品信息和浏览日志;所述浏览日志包括浏览器ip地址信息;并基于所述浏览器ip地址信息确定顾客信息;
[0099]
在本步骤主要是为了获取到基础的浏览数据。具体的,应用接口主要为应用程序提供推荐功能调用,以http服务的形式提供,服务程序根据应用请求检索深度学习获得的离线推荐文档,并将检索结果以json格式响应推荐结果。接口详情设计如下:接口协议为http get;请求参数为userid(用户标识)、model(模型名称)、code(返回码)、msg(返回消息)和data(返回数据),其中,模型在{ripplenet,kgcn,kgat,ckan,

}中枚举;返回码:同http定义,如200表示成功;返回消息:查询成功,或失败原因,如顾客不存在;返回数据:(商品id,顾客浏览概率)列表,以json对象输出。
[0100]
更为优选的,图2是本发明实施例公开的对浏览信息进行过滤操作的流程示意图,如图2所示,在所述接收应用接口端传输的浏览信息之后,还包括:
[0101]
s1011:对所述浏览信息进行数据清洗操作以对浏览日志中的非商品浏览记录以及商品字段缺失浏览记录进行过滤操作;
[0102]
s1012:对经过过滤操作的浏览信息进行有效性判断,当对一顾客对同一商品的浏览次数或者浏览时间超过第一设定值时,则确定该商品对顾客有效,否则对相应的浏览信息进行过滤。
[0103]
顾客-商品浏览关系主要基于浏览日志构建,假定浏览日志中包含浏览器端ip地址、浏览时间、浏览商品id等信息,则用浏览器端ip地址作为顾客实体标识,浏览关系的形式则表示为(顾客ip,浏览,商品id),这样就构建了顾客-商品之间的关系。通过上述方式解决了非注册用户信息对应的问题。
[0104]
为了增强浏览关系的有效性,这里增加一个有效浏览的判定,只有顾客对商品浏览次数超过2次,才认为是顾客对商品的有效浏览,否则,认为是顾客对商品的无意浏览,对推荐而言价值不大。首先在浏览日志中过滤掉无效浏览,然后对有效浏览生成三元组(顾客ip,浏览,商品id)。通过上述步骤来实现对顾客的更加精准的推送操作。
[0105]
s102:将所述浏览信息发送至预先构建完成的商品关系图谱模型来进行实体关系抽取以得到顾客商品交互矩阵;在所述商品关系图谱模型中采用资源描述框架来对商品属性关系和商品归属关系进行描述,所述商品属性关系被表述为商品编号、属性关系和属性值编号的三元组形式,所述商品归属关系被表述为商品编号、归属于和店铺编号的三元组形式;
[0106]
在本发明实施例中纺织品电子商务平台以线上展示,线下交易的模式进行,注册顾客稀疏,交易数据和评分数据稀缺,基于数据的可获取性考虑,推荐系统主要构建在店铺、商品、浏览日志等数据基础上,商品与店铺是归属关系,商品之间通过属性实体相关联,并没有直接关系。
[0107]
本模块首先从纺织品电子商务平台数据接口抽取店铺、商品、浏览日志等数据,然后对数据进行清洗,过滤掉浏览日志中的非商品(展会、店铺、通知等)浏览记录和商品id字段缺失的浏览记录。再将店铺、商品、浏览等对象加载到程序中进行实体转换。
[0108]
知识图谱中的实体主要包括:店铺、商品、商品属性(如成分、织法、用途等)、顾客等。店铺和商品对象直接转换为知识图谱中的店铺和商品实体,对于商品属性而言,每类属性为一类实体,该类属性值域内的每一个离散值即可转换为商品属性实体,如成分属性,可以抽取出:棉、羊毛、桑蚕丝、牛仔布等实体。
[0109]
特别地,对于顾客实体的抽取,因为主要是非注册的游客,不能像一般电商系统一样从顾客会员注册表中提取信息,这里从浏览日志中间接提取。因为b2b的交易特性,纺织品电商平台的顾客主要是服装加工企业的采购员,一个服装加工企业可能有多个采购员,但是他们浏览商品的目的均是为企业采购物料,并且主要通过企业网络访问电商平台,在浏览日志中记录的浏览端ip较为稳定。在此,将顾客定义为一个服装加工企业的采购员群体而非单个采购员,采用浏览日志中的浏览端ip进行标识,一个ip即表示一个顾客实体。
[0110]
更为优选的,图3是本发明实施例公开的商品关系图谱模型构建的流程示意图,如图3所示,所述商品关系图谱模型通过如下步骤构建完成:
[0111]
s1021:获取相应电子商务平台处的商品属性信息;
[0112]
s1022:从所述商品属性信息中提取多个商品实体、商品属性以及店铺实体,并确定所述多个商品实体之间、商品实体与店铺实体之间以及商品实体与商品属性之间的关系;
[0113]
s1023:基于多个商品实体之间、商品实体与店铺实体之间以及商品实体与商品属性之间的关系构建商品关系图谱模型。
[0114]
商品属性关系构建的过程具体如下,将商品、店铺、商品属性值视为实体对象,从加载的商品信息出发,构建商品属性关系和商品与店铺的归属关系,商品和店铺均用唯一性的id作为实体标识,其关系的表示则采用rdf标准进行描述,rdf(resource description framework,资源描述框架)是一种资源描述语言,采用(头实体,关系,尾实体)或者(实体,属性,属性值)的形式描述对象关系和属性。
[0115]
对于商品属性关系,商品是头实体,关系则为具体属性,如纺织品的商品属性主要有:产品分类、成分、织法、用途、颜色、弹力、适用范围、制造工艺等,每一个属性均是一类关系,尾实体则是属性值,每一个属性实体赋一个唯一性的id标识。经处理后,商品属性关系将表示为(商品id,属性关系,属性值id)的三元组形式。商品与店铺的归属关系是一对多的关系,即一家店铺有多种商品,而一种商品只归属于一家店铺,将转换为(商品id,归属于,店铺id)的三元组形式。
[0116]
顾客-商品浏览关系构建的过程,顾客-商品浏览关系主要基于浏览日志构建,假定浏览日志中包含浏览器端ip地址、浏览时间、浏览商品id等信息,则用浏览器端ip地址作为顾客实体标识,浏览关系的形式则表示为(顾客ip,浏览,商品id),这样就构建了顾客-商品之间的关系。为了增强浏览关系的有效性,这里增加一个有效浏览的判定,只有顾客对商品浏览次数超过2次,才认为是顾客对商品的有效浏览,否则,认为是顾客对商品的无意浏览,对推荐而言价值不大。首先在浏览日志中过滤掉无效浏览,然后对有效浏览生成三元组(顾客ip,浏览,商品id)。
[0117]
更为优选的,在从所述商品属性信息中提取多个商品实体、商品属性以及店铺实体之后,还包括:
[0118]
s1021a:从历史浏览信息中基于顾客商品的浏览关系以确定商品之间的浏览邻接关系;所述浏览邻接关系为在一个会话周期内若浏览多个商品,则多个商品之间互为浏览邻接关系;
[0119]
s1021b:当互为浏览邻接关系次数达到第二设定值时,则确定该商品之间存在浏览邻接关系。
[0120]
为了增强商品之间的直接联系,基于顾客-商品浏览关系再派生出商品之间的浏览邻接关系,即顾客u在一个会话周期内(如60分钟)浏览了va、vb、vc三种商品,则va、vb、vc互为浏览邻接关系。为了减少偶发性浏览邻接关系,进一步设立过滤规则,即互为浏览邻接关系的次数达到一定阈值(如2次)才确定两商品之间存在浏览邻接关系。浏览邻接关系体现了商品之间的潜在组合关系,比如一顾客有一个牛仔裤的订单,他就会在商城反复浏览牛仔布面料、铜纽扣、皮饰等,他一次浏览过的商品很可能就能组合为一批服装,但是可用的数据中没有商品之间的组合关系,而通过浏览邻接关系的衍生则可弥补这一不足。基于以上的关系构建,可归纳出纺织品电商知识图谱的本体模型,如图6所示。
[0121]
浏览邻接关系是本发明根据浏览日志扩展出的一种商品之间的关系,它实现了商品间的直接连接,采用kgcn算法,对比有无浏览邻接关系时的推荐性能。auc和acc指标分别如图14和图15所示。图中有浏览邻接关系标识为with no-consequence relationship,无浏览邻接关系标识为without no-consequence relationship。通过上述内容以及图14和图15,可以看出,有浏览邻接关系的auc和acc均明显优于无浏览邻接关系,这也可以验证本发明实施例提出的浏览邻接关系的有效性。
[0122]
更为优选的,所述商品关系图谱模型还包括如下步骤:
[0123]
若当前商品推荐图谱构建过程不是首次商品关系图谱模型构建过程,则将所述多个商品实体和所述多个商品实体之间的关系融合至上一商品关系图谱模型中以得到当前商品关系图谱模型的多个商品实体以及多个商品实体之间的关系。
[0124]
通过上述步骤来实现商品关系图谱模型的不断更新优化以构建更加精准的图谱
关系模型来进行更加精准的数据推荐。
[0125]
s103:将所述浏览信息、顾客商品交互矩阵和商品关系图谱模型传输至推荐算法模型来进行推荐识别以确定相应顾客的商品推荐结果。
[0126]
如图5所示,深度学习模块包括深度学习数据集构建、深度学习推荐算法库配置、深度学习任务启动和推荐结果导出等功能子模块。本发明实施例的方案基于ripplenet、kgcn、kgat、ckan等知识图谱深度学习推荐算法的共性特征,对商品关系文档和浏览关系文档中的内容进行进一步处理,使其能适应深度学习算法的训练。
[0127]
首先对深度学习数据集进行如下定义:
[0128]
(1)顾客-商品交互矩阵y:假定纺织品电商推荐场景中包含m个顾客u={u1,u2,...,um}和n个商品v={v1,v2,...,vn},根据知识图谱构建模块导出的浏览关系文档,可获得顾客-商品交互矩阵y∈rm×n,对于当u与v之间存在浏览关系三元组,则y
uv
=1,否则y
uv
=0。需要注意的是,y
uv
=0,并不意味着顾客u对商品v不感兴趣,也许是因为u未能发现v。
[0129]
(2)知识图谱g:把知识图谱中的顾客、店铺、商品及其属性值(如具体的商家、产品成分、用途等)统称为实体集e,把商品属性关系和顾客-商品浏览关系统称为关系集r,则知识图谱可表示为g={(h,,r,t)|h,t∈e,r∈r}。(h,r,t)即关系三元组,如{针织提花千鸟格,商家,特丽龙}表示商品“针织提花千鸟格”的商家为“特丽龙”,因为商品和商家名称存在重复,在实际的三元组表达中,实体均用id标识。通过商品知识图谱,商品之间实现路径可达,如“特丽龙”的另一类商品“彩云纱”,通过{彩云纱,商家,特丽龙},与“针织提花千鸟格”形成路径可达。注意在图遍历过程中,关系组成的边视为双向边。
[0130]
深度学习数据集构建模块主要按照数据集定义,将浏览关系文档内容转换为顾客-商品交互矩阵y,将浏览关系文档和商品关系文档内容转换为商品知识图谱g。
[0131]
基于上述数据集,顾客-商品推荐问题可抽象为顾客-商品交互关系的预测问题,即给定y和g,以及u∈u,v∈v,预测y
uv
。而推荐算法的任务即要构建一个如式(1)所示的预测函数模型。
[0132][0133]
式中,即u与v的交互关系(即浏览)预测值,θ即函数f的参数集。
[0134]
深度学习推荐算法库配置,ripplenet、kgcn、kgat、ckan等知识图谱深度学习推荐算法是式(1)中函数f的生成程序,它们由带参数集θ的神经网络组成,每一算法有一个特定的神经网络结构,并通过深度学习获得参数集θ。
[0135]
本模块主要对这些算法运行时所需的上下文参数进行统一配置。包括:训练数据路径,即商品关系文档和浏览关系文档的访问路径;训练结果输出路径;各算法的超参数,包括:学习率、神经网络层数、各层神经元节点数等,以及各算法的个性化参数。深度学习任务启动和推荐结果导出,根据需要按照一定的调度策略(如每周一次)启动深度学习任务,学习任务完成后,即生成了一个新的顾客-商品浏览概率预测函数f,基于此函数即可计算出y中任意(u,v)对的浏览概率越大表示顾客u对商品v的潜在兴趣越大。对于每一个顾客u而言,按照对商品v进行排序,并过滤掉y
uv
=1的商品,则排在前面的k个商品即可视为u的推荐商品集。
[0136]
因为顾客和商品规模数量较大,两者组合数量会超过10亿,在线计算会有明显延时,所以采用离线计算的方式进行推荐,即根据函数f进行后台计算,一次性生成所有顾客的离线推荐商品列表,并将结果存储为文本文件,内容格式如:
[0137]
顾客1:商品11,商品12,商品13,

,商品1k;
[0138]
顾客2:商品21,商品22,商品23,

,商品2k;
[0139]
顾客3:商品31,商品32,商品33,

,商品3k;
[0140]
更为优选的,所述推荐算法模型包括预测函数模型,其中预测函数模型为:
[0141]
其中,u为顾客信息,u为顾客矩阵,且u={u1,u2,

,um},v为商品信息,v为商品矩阵,且v={v1,v2,

,,vn},θ即函数f的参数集,为u和v的浏览预测值;
[0142]
图4是本发明实施例公开的推荐算法模型构建的流程示意图,如图4所示,所述推荐算法模型通过如下步骤构建得到:
[0143]
s1031:通过随机初始化向量或者trans嵌入表示算法对商品关系图谱模型中的实体和关系表示为d维嵌入向量;
[0144]
s1032:通过领域信息传播和聚合器来修正实体和关系的嵌入向量以得到最终领域表示vu;其中,利用邻居信息的线性组合来刻画商品的领域信息;
[0145]
s1033:基于顾客信息u和最终领域表示vu定义浏览概率预测函数,并通过交叉熵函数来进行模型计算直至满足设定条件以完成推荐算法模型的构建,所述交叉熵函数为:
[0146]
其中,yi表示顾客商品交互矩阵y中(u,v)对实际的浏览关系,为预测的(u,v)对浏览概率,u为顾客信息,v为商品信息。
[0147]
在本发明实施例中,为了进一步阐述深度学习算法在系统框架中的工作机理,这里以kgcn(knowledge graph convolutional networks)深度学习算法为例,阐述基于知识图谱深度学习的推荐算法计算过程。
[0148]
在本发明实施例中kgcn深度学习所需的数据集顾客-商品交互矩阵y和知识图谱g已构建,kgcn的基本思想是:采用随机初始化向量或trans系列图嵌入表示算法,将g中的实体(包括顾客、商品、店铺、商品属性等所有实体)和关系表示为d维嵌入向量(d由人工设定),然后通过邻域信息传播和聚合来修正实体和关系的嵌入向量。以下如无特别说明,参与计算的实体和关系符号均为其嵌入向量。上述算法主要有如下两个特点:可以通过聚合邻居信息,更好地捕捉局部邻域结构并储存在各个实体中;邻居实体之间的聚合权重取决于特定的顾客u和关系r,既表征了g的语义信息又体现了顾客对关系的个性化兴趣。
[0149]
其算法结构如图7所示。如式(1)所示,kgcn的前向计算过程的输入为一个顾客-商品对(u,v),以及顾客-商品交互矩阵y、知识图谱g和算法参数集θ,输出为顾客u对商品v的浏览概率
[0150]
具体的,首先定义顾客u与关系r的偏好得分函数,如式(2)所示,用于刻画顾客对
商品关系的偏好程度,如纺织品电商平台中,顾客有的偏好材质,有的偏好用途;则具体偏好公式如下:
[0151][0152]
式中,表示u对r的偏好得分,g为偏好函数,一般选择内积函数,即计算u和r的嵌入向量内积,两者越相似,则内积值越大,偏好得分越高。
[0153]
然后利用邻居信息的线性组合来刻画商品v的邻域信息,定义为式(3):
[0154][0155]
式中r
ve
表示商品v和顾客实体e之间的关系,这里的实体g中实体,包括商品本身,还有店铺、顾客、商品属性实体等,n(v)表示所有和v直接相连的实体的集合。为的归一化表示,计算如式(4)所示;
[0156][0157]
为了避免某个结点v存在过多邻居而导致邻域信息计算压力过大,可以在输入参数中增加一个超参数k,如果v的邻居数超过k,则只选取k个邻居进行计算,而不是其全部邻居,使得每个批次的计算模式保持稳定。
[0158]
此时v的邻域表示记作且满足如式(5)所示的条件。
[0159]
s(v)

{e|e∈n(p)},|s(p)|≤k
ꢀꢀꢀꢀꢀꢀ
(5)
[0160]
kgcn层最后一步是将商品节点v的向量表示及其邻域表示聚合为单个向量,这里的v的向量就是在前一轮迭代更新产生的向量,可以从以下三种聚合器选择一个来进行计算。
[0161]
求和聚合(sum),将两个表示向量相加,然后进行非线性变换,如式(6)所示,
[0162][0163]
拼接聚合(concat),将两个表示向量拼接,如维度都为d的两个向量,拼接后维度为2d,然后进行非线性变换,如式(7):
[0164][0165]
邻居聚合(neighbor),将商品v的邻域表示作经非线性变换后输出,如式(8):
[0166][0167]
上式中σ()是非线性激活函数,如relu,sigmoid,w就是线性变换矩阵,b是偏置项,是gcn一个全连接层的基本元素,也是算法参数集θ的组成部分,其需要通过学习获取。
[0168]
对于上面的计算过程,有如图8所示的示例。
[0169]
上图中假定k=2,在kgcn模型中知识图谱g中的关系的表示都为无向边,图中蓝色结点为商品实体v,h=1为其一阶邻居,h=2为其二阶邻居,蓝色箭头为信息传递的方向,训练的过程就是商品v不断聚合其h阶邻居信息的过程,其一阶聚合如图9所示。
[0170]
设k=4,绿圈为邻域表示,蓝圈为聚合后的表示。在迭代的过程中,比如对于第h+1
次迭代,就是用第h次迭代时得到的实体e的向量表示作为初始值,再更新计算当前商品v的邻域表示,再与第h次的邻域表示进行聚合,得到第h+1次v的邻域表示,以下假定v的最终邻域表示为向量vu。最后,则基于u和vu定义浏览概率预测函数,这里采用sigmoid函数作为预测函数,如式(9)所示:
[0171][0172]
在模型学习中,损失函数定义为交叉熵函数,如式(10):
[0173][0174]
式中,yi表示交互矩阵y中(u,v)对实际的浏览关系,有为1,没有为0,为预测的(u,v)对浏览概率,log为对数函数。
[0175]
更为优选的,所述推荐算法模型为ripplenet推荐模型、kgcn推荐模型、kgat推荐模型、ckan推荐模型中的任意一种;且各个推荐模型均保存有相应的神经网络参数;
[0176]
和/或,所述聚合器为求和聚合、拼接聚合和邻居聚合中的任意一种;
[0177]
和/或,所述推荐方法采用离线计算的方式来进行推荐操作,根据预先构建完成的知识图谱和推荐算法模型进行后台计算,一次性生成所有顾客的离线推荐列表,并将结果存储为文本文件;
[0178]
和/或,在所述推荐方法中商品关系图谱模型和推荐算法模型均部署于一gpu深度学习服务器中,所述应用接口部署在一web服务器中。上述知识图谱构建、深度学习、应用接口等三个模块可以独立部署在不同的服务器上,根据计算特点,建议前两个模块部署在一台gpu深度学习服务器中,应用接口部署在一台web服务器中,部署如图11所示。
[0179]
如图10所示,顾客u1浏览了i1,i2,i3这三件产品,u2浏览了i3,i4这两件产品,u3只浏览了i5这一件产品。如果采用商品协同过滤推荐算法,那么i4这件产品会被推荐给u1,而i5则不会被推荐。由图蓝色虚线框中可以看到u1浏览的i3和没有浏览过的i5的关系r3都指向e2,从推荐角度上看,i5应该有一定的推荐价值。但是由于没有知识图谱的嵌入,基线算法忽略了较多的辅助信息,推荐效果不太合理。
[0180]
kgcn模型结合了知识图谱的辅助特性,在个性化推荐上有较不错的效果。该模型会根据顾客对于每个关系的关注度赋予一个权重,它会根据这个权重有偏向性地进行邻居聚合。如上图所示,由于u1浏览了i1,i2,i3这三件产品中,前两件产品有共同关系(r2),第三个产品则单独一个关系(r3),那么可以认为u1更加在意产品的主要用途,那么完全可以给顾客推荐一些以e1为属性的产品,如图中的产品i4,推荐概率大。在产品的r3,r4这两个关系上相对而言顾客可能没那么在乎,那么会推荐如图中的产品i5,但是相比推荐力度会小。对于完整知识图谱而言,产品之间的关系丰富,预测得分的计算流程也会更加复杂,最终的推荐产品也会更加多样化。
[0181]
因为纺织品电子商务平台中店铺、商品、浏览日志在动态更新,为了保证推荐的有效性,建立数据更新策略,定期同步顾客、商品和浏览日志,定期学习,如每周学习一次,更新顾客离线推荐商品列表。
[0182]
基于某轻纺电商网数据,运行知识图谱构建模块,实现了商品属性关系构建和顾
客-商品关系构建,导出了实体关系rdf三元组文件。为了实现知识图谱的可视化呈现,利用工具将rdf三元组导入到neo4j图数据库实例中,再利用neo4j图形展示工具浏览知识图谱,示例如图12所示。
[0183]
在深度学习服务器中部署了ripplenet,kgcn,kgat,ckan等知识图谱深度学习算法,按照数据集构建、推荐算法库配置、任务启动和推荐结果导出的逻辑进行运行,最终获得推荐结果,并计算出了个算法的性能,表1展示了各算法的最终推荐性能。图13展示了各算法推荐准确率(acc)随学习迭代次数(epoch)的变化曲线。
[0184]
算法aucf1accckan0.86290.80900.7657kgat0.87660.81590.8241kgcn0.85750.81000.7782ripplenet0.84640.80110.8004
[0185]
表1深度学习算法的推荐性能
[0186]
从表1可以看出,深度算法之间的总体性能有差异,如kgat算法的acc比ckan算法高出0.0584,说明采用多种推荐算法是有必要的。从曲线中可以看出各算法的收敛速度,kgat虽然收敛速度较慢,但能得到良好的结果。
[0187]
采用用户协同过滤(user-cf)、商品协同过滤(item-cf)和奇异矩阵分解模型(biassvd),以顾客-商品交互矩阵y为输入进行学习,所得的acc指标如表2所示。
[0188]
算法user-cfitem-cfbiassvdacc0.32%0.07%10.52%
[0189]
表2传统算法的推荐性能
[0190]
从表中可以看出,三种传统算法的推荐准确率非常低,与深度学习算法差距巨大。表明仅依赖信息稀疏的浏览日志无法实现有效的推荐,而通过知识图谱构建商品信息关联,并据此进行深度学习,是解决信息稀疏推荐问题的有效途径。
[0191]
本发明实施例的基于知识图谱深度学习的电子商务推荐方法通过对知识图谱和浏览日志进行深度学习,输出反映顾客浏览偏好的推荐结果;应用接口模块则接受上层应用的对推荐结果的检索,实现推荐应用的集成;本实施例的推荐方法能捕获顾客对商品的偏好特征,支持个性化商品推荐,提升顾客对电子商务平台的商品浏览效率。
[0192]
实施例二
[0193]
除了实施例一种采用的方式之外,还可以进一步对其进行特征提取建模,与kgcn、kgat、ckan等算法直接基于知识图谱的节点关系提取商品特征不同,kgin算法有两点改进:(1)基于知识图谱的关系组合定义顾客对商品的交互意图,以获得更好的模型容量和可解释性。(2)以更细粒度的关系路径长期语义来考虑顾客-商品关系。因顾客-商品交互信息稀缺,顾客对不同商品的浏览具有很强的相关性。本技术将对kgin算法进行进一步的改进,提出双特征融合的kgin(kgni with dual feature fusion,kgin-df)深度学习模型,主要思想如图16所示;图中虚框内表示两个特征提取基础模型,左上是kgin模型,左下是浏览邻接关系模型,获得特征经过注意力特征融合机制处理成最终的顾客和商品特征向量。代表拼接操作,代表内积操作,表示矩阵对位相乘,表示softmax操作,
表示点乘操作。
[0194]
算法首先将商品知识图谱kg中的实体和关系,以及顾客随机初始化为一个用xavier_uniform算法生成的高维实值初始表示向量,在下面的计算中,分别用ei,eu,ev,er表示商品i,顾客u,商品属性实体v,关系r的初始表示向量,向量维度为d。然后以(u,i)对的初始表示向量eu,ei作为输入,(u,i)对的交互正集归属评分作为输出,通过深度学习提取u和i的嵌入特征向量。提出的kgin-df算法主要思想可以描述为三个部分:
[0195]
(1)将访问日志l与商品知识图谱kg相结合,采用已有的kgin算法进行顾客-商品交个体图意图提取;
[0196]
(2)将访问日志l与商品浏览邻接图谱ng相结合,采用图聚合运算进行群体的顾客-商品交互群体意图提取。
[0197]
(3)用注意力机制将(1)、(2)获取的两部分意图特征进行融合,形成融合特征后评估顾客-商品的兴趣评分。第(1)部分复用基础的kgin算法,第(2)和(3)部分则为本技术提出的扩展部分。
[0198]
基于商品知识图谱和商品浏览邻接图谱分别捕捉顾客-商品之间的交互意图,从而提供更准确的商品推荐。期望通过双特征融合实现(u,i)的多粒度意图提取,从而提升推荐的准确性。
[0199]
kgin是基于知识图谱感知的推荐算法中的一种,kgin由两个关键部分组成:(1)顾客意图建模,利用多个潜在意图来描述顾客-商品关系,并将每个意图定义为关系的细粒度组合,同时鼓励不同意图相互独立;(2)关系路径感知聚合,强调了远程连通性中的关系依赖,从而保持了关系路径的整体语义。本技术选择kgin的原因在于,其关系意图的建模符合顾客关注纺织品自然属性关系的行为,比如一顾客购买某布料更看重的是其成分属性,而另一顾客则关注织法和颜色等因素。17表示了kgin的大致流程。
[0200]
图中结点p1,p2,...表示顾客意图偏好,结点i1,i2,...代表交互正集中的商品,结点v1,v2,...是知识图谱中的节点,即商品的属性实体。kgin将每一顾客-商品交互记录拆分成多个意图关系,从而根据不同意图进行顾客特征的提取。虚线框内分别表示顾客和商品特征提取公式。
[0201]
kgin将意图定义为顾客选择商品的原因,反映的是所有顾客行为的共性。假设p是所有顾客共享的意图集合,kgin将一个统一的顾客-商品关系分割为|p|(|.|表示集合包含的元素个数,下同)个意图,并将每个(u,i)对分解为c={(u,p,i)|p∈p},原有的顾客交互记录重组为新的异构图,称其为意图图ig。但是识别意图的语义是困难的,于是kgin将意图与知识图谱关系关联,将顾客的意图p定义为知识图谱中不同关系的非线性组合,其嵌入表示e
p
如下式所示:
[0202][0203]
式中,er是关系r的初始表示向量,将关系r赋予注意力分数α(r,p)以量化其重要性。w
rp
是特定关系r和特定意图p的可训练权重,是d维随机初始的向量,wr′
p
表示同关系下其它的意图权重。需要注意的是,注意力分数α(r,p)是针对整体顾客进行统一意图建模,当然,整体顾客的意图是相互独立的,于是引入独立建模模块以此区分各个顾客意图,常用的有点互信息,余弦距离等等以此区分。
[0204]
意图图ig中,使用nu={(p,i)|(u,p,i)∈c}来表示顾客u周围的意图感知历史和一阶连通性,在技术上则用历史的意图感知信息整合表示顾客的嵌入表示
[0205][0206]
式中,是顾客u的kgin一阶路径聚合的特征表示,是顾客u的kgin一阶路径聚合的特征表示,

表示点积运算,β(u,p)则是区分个体顾客意图的权重,如下式所示:
[0207][0208]
其中e
pt
表示e
p
的转置向量,exp表示指数运算,e
p,t
表示其它意图向量的转置。kgin采用基于关系和节点的特征聚合方式,具体而言,商品i的特征聚合如下式所示:
[0209][0210]
其中,ni是以商品i为头实体相关联的三元组集合,则是i对应的尾实体v嵌入表示,
[0211]
在获取第一层卷积的顾客意图表示和商品特征表示后,可以重复上述步骤获得更深层的信息表示,将每层信息采用多层聚合从而获得更广阔的感受野,获得kgin的最终商品和顾客特征表示如下式所示。
[0212][0213][0214]
式中,q为聚合层数。在获得邻居关系图ng后,采用简单的一阶聚合获取顾客和商品的浏览邻接关系特征,即与商品存在直接边联系的商品特征进行相加求和,其计算如图18所示。图中结点i1,i2,...表示浏览邻接图谱ng中的商品,结点u1,u2,...表示顾客。边即为商品之间浏览邻接关系和顾客与商品之间的访问关系。虚线框内表示顾客和商品特征提取公式。
[0215]
采取一阶卷积是因为一阶(直接边)很直观的表示商品的浏览邻接情况,于是,商品i的浏览邻接特征e
inei
表示如下式:
[0216][0217]
式中n
inei
表示与商品i存在浏览邻接关系的所有商品集合,j是n
inei
中的商品,ej是商品j的初始表示向量。而顾客的浏览邻接特征则根据顾客-商品交互关系进行顾客偏好的描述,顾客u的浏览邻接特征e
unei
如下式所示:
[0218]
[0219]
其中nu是顾客u的浏览商品集合。前期分别获得了表示顾客-商品交互个体意图的kgin特征和以及表示顾客-商品交互群体意图的浏览邻接特征和本部分将这两部分特征进行融合,形成和相比浏览邻接特征,kgin特征因为其经历了多意图多层次聚合操作,感受野更大,包含的信息更广,但信息量的过大时,会引入噪声而使图聚合的效果变弱,于是引入注意力特征融合机制,如图19所示。
[0220]
首先定义一个可学习注意力权重w
att
参数向量,在技术上,将浏览邻接特征和kgin特征在同维度上进行拼接,如下式所示:
[0221]euconcat
=e
unei
||e
ukgin
[0222]eiconcat
=e
inei
||e
ikgin
[0223]
式中,e
uconcat
和e
iconcat
分别表示顾客u和商品i的拼接特征,||表示向量拼接运算。需要注意,本部分中不同源适用同一注意力权重,即商品和顾客特征融合使用相同的注意力权重。拼接特征向量e
concat
与w
att
进行相乘并采用归一化,挑选出关键性特征的权重key
weight
,如式所示:
[0224][0225]
式中,表示矩阵与向量的按位相乘。注意到,对顾客和商品特征采用相同的注意力权重w
att
。最后根据将key
weight
与拼接特征进行点乘获得融合特征,如下式所示:
[0226]eufusion
=key
weight,1
⊙eunei
+key
weight,2
⊙eukgin
[0227]eifusion
=key
weight,1
⊙einei
+key
weight,2
⊙eikgin
[0228]
其中key
weight,1
表示key
weight
前d维元素组成的向量,key
weight,2
则属于后d维元素组成的向量。获取注意力融合特征后,将采取内积相似度进行预测,如下式所示。
[0229][0230]
式中,*表示向量的卷积运算。在训练时,采取通用的bpr损失训练模型,如下式所示:
[0231][0232]
其中是由交互正集和交互负集组成的训练集,σ(
·
)是sigmoid函数,结合正则化以防止模型过拟合和梯度消失,最终损失函数如下式所示。
[0233][0234]
其中θ是模型的参数集,如w
rp
和w
att
,λ是控制l2正则化的超参数以防止过拟合。
[0235]
本研究主要将kgin-r与以下同样利用知识图进行推荐的算法进行了比较:mf矩阵分解,经典的协同过滤方法,将顾客-商品交互矩阵进行矩阵分解进行降维处理以适用大矩阵,从而分别获取顾客和商品的特征表示。(2)基本的kgin推荐算法。利用商品知识图谱kg构建顾客意图,利用顾客-商品访问日志l深度学习提取意图特征,商品浏览邻接图谱ng不参与到算法模型中。
[0236]
推荐采用全排名策略,具体来说,对于数据集中的每个顾客,将顾客有效浏览过的商品组成正集,其余的组成负集。推荐算法将对每一个(u,i)对进行评分,对于一个顾客u,选择评分最高的k个商品组成推荐列表,然后计算top-k推荐性能。本研究采用广泛使用的
评价指标,包括:召回率recall、归一化折损累积增益ndcg(normalized discounted cumulative gain)和命中率hr(hit ratio)。recall表示推荐测试集中商品命中率,hr可以认为是顾客命中率,从整体表示表现推荐商品命中情况,即只要推荐的商品在正集中就认为模型拥有为顾客推荐偏好商品的能力,ndcg则考虑推荐列表商品排名位置对顾客的吸引力,对于相同recall情况下,测试集商品排名越靠前,则ndcg得分越高。这里将k分别设为1、2、10、20,然后以所有顾客评价指标的平均值作为最终评价指标。
[0237]
表中算法列的“提升”表示kgin-df算法相对于kgin算法的指标提升百分比,每一评价指标中最优的结果用粗体标识,次优的结果用下划线标识。可以看出,kgin-df模型除了k=1时recall指标未取得最优外,其余的指标均取得最优,而mf模型的指标最差,且显著低于kgin-df和kgin模型。
[0238]
kgin-df相较于kgin的性能优势可归功于:(1)基于浏览邻接关系的顾客群体意图特征提取和(2)基于注意力机制的双特征融合,浏览邻接关系利用顾客协同过滤思想,从顾客-商品浏览日志中归纳出商品之间的直接联系,从而能根据商品访问的顾客群体意图提前感知顾客个体意图,为顾客提供更加有效的推荐列表。从ndcg指标上,可以看出kgin-df相较于kgin取得14.03%至23.56%的显著提升,该指标是针对推荐商品排名得分,能更加全面的反映出推荐列表的有效性。kgin模型因为没有浏览邻接图谱的协同特征提取,推荐偏向商品知识图谱刻画的个体交互意图,使得排序结果较kgin-df差,结合进一步验证了本技术提出的kg和ng双特征协同提取与融合对于提升推荐性能的有效性。
[0239]
mf在实验中性能表现较差,因为矩阵分解模型未能充分利用知识图谱的关系优化商品的特征表示,仅依靠访问日志l构建商品的特征,当顾客-商品交互信息稀疏时,提取的顾客特征是不全面的,推荐列表很难符合顾客意图。这也验证了商品知识图谱kg在推荐中的有效性。
[0240]
综上分析可以得出结论:(1)本技术构建的商品知识图谱kg结合kgin算法能够有效地提取b2b纺织品电商平台的顾客访问意图特征;(2)本技术构建的商品浏览邻接图谱ng,结合提出的改进算法kgin-df,能够进一步提升b2b纺织品电商平台的推荐性能。
[0241]
实施例三
[0242]
请参阅图20,图20是本发明实施例公开的基于知识图谱深度学习的电子商务推荐系统的结构示意图。如图20所示,该基于知识图谱深度学习的电子商务推荐系统可以包括:
[0243]
接收模块21:用于接收应用接口端传输的浏览信息,所述浏览信息为相应用户电子商务平台处的操作内容,其中,所述浏览信息包括商品信息和浏览日志;所述浏览日志包括浏览器ip地址信息;并基于所述浏览器ip地址信息确定顾客信息;
[0244]
实体抽取模块22:用于将所述浏览信息发送至预先构建完成的商品关系图谱模型来进行实体关系抽取以得到顾客商品交互矩阵;在所述商品关系图谱模型采用资源描述框架来对商品属性关系和商品归属关系进行描述,所述商品属性关系被表述为商品编号、属性关系和属性值编号的三元组形式,所述商品归属关系被表述为商品编号、归属于和店铺编号的三元组形式;
[0245]
推荐模块23:用于将所述浏览信息和顾客商品交互矩阵传输至推荐算法模型来进行推荐识别以确定相应顾客的商品推荐结果。
[0246]
本发明实施例的基于知识图谱深度学习的电子商务推荐方法通过对知识图谱和
浏览日志进行深度学习,输出反映顾客浏览偏好的推荐结果;应用接口模块则接受上层应用的对推荐结果的检索,实现推荐应用的集成;本实施例的推荐方法能捕获顾客对商品的偏好特征,支持个性化商品推荐,提升顾客对电子商务平台的商品浏览效率。
[0247]
以上对本发明实施例公开的基于知识图谱深度学习的电子商务推荐方法、系统、电子设备及存储介质进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

技术特征:
1.一种基于知识图谱深度学习的电子商务推荐方法,其特征在于,包括:接收应用接口端传输的浏览信息,所述浏览信息为相应用户电子商务平台处的操作内容,其中,所述浏览信息包括商品信息和浏览日志;所述浏览日志包括浏览器ip地址信息;并基于所述浏览器ip地址信息确定顾客信息;将所述浏览信息发送至预先构建完成的商品关系图谱模型来进行实体关系抽取以得到顾客商品交互矩阵;在所述商品关系图谱模型中采用资源描述框架来对商品属性关系和商品归属关系进行描述,所述商品属性关系被表述为商品编号、属性关系和属性值编号的三元组形式,所述商品归属关系被表述为商品编号、归属于和店铺编号的三元组形式;将所述浏览信息、顾客商品交互矩阵和商品关系图谱模型传输至推荐算法模型来进行推荐识别以确定相应顾客的商品推荐结果。2.如权利要求1所述的基于知识图谱深度学习的电子商务推荐方法,其特征在于,所述推荐算法模型包括预测函数模型,所述预测函数模型通过如下步骤构建得到:基于浏览日志l将顾客-商品交互集(u,i)划分为交互正集和交互负集如果浏览日志l中存在顾客u对商品i的访问记录,则确定否则其形式化表示如下:如下:将所述交互正集交互负集商品浏览邻接图谱ng、商品知识图谱kg输入至预先构建的预测函数公式来进行预测以得到相应的预测结果;所述预测函数公式为:其中,表示的预测评分,f表示预测函数,u为顾客信息,u为顾客矩阵,且u={u1,u2,

,um},i为商品信息,i为商品矩阵,且i={i1,i2,

,in}。3.如权利要求1所述的基于知识图谱深度学习的电子商务推荐方法,其特征在于,在所述将所述浏览信息发送至预先构建完成的商品关系图谱模型来进行实体关系抽取以得到顾客商品交互矩阵之后,还包括:将所述浏览信息与商品关系图谱kg进行结合,并采用kgin算法来进行顾客-商品交互个体的意图提取以得到相应的个体意图特征;将访问日志l与商品浏览邻接图谱ng相结合,采用图聚合运算进行群体的顾客-商品交互群体意图提取以得到相应的群体意图特征;采用注意力机制将所述个体意图特征和群体意图特征进行特征融合以形成融合特征,并根据所述融合特征评估顾客对商品的兴趣评分。4.如权利要求3所述的基于知识图谱深度学习的电子商务推荐方法,其特征在于,所述将所述浏览信息与商品关系图谱模型进行结合,并采用kgin算法来进行顾客-商品交互个体的意图提取以得到相应的个体意图集合,包括:将获取到的顾客-商品组(u,i)分解为意图集c={(u,p,i)|p∈p};将原有的顾客交互记录重组为意图图ig;采用kgin算法将意图与商品关系图谱kg进行关联,将顾客的意图p定义为知识图谱中
不同关系的非线性组合,该意图的嵌入式表示为:其中,e
r
是关系r的初始表示向量,将关系r赋予注意力分数α(r,p)来量化其重要性,w
rp
是特定关系r和特定意图p的可训练权重,是d维随机初始的向量,w
r

p
表示同关系下其它的意图权重;在意图图ig中,使用n
u
={(,i)|(,p,i)∈c}来表示顾客u周围的意图感知历史和一阶连通性,通过嵌入公式来用历史的意图感知信息整合表示顾客的嵌入表示:式中,是顾客u的kgin一阶路径聚合的特征表示,

表示点积运算,β(u,p)则是区分个体顾客意图的权重,e
pt
表示e
p
的转置向量,exp表示指数运算,e
p

t
表示其它意图向量的转置;kgin算法采用基于关系和节点的特征聚合方式以得到商品i的特征聚合kgin算法采用基于关系和节点的特征聚合方式以得到商品i的特征聚合其中,n
i
是以商品i为头实体相关联的三元组集合,则是商品i对应的尾实体v嵌入表示,重复上述步骤获得更深层的信息表示,将每层信息采用多层聚合从而获得更广阔的感受野,获得kgin的最终商品和顾客特征表示如下:受野,获得kgin的最终商品和顾客特征表示如下:式中,q为聚合层数;所述将访问日志l与商品浏览邻接图谱ng相结合,采用图聚合运算进行群体的顾客-商品交互群体意图提取以得到相应的群体意图特征采取一阶聚合获取顾客和商品的浏览邻接关系特征,商品i的浏览邻接特征e
inei
表示如下:其中,n
inei
表示与商品i存在浏览邻接关系的所有商品集合,j是n
inei
中的商品,e
j
是商品j的初始表示向量;根据顾客-商品交互关系进行顾客偏好的描述以得到顾客浏览邻接特征,顾客u的浏览邻接特征e
unei
表示如下:
其中,n
u
是顾客u的浏览商品集合。5.如权利要求4所述的基于知识图谱深度学习的电子商务推荐方法,其特征在于,所述采用注意力机制将所述个体意图特征和群体意图特征进行特征融合以形成融合特征,并根据所述融合特征评估顾客对商品的兴趣评分,包括:根据拼接公式将浏览邻接特征和kgin特征在同维度上进行拼接操作以得到拼接特征向量,所述拼接公式为:e
uconcat
=e
unei
||e
ukgin
e
iconcat
=e
inei
||e
ikgin
其中,e
uconcat
和e
iconcat
分别表示顾客u和商品i的拼接特征,||表示向量拼接运算;将所述拼接特征向量与注意力权重w
att
进行相乘并采用归一化,挑选出关键性特征的权重key
weight
;对顾客和商品特征采用相同的注意力权重w
att
,根据key
weight
与拼接特征进行点乘获得融合特征e
ufusion
和e
ifusion
;将所述融合特征输入至预测公式中来进行预测以得到顾客对商品的兴趣评分,所述预测公式为:6.如权利要求1所述的基于知识图谱深度学习的电子商务推荐方法,其特征在于,在所述接收应用接口端传输的浏览信息之后,还包括:对所述浏览信息进行数据清洗操作以对浏览日志中的非商品浏览记录以及商品字段缺失浏览记录进行过滤操作;对经过过滤操作的浏览信息进行有效性判断,当对一顾客对同一商品的浏览次数或者浏览时间超过第一设定值时,则确定该商品对顾客有效,否则对相应的浏览信息进行过滤。7.如权利要求1所述的基于知识图谱深度学习的电子商务推荐方法,其特征在于,所述商品关系图谱模型通过如下步骤构建完成:获取相应电子商务平台处的商品属性信息;从所述商品属性信息中提取多个商品实体、商品属性以及店铺实体,并确定所述多个商品实体之间、商品实体与店铺实体之间以及商品实体与商品属性之间的关系;基于多个商品实体之间、商品实体与店铺实体之间以及商品实体与商品属性之间的关系构建商品关系图谱模型。8.如权利要求7所述的基于知识图谱深度学习的电子商务推荐方法,其特征在于,在从所述商品属性信息中提取多个商品实体、商品属性以及店铺实体之后,还包括:从历史浏览信息中基于顾客商品的浏览关系以确定商品之间的浏览邻接关系;所述浏览邻接关系为在一个会话周期内若浏览多个商品,则多个商品之间互为浏览邻接关系;当互为浏览邻接关系次数达到第二设定值时,则确定该商品之间存在浏览邻接关系。9.一种基于知识图谱深度学习的电子商务推荐系统,其特征在于,包括:接收模块:用于接收应用接口端传输的浏览信息,所述浏览信息为相应用户电子商务平台处的操作内容,其中,所述浏览信息包括商品信息和浏览日志;所述浏览日志包括浏览
器ip地址信息;并基于所述浏览器ip地址信息确定顾客信息;实体抽取模块:用于将所述浏览信息发送至预先构建完成的商品关系图谱模型来进行实体关系抽取以得到顾客商品交互矩阵;在所述商品关系图谱模型采用资源描述框架来对商品属性关系和商品归属关系进行描述,所述商品属性关系被表述为商品编号、属性关系和属性值编号的三元组形式,所述商品归属关系被表述为商品编号、归属于和店铺编号的三元组形式;推荐模块:用于将所述浏览信息和顾客商品交互矩阵传输至推荐算法模型来进行推荐识别以确定相应顾客的商品推荐结果。10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储计算机程序,其中,所述计算机程序使得计算机执行权利要求1至8任一项所述的基于知识图谱深度学习的电子商务推荐方法。

技术总结
本发明实施例涉及电子商务技术领域,公开了一种基于知识图谱深度学习的电子商务推荐方法,包括:接收应用接口端传输的浏览信息;将浏览信息发送至预先构建完成的商品关系图谱模型来进行实体关系抽取以得到顾客商品交互矩阵;将浏览信息、顾客商品交互矩阵和商品关系图谱模型传输至推荐算法模型来进行推荐识别以确定相应顾客的商品推荐结果。本发明实施例推荐方法通过对知识图谱和浏览日志进行深度学习,输出反映顾客浏览偏好的推荐结果;应用接口模块则接受上层应用的对推荐结果的检索,实现推荐应用的集成;本实施例的推荐方法能捕获顾客对商品的偏好特征,支持个性化商品推荐,提升顾客对电子商务平台的商品浏览效率。率。率。


技术研发人员:郭志勇
受保护的技术使用者:广州科拓科技有限公司
技术研发日:2023.06.19
技术公布日:2023/9/16
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐