基于图表示学习的多视角个体观点预测方法及系统
未命名
08-26
阅读:115
评论:0
1.本发明涉及知识图谱领域,特别是涉及一种个体用户观点预测的方法及系统。
背景技术:
2.随着web2.0技术的迅猛发展,facebook、twitter、微信、微博、豆瓣等社交平台的涌现,大数据时代来临,互联网成为继报纸、广播和电视之后的“第四媒体”。互联网的发展促进了大量用户数据的产生。这些海量的数据中包含用户对各个话题的直接评论,也包含用户浏览、点赞、转发等不直接表达观点倾向的行为,这些数据或直接或间接地表现了用户对不同对象的观点倾向。从这些数据中获取到用户的观点,并从这些数据中挖掘出有价值的信息,不仅可以帮助政府了解民生、制定合理的政策,也可以帮助各大公司对产品进行监控,出现问题时迅速改正,有着现实的应用价值。
3.现有的个体观点预测方法大体上可以分为两类,基于观点演化规则的个体观点预测方法和基于图表示学习的个体观点预测方法。基于观点演化规则的个体观点预测方法根据社会学理论,人为制定观点间的交互规则,从而预测观点的演化。基于图表示学习的个体观点预测方法使用图表示学习模型建模观点持有者和观点对象,得到观点持有者和对象的向量表示,然后使用分类器进行预测。
4.基于观点演化规则的个体观点预测方法根据社会学理论,人为制定观点间的交互影响及演化规则,然后基于已有个体观点数据,在给定的观点网络结构模拟观点的演化,从而预测个体观点。sznajd等人提出sznajd模型,这个模型的核心思想是两个人说服比一个人说服更有效果,每个个体的观点是由其周围邻居来决定的。这个模型定义个体间的简单交互规则,认为个体间的交互行为使得个体容易受他人影响,因此在交互过程中个体会完全抛弃自我观点,而选择完全采纳其他个体的观点。ochrombel等人改进了该模型,在sznajd模型的基础上加入意见领袖的概念,意见领袖可以完全改变其他个体的观点,并能保持自身观点不变。toscani等人利用sznajd模型分析了个体观点变化的因素和全局观点同化的规则。
5.deffuant模型将个体观点交互设计为随机过程,即对随机抽取的两个个体的观点进行比较,若观点差值小于某一设定的阈值,则这两个个体进行交互,否则不进行交互。hk模型考虑到个体观点通常受到多个个体观点的影响,因此在遍历个体所有邻居节点的观点之后,会选择满足阈值范围的邻居观点的均值进行交互。
6.bu等人提出gk-means模型,使用启发式方法识别网络中的意见领袖,然后采用动态博弈模型进行社区识别,在社区内部采用基于lhn指数的意见动态模型模拟意见矩阵的演变。he等人提出domf模型,该模型基于观点最大化的思想,首先使用q-learning理论在每个阶段动态生成节点的观点,然后使用多阶段启发式模型选择种子节点,根据观点传播预测观点的演化。
7.基于图表示学习的个体观点预测方法将用户和观点对象看作图上的节点,观点看作图上的边,边的正负极性与观点的极性相同。这类方法根据结构平衡、社会地位等社会学
理论定义模型目标函数,在由用户观点构成的网络上使用图表示学习模型进行用户建模,最后使用分类器进行观点预测。
8.cartwright等人将平衡理论由三元闭包扩展到任意环路中,只要环路中负边的个数为偶数,该环路就是平衡的,若负边个数为奇数,那么该环路是不平衡的,其中的观点会发生改变。cygan等人对平衡理论进行了一般化,用户与积极观点的对象更相似,与消极观点的对象更有区分度。社会地位理论一般用于有向网络,网络中每个人都有相应的社会地位,每个人会向社会地位更高的人产生正向边,向社会地位低的人产生负边。
9.sine模型使用查询表编码节点的向量表示,依据扩展后的平衡理论设计目标函数,目标函数类似负采样的间隔损失函数,将正样本替换为与朋友邻居的相似度,将负样本替换为与敌人邻居的相似度。如果节点周围只有朋友节点,那么模型会生成一个虚构节点,作为目标节点的敌人邻居。sne模型借鉴skip-gram模型,在已知路径前置节点的情况下,使用对数双线性模型预测目标节点,来学习每个节点的向量表示。模型给正边和负边不同的权值,来捕获路径上边的符号信息。side模型将随机游走算法引入有向观点网络中,生成截断随机游走路径,将图结构转化为序列结构,通过节点在随机游走中的共现频率学习观点网络中的邻域信息。同时在目标函数中,极大化正节点对的似然概率,极小化负节点对的似然概率。
10.sgcn模型是带符号的gcn模型。依据结构平衡理论,sgcn模型定义了平衡集和非平衡集,并使用两个独立的聚合器,分别聚合目标节点平衡集中的节点信息和非平衡集中的节点信息。在目标函数中,模型要求正节点对间的距离小于无连接节点对,无连接节点对的距离小于负节点对。在此基础上,sigat模型将gat模型引入符号图。根据连边的符号和方向,模型定义了38种三角模体(motif),对不同的模体使用独立的聚合器进行邻居节点的信息聚合,最后使用mlp聚合不同模体的信息。shine将人物的背景知识和交互信息引入观点预测中,使用三个独立的自编码器分别提取观点网络、关注社交网络以及人物属性网络的人物向量,然后将三个向量拼接为人物的嵌入向量,使用向量内积进行观点预测。snea模型将自注意力机制引入符号图,定义了节点的平衡集和非平衡集,根据结构平衡理论,重新定义了符号图中的聚合操作和目标函数,并在聚合时计算每个节点的权重。sdgnn模型考虑了观点的有向性,根据观点的方向和极性定义了四种关系,据此将每个节点的邻居分为四个集合,使用不同的聚合函数进行聚合,得到节点的向量表示,并依据社会地位理论设计了新的损失函数。
11.然而,已有的个体观点预测方法存在两个问题。
12.第一是已有方法依靠观点间的交互关系进行观点预测,预测时只使用了用户显式的观点数据,但是由于大部分用户很少直接表达自己的观点,一般只对相关其他用户发表的文章进行点赞、转发或收藏,因此显式的观点数据较少,已有方法面临数据稀疏的问题。
13.第二是已有方法没有考虑发表观点的时间,已有方法要么人为构造虚拟数据,模拟观点演化的过程,要么将不同时刻发表的观点看作静态的数据,没有建模观点发表的时间信息,忽视了用户的历史观点以及观点的转变。
技术实现要素:
14.为解决上述现有技术的观点数据稀疏以及缺少时间建模的问题,本发明提出了一
种基于图表示学习的多视角个体观点预测方法。具体包括:分别构建观点持有者的背景知识图谱、交互行为网络和观点网络;以该观点持有者、目标观点对象和观点生成时刻为要素,构建观点预测任务的目标三元组;从该背景知识图谱、该交互行为网络和该观点网络,分别获取该观点持有者的知识向量、交互行为向量和观点向量;将该知识向量、该交互行为向量和该观点向量通过分类器,输出该目标三元组对应的观点预测结果。
15.本发明所述的多视角个体观点预测方法,其中对于该目标三元组(u,v,t),将该知识向量emb
kg
(u,v,t)、该交互行为向量emb
in
(u,v,t)和该观点向量emb
on
(u,v,t)进行均匀池化,得到最终三元组表示向量emb(u,v,t),将emb(u,v,t)输入该分类器进行观点预测,以得到的观点极性s作为该观点预测结果;其中,u表示该观点持有者,v表示该目标观点对象,t表示该观点生成时刻,当s=0时表示u对v持有负面观点,当s=1时表示u对v持有正面观点。
16.本发明所述的多视角个体观点预测方法,使用l层的图注意力网络作为知识图谱编码器encoder
kg
,编码该背景知识图谱,编码该背景知识图谱具有知识图谱三元组(u,v,r),表示u与v之间存在关系r;获取emb
kg
(u,v,t)的步骤包括:通过encoder
kg
,从学习该观点持有者的背景知识信息,并获取emb
kg
(u,v,t);其中,从中随机抽取多个知识图谱三元组作为正样本,并随机生成相同数量个不存在于中且与该知识图谱三元组具有相同结构的三元组作为负样本;以该正样本和该负样本训练encoder
kg
,并使用交叉熵作为目标函数l
kg
。
17.使用拓扑时序编码模型作为交互网络编码器encoder
in
,编码该交互行为网络,编码该交互行为网络具有交互行为三元组(u,v,t),表示u与v在t时刻发生了交互行为;获取emb
in
(u,v,t)的步骤包括:通过encoder
in
,从学习该观点持有者的动态行为信息,并获取emb
in
(u,v,t);其中,从中随机抽取多个交互行为三元组作为正样本,并随机生成相同数量个不存在于中且与该交互行为三元组具有相同结构的三元组作为负样本;以该正样本和该负样本训练encoder
in
,并使用交叉熵作为目标函数l
in
。
18.使用拓扑时序编码模型作为观点网络编码器encoder
on
,编码该观点网络,编码该观点网络具有观点四元组(u,v,s,t),表示u在t时刻对v的观点是s;
19.获取emb
on
(u,v,t)的步骤包括:通过encoder
on
,从学习该观点持有者的观点信息,并获取emb
on
(u,v,t);其中,从中随机抽取多个正面观点四元组作为正样本,及等量个负面观点四元组作为负样本;以该正样本和该负样本训练encoder
on
,并使用交叉熵作为目标函数l
on
。
20.本发明所述的多视角个体观点预测方法,其中该观点预测任务的损失函数l
total
=l
op
+λ1l
kg
+λ2l
in
+λ3l
on
;l
op
为该分类器的目标函数,l
kg
为编码该背景知识图谱的目标函数,l
in
为编码该交互行为网络的目标函数,l
on
为编码观点网络的目标函数,λ1、λ2和λ3为超参数。
21.本发明还提出一种基于图表示学习的多视角个体观点预测系统,包括:初始化模块,用于以观点持有者、观点对象和观点生成时刻三个要素,构建为对该观点持有者进行观
点预测任务的目标三元组;获取该观点持有者的用户信息网络;预测模块,用于通过该用户信息网络分别获取该观点持有者的知识向量、交互行为向量和观点向量;将该知识向量、该交互行为向量和该观点向量通过分类器,输出该目标三元组对应的观点预测结果。
22.本发明所述的多视角个体观点预测系统,其中该任务模块包括观点预测模块,用于获取该观点预测结果;对于该目标三元组(u,v,t),将该知识向量emb
kg
(u,v,t)、该交互行为向量emb
in
(u,v,t)和该观点向量emb
on
(u,v,t)进行均匀池化,得到最终的三元组表示向量emb(u,v,t),将emb(u,v,t)输入该分类器进行观点预测,以得到的观点极性s作为该观点预测结果;其中,u表示该观点持有者,v表示该观点对象,t表示该观点生成时刻,当s=0时表示u对v持有负面观点,当s=1时表示u对v持有正面观点。
23.本发明还提出一种计算机可读存储介质,存储有计算机可执行指令,其特征在于,当该计算机可执行指令被执行时,实现如前所述的基于图表示学习的多视角个体观点预测方法。
24.本发明还提出一种数据处理装置,包括如前所述的计算机可读存储介质,当该数据处理装置的处理器调取并执行该计算机可读存储介质中的计算机可执行指令时,实现基于图表示学习的多视角个体观点预测。
附图说明
25.图1是本发明的基于图表示学习的多视角个体观点预测系统示意图。
26.图2是本发明的交互行为网络编码示意图。
27.图3是本发明的数据处理装置示意图。
具体实施方式
28.为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图,对本发明进一步详细说明。应当理解,此处所描述的具体实施方法仅仅用以解释本发明,并不用于限定本发明。
29.发明人在进行个体观点预测研究时,发现现有技术面临数据稀疏的问题,对于大部分观点数据较少的用户,预测效果较差,甚至无法预测,这是因为现有技术只使用用户观点这一单一数据,而大部分用户很少显式地表达自己的观点,因此观点本身比较稀疏,从而导致现有技术存在数据稀疏的问题。同时发明人发现现有技术面临无法预测特定时刻的观点的问题,这是由于现有技术没有建模观点的时间信息导致的。
30.通过对数据稀疏问题进行调研,发明人发现可以通过引入用户的背景知识和交互行为信息,使用图表示学习方法从多个视角建模用户信息的方法来缓解数据稀疏问题。而通过对动态图表示学习方法进行调研,发明人发现可以通过将动态图表示学习方法与观点数据独特的社会学性质相结合,建模观点的时间信息来解决预测特定时刻观点的问题。
31.基于以上两点,发明人提出了一种基于图表示学习的多视角个体观点预测方法,将用户背景知识、交互行为信息和观点数据进行统一表征,同时将动态图表示学习方法与观点性质结合,建模时间信息,实现对个体用户在特定时刻的观点的预测。
32.本发明的多视角个体观点预测方法,通过引入用户的观点数据、交互行为数据和背景知识数据进行综合建模,使用多视角用户建模框架整合这三类用户数据;使用多角度
用户信息进行联合预测,提高个体观点预测的准确率,对于缺少观点数据的用户也可以进行有效的观点预测;
33.此外,还将动态图表示学习方法与观点的社会学性质相结合,建模观点的时间信息;实现了对特定时刻用户观点的预测,并提高了个体观点预测的准确率。
34.下面结合附图,对本发明的基于图表示学习的多视角个体观点预测方法进行详细介绍。
35.首先,定义个体观点预测任务为:给定用户背景知识图谱交互行为网络和观点网络以及需要预测的三元组(u,v,t),预测观点持有者(实体u)在t时刻对观点对象(实体v)的观点极性s,s=0表示反对或持有负面观点,s=1表示支持或持有正面观点。其中,背景知识图谱是知识图谱三元组(u,v,r),表示实体u和实体v之间有关系r;交互行为网络是交互行为三元组(u,v,t),表示实体u和实体v在t时刻发生了交互行为;观点网络是观点四元组(u,v,s,t),表示实体u在t时刻对实体v的观点是s,s=0表示,s=1表示正面观点。如图1所示,本发明的多视角个体建模框架整体结构分为四个主要组成部分,包括知识图谱编码、观点网络编码、交互网络编码和观点预测。知识图谱编码主要编码动态用户信息网络中的背景知识图谱,得到实体的本征表示和群体标签特征,为观点网络编码和交互网络编码提供初始化向量。观点网络编码和交互网络编码分别编码动态用户信息网络中的观点网络和交互行为网络,得到三元组的观点向量和行为向量。观点预测模块将三元组的知识向量、观点向量和行为向量相加,通过一个多层神经网络分类器计算观点值,输出个体观点的预测结果。
36.一、知识图谱编码
37.知识图谱编码器encoder
kg
使用l层的图注意力网络来编码背景知识图谱,学习用户的背景知识信息。编码器的每一层都包含三个基本组成部分:多头注意力模块、信息传播函数和聚合函数。
38.给定三元组(u,v,t),多头注意力模块会根据实体类型φ(
·
)和关系类型ψ(
·
),计算头实体u和尾实体v间的注意力权重α
(u,r,v)
[0039][0040]
其中n(v)表示实体v的邻居节点集合,φ(
·
)和ψ(
·
)是类型函数,会输出实体和关系的类型,和分别表示头实体u和尾实体v在第l-1层模型的向量。和表示受实体u和v的类型控制的第i个转移矩阵,w
ψ(r)
表示受关系r的类型控制的转移矩阵,d表示实体向量的维度。
[0041]
接下来,信息传播函数会根据关系r计算从头实体u传递给尾实体v的信息向量m
(u,r,v)
。
[0042][0043]
然后,聚合函数会使用注意力权重聚合邻居节点传递过来的消息向量,并更新尾
实体v的向量表示。
[0044][0045]
最终,encoder
kg
最后一层的输出h
(
l)就是背景知识图谱中节点的嵌入式向量v
kg
,观点预测三元组(u,v,t)的背景知识向量emb
kg
(u,v,t)为u和v两个向量的拼接。
[0046]
本发明在背景知识图谱上进行链接预测子任务,随机从背景知识图谱中抽取部分三元组作为正样本,并随机生成背景知识图谱中不存在的三元组作为负样本,正样本与负样本的数量相同,任务为预测三元组是否存在于背景知识图谱中,从而学习个体的背景知识。本发明使用交叉熵作为知识图谱编码器子任务的目标函数l
kg
。
[0047]
二、交互网络编码
[0048]
交互网络编码器encoder
in
使用拓扑时序编码模型来编码用户的交互行为网络,学习用户的动态行为信息,如图2所示,包括:
[0049]
(1)时序约束的随机游走策略
[0050]
给定观点预测三元组(u,v,t),encoder
in
首先以u和v为起点,沿着交互行为网络上的边做时序约束的随机游走,采样长度为w历史交互路径bw(u,t)=[i0,...i
w-1
]。时序约束要求采样过程中路径时间戳单调不增。一般来说,时序关系是因果关系的必要条件,因此单调不增的时序约束可以帮助模型捕获交互间的因果关系,增强模型对于用户交互行为的学习。随机游走过程中,下一跳节点的采样概率函数以更高的概率采样发生时间相近的交互行为。本发明分别对目标u和v采样n条长度为w的随机游走路径,构成节点的行为上下文路径集合{wu,wv}。
[0051]
(2)双视角匿名化
[0052]
本发明使用双视角匿名化策略对采样得到的游走路径集合进行匿名化,得到新的匿名化路径aw=[aw
p
,awg]。双视角匿名化策略主要包括路径视角匿名化和组视角匿名化两部分。
[0053]
路径视角匿名化模块进行节点匿名化时只考虑单独一条路径,节点的标识被替换为它在本条路径中第一次出现的位置。给定游走路径bw(u,t7)=[b,u,d,c,u],其中u第一次在路径中出现的位置是2,因此节点u被匿名化为节点2,匿名化后的路径为[1,2,3,4,2]。
[0054]
组视角匿名化模块进行节点匿名化时考虑整个游走路径集合,生成匿名化向量作为节点的组视角标识。节点a的组视角匿名化向量igka可以看作是节点在游走路径集合中出现位置的期望分布,向量第i维的值代表节点出现在路径第i维的频率。最终awg表示为一个向量序列,例如路径[v,a,u,b,v]的awg=[igkv,igka,igku,igkb,igkv]。
[0055]
(3)拓扑时序编码模块
[0056]
得到匿名化路径后,本发明使用拓扑时序编码模块对路径集进行编码。首先本发明使用拓扑编码器对路径视角匿名化路径进行编码。本发明首先根据匿名化路径的字典序将路径编号为awf1、awf2...,例如当路径长度w=5时,awf1=(1,2,1,2,1),awf2=(1,2,1,2,3),awf3=(1,2,1,3,1)。然后本发明统计awfk在路径集合{awu,awv}上出现的频率拓扑向量topoemb(u,v,t)的每一维表示对应的匿名化路径在路径集合中出现
的频率。
[0057][0058]
然后本发明使用时序编码器对组视角匿名化路径进行编码。考虑到路径采样满足时序约束,本发明使用gru对这类时间序列进行编码。虽然gru编码了交互的时间顺序,但是它没有考虑交互发生的时间差。直觉上发生时间越接近的行为之间的因果性越强,因此本发明提出了时态gru模块,修改了gru的循环组件,从而建模交互时间差的影响。
[0059]
首先为了能够建模时间差,本发明借鉴time2vec方法,使用傅里叶变换将实数域的时间差值映射为d维的向量t2v(δt)
[0060]
t2v(δt)=[cos(w1δt+φ1),...,cos(wdδt+φd)]
[0061]
其中w和φ是傅里叶变换函数的权重参数。
[0062]
在每个时间步中,时态gru除了接收上一刻的隐状态向量和当前时刻的输入向量外,还要接受上一个时间步的时间差向量和观点的极性。本发明用时间差向量t2v(δt)来编码重启门rk,从而让交互的时间差控制上一个状态是否被存储,修正后的重启门rk公式如下:
[0063]rk
=σ(wrt2v(δtk)+u
rhk-1
)
[0064]
其中wr、ur是时态gru的权重和偏置参数,σ是sigmoid函数。δtk是第k个交互行为与第k-1个交互行为的时间差,初始的δt0设置为0。路径的时态编码向量是时态gru最后一个时间步的状态向量h
w-1
,整个路径集合的时态编码向量tempemb(u,v,t)是所有路径时态向量的均匀池化。
[0065]
最终本发明将拓扑编码向量topoemb(u,v,t)和时序编码向量tempemb(u,v,t)拼接,通过一个单层神经网络nn后得到三元组(u,v,t)的交互行为向量emb
in
(u,v,t)
[0066]
emb
in
(u,v,t)=nn(concat[topoemb(u,v,t),tempemb(u,v,t)])
[0067]
本发明在交互行为网络上进行观点预测子任务,随机从交互行为网络中抽取部分边(u,v,t)作为正样本,并随机生成交互行为网络中不存在的边作为负样本,正样本与负样本的数量相同,任务为预测三元组是否存在于交互行为网络ε
in
中,从而学习用户的行为信息。本发明使用交叉熵作为交互网络编码器子任务的目标函数l
in
。
[0068]
三、观点网络编码
[0069]
观点网络编码模块的结构与行为网络编码模块的结构类似,同样使用拓扑时序编码模型进行编码。考虑到观点的正负极性对路径信息传递存在影响,因此本发明对模块的路径编码器进行了修改。
[0070]
在使用时态gru进行路径编码时,将观点的极性s映射为一个d维向量o2v(s),其中s∈{0,1},s=0表示反对,s=1表示支持。观点网络时态gru的重启门rk计算公式如下:
[0071]rk
=σ(wrt2v(δtk)+w
′ro2v(s)+u
rhk-1
)
[0072]
其余公式与交互网络编码器相同,得到观点网络编码向量emb
on
(u,v,t)。本发明在观点网络上进行观点预测子任务,从观点网络中抽取部分边(u,v,s,t)作为训练样本,于本发明的实施例,从观点网络中随机抽取多个正面观点的边作为正样本,并从观点网络中随机抽取相等数量的负面观点边作为负样本;任务为预测观点的类型,从而学习用户的观点
信息。本发明使用交叉熵作为观点网络编码子任务的目标函数,目标函数为l
on
。
[0073]
四、观点预测
[0074]
个体观点预测任务为给定三元组(u,v,t),预测观点持有者u在t时刻对观点对象v的观点倾向性s。通过之前三个模块本发明得到三元组(u,v,t)的背景知识向量emb
kg
(u,v,t)、交互行为向量emb
in
(u,v,t)和观点向量emb
on
(u,v,t),将三个向量进行均匀池化,得到最终的三元组表示向量emb(u,v,t),输入多层神经网络进行最终的观点预测。
[0075]
本发明使用多任务学习框架,通过在各个网络上的子任务学习用户的相关信息,从多个视角建模用户,最终的损失函数l
total
如下。其中l
op
是使用最终的三元组向量进行观点预测的目标函数,使用交叉熵进行计算,λ1、λ2和λ3是超参数。
[0076]
l
total
=l
op
+λ1l
kg
+λ2l
in
+λ3l
on
[0077]
图3是本发明的数据处理装置示意图。如图3所示,本发明实施例还提供一种计算机可读存储介质,以及一种数据处理装置。本发明的计算机可读存储介质存储有计算机可执行指令,计算机可执行指令被数据处理装置的处理器执行时,实现上述基于图表示学习的多视角个体观点预测。本领域普通技术人员可以理解上述方法中的全部或部分步骤可通过程序来指令相关硬件(例如处理器、fpga、asic等)完成,所述程序可以存储于可读存储介质中,如只读存储器、磁盘或光盘等。上述实施例的全部或部分步骤也可以使用一个或多个集成电路来实现。相应地,上述实施例中的各模块可以采用硬件的形式实现,例如通过集成电路来实现其相应功能,也可以采用软件功能模块的形式实现,例如通过处理器执行存储于存储器中的程序/指令来实现其相应功能。本发明实施例不限制于任何特定形式的硬件和软件的结合。
[0078]
本方法相较已有方法能实现对特定时刻个体观点的预测,引入用户背景知识数据和交互行为数据,从多个视角建模个体用户信息,对于观点数据稀疏的场景,可以使用背景知识数据和交互行为数据进行辅助预测,预测准确率高,泛用性更广;此外,还将动态图表示学习模型与观点的社会学性质相结合,充分建模了观点的时间信息,因此可以预测特定时刻的观点,更接近真实世界的情形。
[0079]
以上实施方式仅用于说明本发明,而并非对本发明的限制,有关技术领域的普通技术人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变化和变形,因此所有等同的技术方案也属于本发明的范畴,本发明的专利保护范围应由权利要求限定。
技术特征:
1.一种基于图表示学习的多视角个体观点预测方法,其特征在于,包括:分别构建观点持有者的背景知识图谱、交互行为网络和观点网络;以该观点持有者、目标观点对象和观点生成时刻为要素,构建观点预测任务的目标三元组;从该背景知识图谱、该交互行为网络和该观点网络,分别获取该观点持有者的知识向量、交互行为向量和观点向量;将该知识向量、该交互行为向量和该观点向量通过分类器,输出该目标三元组对应的观点预测结果。2.如权利要求1所述的多视角个体观点预测方法,其特征在于,对于该目标三元组(u,v,t),将该知识向量emb
kg
(u,v,t)、该交互行为向量emb
in
(u,v,t)和该观点向量emb
on
(u,v,t)进行均匀池化,得到最终三元组表示向量emb(u,v,t),将emb(u,v,t)输入该分类器进行观点预测,以得到的观点极性s作为该观点预测结果;其中,u表示该观点持有者,v表示该目标观点对象,t表示该观点生成时刻,当s=0时表示u对v持有负面观点,当s=1时表示u对v持有正面观点。3.如权利要求2所述的多视角个体观点预测方法,其特征在于,使用l层的图注意力网络作为知识图谱编码器encoder
kg
,编码该背景知识图谱,编码该背景知识图谱具有知识图谱三元组(u,v,r),表示u与v之间存在关系r;获取emb
kg
(u,v,t)的步骤包括:通过encoder
kg
,从学习该观点持有者的背景知识信息,并获取emb
kg
(u,v,t);其中,从中随机抽取多个知识图谱三元组作为正样本,并随机生成相同数量个不存在于中且与该知识图谱三元组具有相同结构的三元组作为负样本;以该正样本和该负样本训练encoder
kg
,并使用交叉熵作为目标函数l
kg
。4.如权利要求2所述的多视角个体观点预测方法,其特征在于,使用拓扑时序编码模型作为交互网络编码器encoder
in
,编码该交互行为网络,编码该交互行为网络具有交互行为三元组(u,v,t),表示u与v在t时刻发生了交互行为;获取emb
in
(u,v,t)的步骤包括:通过encoder
in
,从学习该观点持有者的动态行为信息,并获取emb
in
(u,v,t);其中,从中随机抽取多个交互行为三元组作为正样本,并随机生成相同数量个不存在于中且与该交互行为三元组具有相同结构的三元组作为负样本;以该正样本和该负样本训练encoder
in
,并使用交叉熵作为目标函数l
in
。5.如权利要求2所述的多视角个体观点预测方法,其特征在于,使用拓扑时序编码模型作为观点网络编码器encoder
on
,编码该观点网络,编码该观点网络具有观点四元组(u,v,s,t),表示u在t时刻对v的观点是s;获取emb
on
(u,v,t)的步骤包括:通过encoder
on
,从学习该观点持有者的观点信息,并获取emb
on
(u,v,t);其中,从中随机抽取多个正面观点四元组作为正样本,及等量个负面观点四元组作为负样本;以该正样本和该负样本训练encoder
on
,并使用交叉熵作为目标函数l
on
。6.如权利要求2所述的多视角个体观点预测方法,其特征在于,该观点预测任务的损失函数k
total
=l
op
+λ1l
kg
+λ2l
in
+λ3l
on
;l
op
为该分类器的目标函数,l
kg
为编码该背景知识图谱
的目标函数,l
in
为编码该交互行为网络的目标函数,l
on
为编码观点网络的目标函数,λ1、λ2和λ3为超参数。7.一种基于图表示学习的多视角个体观点预测系统,其特征在于,包括:初始化模块,用于以观点持有者、观点对象和观点生成时刻三个要素,构建为对该观点持有者进行观点预测任务的目标三元组;获取该观点持有者的用户信息网络;预测模块,用于通过该用户信息网络分别获取该观点持有者的知识向量、交互行为向量和观点向量;将该知识向量、该交互行为向量和该观点向量通过分类器,输出该目标三元组对应的观点预测结果。8.如权利要求7所述的多视角个体观点预测系统,其特征在于,该任务模块包括观点预测模块,用于获取该观点预测结果;对于该目标三元组(u,v,t),将该知识向量emb
kg
(u,v,t)、该交互行为向量emb
in
(u,v,t)和该观点向量emb
on
(u,v,t)进行均匀池化,得到最终的三元组表示向量emb(u,v,t),将emb(u,v,t)输入该分类器进行观点预测,以得到的观点极性s作为该观点预测结果;其中,u表示该观点持有者,v表示该观点对象,t表示该观点生成时刻,当s=0时表示u对v持有负面观点,当s=1时表示u对v持有正面观点。9.一种计算机可读存储介质,存储有计算机可执行指令,其特征在于,当该计算机可执行指令被执行时,实现如权利要求1~6任一项所述的基于图表示学习的多视角个体观点预测方法。10.一种数据处理装置,包括如权利要求9所述的计算机可读存储介质,当该数据处理装置的处理器调取并执行该计算机可读存储介质中的计算机可执行指令时,实现基于图表示学习的多视角个体观点预测。
技术总结
本发明提出一种基于图表示学习的多视角个体观点预测方法,包括:分别构建观点持有者的背景知识图谱、交互行为网络和观点网络;以该观点持有者、目标观点对象和观点生成时刻为要素,构建观点预测任务的目标三元组;从该背景知识图谱、该交互行为网络和该观点网络,分别获取该观点持有者的知识向量、交互行为向量和观点向量;将该知识向量、该交互行为向量和该观点向量通过分类器,输出该目标三元组对应的观点预测结果。本发明还提出一种基于图表示学习的多视角个体观点预测系统,以及一种用于多视角个体观点预测的数据处理装置。多视角个体观点预测的数据处理装置。多视角个体观点预测的数据处理装置。
技术研发人员:王元卓 李子健 沈英汉 江旭晖 尹芷仪 沈华伟
受保护的技术使用者:中国科学院计算技术研究所
技术研发日:2023.05.10
技术公布日:2023/8/23
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
