一种融合观点分歧度和情感博弈的谣言检测方法

未命名 10-19 阅读:103 评论:0


1.本发明属于网络舆情分析领域,涉及用户评论分析,尤其涉及一种融合观点分歧度和情感博弈的谣言检测方法。


背景技术:

2.谣言是一种普遍存在的社会现象,其实质是一种以信息传播为特征的集群行为。在实际研究和应用中,多数研究者从谣言“故意伪造”的角度出发,将权威渠道证实确实是伪造虚构的消息认定为谣言。社交媒体的发展加剧了网络谣言的传播,网络谣言的识别和治理的重要性愈加凸显。如今社交平台中谣言的传播速度比历史上任何时期都快,若不对网络谣言加以遏制,将严重危害大众知情权和社会管理秩序。
3.社交媒体中,谣言识别研究具有重要的意义和价值。第一,谣言识别不仅为限制谣言传播提供了前提,也有助于发现现实生活中人们所关心的问题、不易发现的社会现象或社会问题。第二,谣言识别的结果对新闻记者、金融市场、紧急事务处理以及社交媒体上的信息质量等都有积极作用。第三,谣言的生命在于传播,谣言传播规律的研究是谣言识别研究的重要组成部分,谣言识别研究有助于促进信息传播研究的发展。
4.近几年,许多学者对社交媒体上谣言的检测进行了大量的研究。现有谣言检测方法主要分为三类:人工检测方法,基于传统机器学习的检测方法和基于深度学习的检测方法。早期对谣言的自动检测主要基于传统机器学习,即将谣言检测转换为二分类问题进行处理。为了克服传统机器学习需要手动提取特征的局限性,研究者们基于深度学习自动提取信息特征并自动分类。
5.虽然众多学者对谣言预测模型进行了大量的研究,并取得了相当不错的成果,但仍存在一些挑战:
6.1.评论空间的观点分歧性。评论空间观点分歧度的量化需要考虑到诸多因素,其中对文字的情感色彩的分析和评论权重的研究是一大难点,为观点分歧度量化的准确性带来了困难。
7.2.话题情感度的隐蔽性。话题情感度的分析需要考虑到评论情感的影响,评论的正负向情感可以进一步反映出话题的真实情感,如何量化评论情感度对话题情感度的影响力,是一个新的挑战。
8.3.谣言的复杂性和多特征的差异性。谣言特征空间受到多方面的影响,需要提取不同的特征,而不同特征差异往往较大,在融合过程中常会出现信息冗余或信息损失,如何合理设计不同特征的权重是目前研究需要思考的方向。


技术实现要素:

9.为了更准确地对社交网络上的谣言进行检测,本发明提出一种融合观点分歧度和情感博弈的谣言检测方法,
10.从数据平台以及社交平台提供的api接口中获取包含谣言、非谣言和评论转发消
息的多类型话题信息以及相关用户信息;
11.基于话题和用户特征,从各个话题中将用户关系、转发关系、用户行为、评论信息进行特征提取,并结合多项式方程对特征进行融合;
12.将构建的用户、评论分歧特征及话题特征融合为消息影响力,并结合三方认知博弈理论对情感互影响力进行构建,使用dempster组合规则结合引入注意力机制的前期融合和后期融合,利用长短期记忆网络模型建立谣言检测模型;
13.利用长短期记忆网络模型建立谣言检测模型进行谣言检测。
14.本发明可应用于谣言的前期检测和控制,舆情部门可以更及时和精确的对网络谣言进行监控和控制,并在合理的时间进行引导和抑制;也可用于企业产品和服务的推广,有助于广告在目标群体的快速推广和扩散,提升广告的曝光度以及品牌知晓度,以此获得良好的经济社会效益。
附图说明
15.图1本发明一种融合观点分歧度和情感博弈的谣言检测方法的流程图;
16.图2本发明中提取话题语义信息示意图;
17.图3本发明中量化情感影响力的机制;
18.图4本发明评论情感互影响力模型;
19.图5本发明dsmf模型示意图。
具体实施方式
20.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
21.本发明提出一种融合观点分歧度和情感博弈的谣言检测方法,具体包括以下步骤:
22.从数据平台以及社交平台提供的api接口中获取包含谣言、非谣言和评论转发消息的多类型话题信息以及相关用户信息;
23.基于话题和用户特征,从各个话题中将用户关系、转发关系、用户行为、评论信息进行特征提取,提取的特征包括消息自带属性和用户情感影响因素,消息自带属性包括信息基本属性和评论观点分歧度,用户情感影响因素包括用户消息的情感度和用户信誉度;
24.通过长短期记忆网络模型从信息基本属性、评论观点分歧度、用户消息的情感度、用户信誉度中提取得到用于前期融合和后期融合的特征;
25.利用得到的特征基于注意力机制和分类器构建前期融合结果和后期融合结果;
26.使用dempster组合规则对得到的前期融合结果和后期融合结果进行融合,得到融合后的混合融合结果,即得到预测结果。
27.本实施例从在线数据获取、相关属性的提取以及预测模型的构建三个方面对本发明一种融合观点分歧度和情感博弈的谣言检测方法进行说明。
28.(一)在线数据获取
29.获取数据的方式可以是从公开的数据网站,或者是利用成熟的社交网络公共api进行获取。这里需要获取的是社交网络话题在其生命周期内的所有参与者的行为记录以及话题参与记录以及消息的转发情况。话题参与记录需要得到的是话题被转发和评论的时间、参与用户的基本信息和参与用户的好友关系信息(包括关注和被关注信息);话题参与者的行为记录包括该用户历史上所转发和评论的信息,如图1,在本实施例中主要提取的数据包括:用户基本属性、用户历史行为数据以及话题消息数据,话题消息数据和用户历史行为数据包括用户关系、转发关系、用户行为、评论信息。获取三个方面的数据以后,需要对数据进行简单的数据清理并存储,具体包括:
30.s11:简单的数据清洗:通常获取的原始数据都是非结构化的,不能直接用于数据分析。通过简单的数据清洗可以使大部分非结构化数据结构化,使得异常值或空值不再出现,减少对于后续计算带来的不便;
31.s12:数据存储:通过简单数据清晰后的数据需要使用数据库进行存储,通过表结构对数据进行进一步的规范化,并且通过数据库也能够极大的提高数据的检索效率以及表间关系的映射。
32.(二)相关属性的提取
33.根据获取到的数据,提取消息的评论转发信息、用户基本信息、用户关注列表、用户历史行为。可根据数据特点,对时间周期进行具体划分。
34.探究更准确地进行谣言检测,实质上是从消息与用户两个层面提取相关特征并对这些特征进行建模分析。基于此,本文从消息自带属性和用户情感影响因素两个方面,挖掘社交网络上话题消息的深层特征,具体如下:
35.1)消息自带属性
36.信息基本属性包括信息的基础语义内容、包含的表情符号的数量、包含的url数量和hashtag的数量,对谣言的识别具有一定的辅助作用。因此,本实施例中将信息的基本属性定义为:
37.mattri(mi)={text(mi),emojinums(mi),urlnums(mi),tagnums(mi)}
ꢀꢀ
(1)
38.其中,text(mi)表示用户评论mi的基础语义内容,emojinums(mi)表示用户评论mi包含的表情符号的数量,urlnums(mi)表示用户评论mi包含的url数量,tagnums(mi)表示用户评论mi包含的hashtag的数量。
39.谣言和正常信息下的评论分歧性有明显差异,评论分歧度和评论情感值有关,同时,加入情感强度因子,即该条评论的点赞数占所有评论点赞数的比例。因此本实施例中定义评论观点分歧度为:
[0040][0041]
其中,w
senti
(mi)为用户评论mi的情感强度因子,senti(mi)为用户评论mi的情感值,该值本领域技术人员可以基于bosonnlp情感词典计算得出,本发明不再赘述;p{y=senti(mi)|c}表示当用户的情感值y的值为senti(mi)时,用户的情感值在评论集合c中的情感分布概率。
[0042]
2)用户情感影响因素
[0043]
用户通过评论表现出来的情感倾向对于检测谣言话题有着重要作用,通过对用户发表的评论的情感度分析,定义用户情感的内部驱动因素为:
[0044][0045][0046]
其中,posword(mi)为用户评论mi中积极词汇出现的个数,negword(mi)为用户评论mi中消极词汇出现的个数;表示用户支持话题的内部影响因素,表示用户反对话题的内部影响因素。
[0047]
用户的情感倾向往往会受到外部好友群体的影响,因此,根据用户好友中参与话题讨论用户的情感态度定义用户情感外部影响因素为:
[0048][0049][0050]
其中,frinum(ui)表示用户ui参与话题的好友数量,frisupnum(ui)表示用户好友中持正向态度的个数,表示用户支持话题的外部影响因素,表示用户反对话题的外部影响因素。
[0051]
话题空间中高信誉度用户的情感态度对于谣言话题检测往往比其他普通用户的情感态度更有价值。因此定义话题空间中用户信誉度为:
[0052]
cre(ui)=basecre(ui)+authcra(ui)+α
×
fansnum(ui)
ꢀꢀꢀ
(7)
[0053]
其中,basecre(ui)表示全部用户的基础信誉度,authcra(ui)表示用户的官方账号等级,fansnum(ui)表示用户的粉丝数。高质量的话题评论者情感态度对于谣言话题的识别很重要,而高质量的用户往往代表着官方账户或者明星账户,但是官方账户往往比明星账户拥有更高的信誉度,因此通过衰减因子α∈[0,1]弱化明星账户对于用户总体信誉度的影响。
[0054]
3)用户消息的情感度
[0055]
用户的历史行为特征在一定程度上能够表示用户对不同时间段话题的兴趣与看法,我们可以将用户在一个时间段内发布的社交内容当成一篇文章,根据热门话题的变动而将时间段切分成更短的时间片段,这一时间片段内的用户社交内容就是文章中的一个段落,而每个段落都有明确的主题。进一步的,可以将用户发布的每条短文本形式的微博内容当成一个句子。从而我们可以使用doc2vec算法,将用户的历史社交内容表示学习成一个反应用户社交兴趣的向量。
[0056]
考虑到中文语法的特殊性,如果直接使用固定长度的滑动窗口得到目标词语的上下文无疑是存在问题的。针对这个问题,本实施例对目标词语的上下文进行一定的改进,包括:首先将用户发布的微博内容进行中文分词、词性标注,去除无用词性的词汇以及停用
词,得到用户微博内容的候选关键词;再使用tf-idf算法计算每个候选关键词的权重,提取出用户社交内容的信息中心关键词,从而消除社交内容中的噪点,保留用户的主要社交兴趣。词频统计思路如下:
[0057][0058]
其中,count(d,w)为单词w在文档d中出现的次数,count(d,*)为文档d的总词数。
[0059]
逆文档频率的计算方法如下:
[0060][0061]
其中,n(w)为语料库中的文档总数,n(w)为单词出现在多少个文档中。
[0062]
但是,在某些特殊情况下,比如某一个生僻词在语料库中从未出现过,则分母n(w)=0,此时需要对idf做平滑处理,使得没有在语料库中出现的单词也可以得到一个合适的idf值,idf平滑公式如下:
[0063][0064]
得到表示用户历史社交内容的关键词序列后,再使用doc2vec算法对其学习,输出用户历史行为特征向量:
[0065]
d=n
×
fbꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(11)
[0066]
其中,n为谣言话题下的用户数,f为对应用户的历史社交内容兴趣特征表示向量。
[0067]
再通过情感词典得出各文本的情感得分,令情感得分为正的为支持文本,令情感得分为负的为反对文本。情感度计算公式为:
[0068][0069]
其中,w
t
表示博文文本分词后的词语,sentidic表示包含情感值的情感词典,sentideg(w
t
)表示w
t
的情感值,advdeg(w
t
)表示修饰w
t
的程度副词的程度值。
[0070]
4)对用户消息的情感度的修正
[0071]
用户表现出来的情感倾向存在对抗性,情感影响力函数同时受内部和外部因素影响,即用户的对抗情感往往受到内心驱动和外部环境的影响,因此,如图3,综合用户内部因素和外部因素,使用多元线性回归算法,构造用户情感影响力函数,如下:
[0072][0073][0074]
其中,inf
sup
(ui)表示用户u支持话题的情感影响力,inf
obj
(ui)表示用户u反对话题的情感影响力;和分别是用户支持和反对话题情感的内部驱动因素,和分别是用户支持和反对话题情感的外部影响因素;ρ0、ρ1、ρ2是训练得到的多元线性回归算法的偏回归系数,ρ1、ρ2反应内部驱动因素和外部影响
因素在用户情感影响力中所占的比重。
[0075]
考虑到评论的情感倾向可以更真实地反映出话题的情感倾向,本文通过演化博弈理论量化评论正负情感对话题情感的影响力。用户评论该话题会表现出支持或反对,因此本文中有两种博弈策略:“用户评论支持”和“用户评论反对”。用p1、p2分别表示目标话题mi的评论中评论支持和反对的比例,中立评论对目标话题mi的影响并不大,因此不予考虑,所以有p1+p2=1。这两种策略的收益函数为:
[0076]
pro
sup
(ui)=p1×
inf
sup
(ui)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(15)
[0077]
pro
obj
(ui)=p2×
inf
obj
(ui)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(16)
[0078]
进一步,本发明通过演化博弈理论度量正负情感互影响力:
[0079][0080][0081]
其中,mut
sup
(ui)和mut
obj
(ui)表示经过博弈后的积极消息和消极消息对用户ui情感的影响。
[0082]
最后,考虑到用户在表达自己情感时受到其他因素的影响,因此通过情感互影响力对用户的情感进行修正,以此挖掘出用户的真实情感,如图4修正函数为:
[0083][0084][0085]
其中,α、β为调整系数,nsenti(mi)为用户调整前的评论情感倾向,senti(mi)为调整后的情感倾向。
[0086]
(三)预测模型的构建
[0087]
在本实施例中,对待预测的文本的处理包括以下阶段:
[0088]
利用神经网络模型从信息基本属性、评论观点分歧度、用户消息的情感度、用户信誉度中提取特征;在本实施例中选择利用长短期记忆网络模型进行特征提取,长短期记忆网络模型的结构如图2所示,其中,ct-1表示前一个时刻(t-1)的细胞状态;x表示输入数据,可以是一个向量或矩阵,包含当前时间步的输入特征;ft表示遗忘门,它控制着哪些信息需要从细胞状态中被遗忘;it表示输入门,它控制着哪些信息需要被添加到细胞状态中;ot表示输出门,它控制着当前时间步的隐藏状态中有多少信息会被输出;ht-1表示上一个时间步的隐藏状态;xt表示当前时间步的输入数据;σ表示一个用于计算遗忘门、输入门和输出门的激活函数;tanh表示一个非线性激活函数,用于计算新的候选细胞状态和更新隐藏状态;|表示连接操作,用于将先前的细胞状态和隐藏状态与当前的输入数据进行联合处理。
[0089]
基于d-s证据理论中的dempster组合规则,构建特征混合融合模型dsmf,并综合上述信息对话题进行谣言检测。
[0090]
单一的多特征前期融合和后期融合的适用性较差,本文通过dempster组合规则对两种融合方式进行结合,将前期融合和后期融合的输出结果定义为证据理论中的证据,基
本概率分配(basic probability assignment,bpa)为类别概率pe(mi)、p
l
(mi),利用dempster组合规则得到最终的谣言概率p(mi),判断该博文是否是谣言。在证据理论框架下,两组独立mass函数可以通过dempster组合规则进行数据融合。
[0091]
如图5,通过长短期记忆网络模型从信息基本属性、评论观点分歧度、用户消息的情感度、用户信誉度中提取特征分别为r1、r2、r3、r4,将r1、r2、r3、r4输入自注意力机制获取每个特征对应的权重,利用该权重对r1、r2、r3、r4进行加权求和集合得到前期融合结果;
[0092]
将r1、r2、r3、r4分别输入一个全连接层构成的分类器进行处理,利用自注意力机制得到的注意力权值对每个分类器的输出进行加权求和,得到后期融合结果;
[0093]
使用dempster组合规则对得到的前期融合结果和后期融合结果进行融合,得到融合后的混合融合结果,包括:
[0094][0095][0096]
其中,p(n,r|topic)为信息的谣言和非谣言概率分配,a为p(n,r|topic)的取值空间,表示为a∈{谣言,非谣言};me(b)为前期融合证据b的概率分配,即前期融合结果;m
l
(c)为后期融合证据c的概率分配,即后期融合结果;b为前期融合的特征空间,c为后期融合的特征空间;k为证据之间的冲突程度。
[0097]
本模型的输出为y=p(n,r|topic),因为本文讨论的是二分类问题,概率值
[0098]
较大的类别为预测结果,具体可以定义如下:
[0099][0100]
其中,y表示谣言检测模型的输出,当y=1表示话题topic为谣言话题,当y=0表示话题topic为非谣言话题;p(r|topic)为当前话题topic为谣言的概率;p(n|topic)为当前话题topic为非谣言的概率;p(n,r|topic)为当前话题topic为谣言和非谣言概率的集合。
[0101]
以上本实施例中,p(n,r|topic)为一个概率的集合,包括两个概率值,即当前话题topic为谣言的概率p(r|topic)和当前话题topic为非谣言的概率p(n|topic)两个值,模型在最后判断该输入的话题为谣言还是非谣言时,以p(n,r|topic)中较大的一个值为准,可以理解为:当p(n|topic)大于p(r|topic)时,输出值为p(n|topic),即当前话题为非谣言;否则当前话题为谣言话题。
[0102]
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

技术特征:
1.一种融合观点分歧度和情感博弈的谣言检测方法,其特征在于,具体包括以下步骤:从数据平台以及社交平台提供的api接口中获取包含谣言、非谣言和评论转发消息的多类型话题信息以及相关用户信息;基于话题和用户特征,从各个话题中将用户关系、转发关系、用户行为、评论信息进行特征提取,提取的特征包括消息自带属性和用户情感影响因素,消息自带属性包括信息基本属性和评论观点分歧度,用户情感影响因素包括用户消息的情感度和用户信誉度;通过长短期记忆网络模型从信息基本属性、评论观点分歧度、用户消息的情感度、用户信誉度中提取得到用于前期融合和后期融合的特征;利用得到的特征基于注意力机制和分类器构建前期融合结果和后期融合结果;使用dempster组合规则对得到的前期融合结果和后期融合结果进行融合,得到融合后的混合融合结果,即得到预测结果。2.根据权利要求1所述的一种融合观点分歧度和情感博弈的谣言检测方法,其特征在于,信息基本属性包括:mattri(m
i
)={text(m
i
),emojinums(m
i
),urlnums(m
i
),tagnums(m
i
)};其中,text(m
i
)表示用户评论m
i
的基础语义内容,emojinums(m
i
)表示用户评论m
i
包含的表情符号的数量,urlnums(m
i
)表示用户评论m
i
包含的url数量,tagnums(m
i
)表示用户评论m
i
包含的hashtag的数量。3.根据权利要求1所述的一种融合观点分歧度和情感博弈的谣言检测方法,其特征在于,评论观点分歧度包括:其中,w
senti
(m
i
)为用户评论m
i
的情感强度因子,senti(m
i
)为用户评论m
i
的情感值;p{y=senti(m
i
)|c}表示当用户的情感值y的值为senti(m
i
)时,用户的情感值在评论集合c中的情感分布概率。4.根据权利要求1所述的一种融合观点分歧度和情感博弈的谣言检测方法,其特征在于,用户消息的情感度的计算包括:其中,nsenti(m
i
)表示用户评论m
i
的情感度;w
t
表示用户评论m
i
分词后的词语;sentidic表示包含情感值的情感词典;sentideg(w
t
)表示基于bosonnlp情感词典进行得分计算的w
t
的情感值,advdeg(w
t
)表示修饰w
t
的程度副词的程度值。5.根据权利要求4所述的一种融合观点分歧度和情感博弈的谣言检测方法,其特征在于,通过情感互影响力对用户消息的情感度进行修正,包括:综合用户内部因素和外部因素,使用多元线性回归算法,构造用户情感影响力函数,根据函数计算得到用户u
i
支持、反对话题的情感影响力;获取支持、反对当前用户评论m
i
的比例,结合用户u
i
支持、反对话题的情感影响力计算用户支持、反对用户评论m
i
的收益;
基于用户支持、反对用户评论m
i
的收益计算用户u
i
的支持、反对话题的正负情感互影响力;根据用户u
i
的支持、反对话题的正负情感互影响力对用户消息的情感度进行修正,包括:其中,senti(m
i
)为修正后用户消息的情感度;α、β为调整系数;mut
sup
(u
i
)为用户u
i
的支持话题的正负情感互影响力,mut
obj
(u
i
)为用户u
i
的反对话题的正负情感互影响力。6.根据权利要求5所述的一种融合观点分歧度和情感博弈的谣言检测方法,其特征在于,用户u
i
的支持话题的正负情感互影响力表示为:用户u
i
的反对话题的正负情感互影响力表示为:其中,pro
sup
(u
i
)表示用户支持话题的收益,表示为pro
sup
(u
i
)=p1×
inf
sup
(u
i
),inf
sup
(u
i
)为用户u
i
支持话题的情感影响力,p1为支持话题的比例;pro
obj
(u
i
)为用户u
i
反对话题的情感影响力,表示为pro
obj
(u
i
)=p2×
inf
obj
(u
i
),inf
obj
(u
i
)为用户u
i
反对话题的情感影响力,p2为反对话题的比例。7.根据权利要求6所述的一种融合观点分歧度和情感博弈的谣言检测方法,其特征在于,用户u
i
支持话题的情感影响力表示为:用户u
i
反对话题的情感影响力表示为:其中,为用户u
i
支持话题的情感影响力函数中训练得到的多元线性回归算法的偏回归系数;为用户u
i
支持话题情感的内部驱动因素,表示为frinum(u
i
)表示用户u
i
参与话题的好友数量,frisupnum(u
i
)表示用户u
i
好友中持正向态度的个数;为用户支持话题的内部影响因素,表示为posword(m
i
)为用户评论m
i
中积极词汇出现的个数,negword(m
i
)为用户评论m
i
中消极词汇出现的个数;为用户u
i
反对话题的情感影响力函数中训练得到的多元线性回归算法的偏回归系数;为用
户反对话题的内部影响因素,表示为户反对话题的内部影响因素,表示为为用户反对话题的外部影响因素,表示为8.根据权利要求1所述的一种融合观点分歧度和情感博弈的谣言检测方法,其特征在于,用户信誉度包括:cre(u
i
)=basecre(u
i
)+authcra(u
i
)+α
×
fansnum(u
i
);其中,basecre(u
i
)表示用户u
i
的基础信誉度,authcra(u
i
)表示用户u
i
的官方账号等级,fansnum(u
i
)表示用户u
i
的粉丝数;α∈[0,1]为衰减因子。9.根据权利要求2所述的一种融合观点分歧度和情感博弈的谣言检测方法,其特征在于,获取前期融合特征和后期融合特征并利用dempster组合规则对得到的前期融合特征和后期融合特征进行融合具体包括以下步骤:将信息基本属性、评论观点分歧度、用户信誉度以及用户的情感值拼接在一起输入预训练的长短期记忆网络模型提取得到对应的特征;将信息基本属性、评论观点分歧度、用户信誉度以及用户的情感值通过注意力机制获取对应的注意力权重;利用注意力权重对预训练的长短期记忆网络模型提取的特征加权求和,得到前期融合结果;将预训练的长短期记忆网络模型提取的信息基本属性、评论观点分歧度、用户信誉度以及用户的情感值特征分别输入一个全连接层;利用注意力权重对全连接层的输出进行加权求和,得到后期融合结果;基于dempster组合规则对后期融合结果和后期融合结果进行融合,得到一个信息的谣言和非谣言概率分配,包括:言和非谣言概率分配,包括:其中,p(n,r|topic)为信息的谣言和非谣言概率分配,a为p(n,r|topic)的取值空间,表示为a∈{谣言,非谣言};m
e
(b)为前期融合证据b的概率分配,即前期融合结果;m
l
(c)为后期融合证据c的概率分配,即后期融合结果;b为前期融合的特征空间,c为后期融合的特征空间;k为特征之间的冲突程度。10.根据权利要求8所述的一种融合观点分歧度和情感博弈的谣言检测方法,其特征在于,利用长短期记忆网络模型建立谣言检测模型时,将情感倾向senti(m
i
)、评论观点分歧度mdiff(m
i
)、信息基本属性mattri(m
i
)以及用户信誉度cre(u
i
)四种特征作为模型的输入,谣言检测模型表示为:其中,y表示谣言检测模型的输出,当y=1表示话题topic为谣言话题,当y=0表示话题
topic为非谣言话题;p(r|topic)为当前话题topic为谣言的概率;p(n|topic)为当前话题topic为非谣言的概率;p(n,r|topic)为当前话题topic为谣言和非谣言概率的集合。

技术总结
本发明属于网络舆情分析领域,尤其涉及一种融合观点分歧度和情感博弈的谣言检测方法,包括从数据平台以及社交平台提供的API接口中获取包含谣言、非谣言和评论转发消息的多类型话题信息以及相关用户信息;基于话题和用户特征,从各个话题中将用户关系、转发关系、用户行为、评论信息进行特征提取,并结合多项式方程对特征进行融合;将构建的用户、评论分歧特征及话题特征融合为消息影响力,结合三方认知博弈理论对情感互影响力进行构建,使用Dempster组合规则结合引入注意力机制的前期融合和后期融合,利用长短期记忆网络模型建立谣言检测模型;本发明可以更及时和精确的对网络谣言进行监控和控制,并在合理的时间进行引导和抑制。制。制。


技术研发人员:肖云鹏 罗静雯 李茜 王蓉 李暾 贾朝龙
受保护的技术使用者:重庆邮电大学
技术研发日:2023.07.07
技术公布日:2023/10/15
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐