基于热点事件的谣言识别方法、装置、设备及存储介质与流程

未命名 10-18 阅读:150 评论:0


1.本发明涉及模型预测技术领域,尤其涉及一种基于热点事件的谣言识别方法、装置、电子设备及计算机可读存储介质。


背景技术:

2.当今世界正处于互联网时代,互联网在给人类生产方式、生活方式和思维方式带来积极影响的同时,也产生了一系列社会治理难题,网络谣言就是其中的典型。现有经济领域下的社交媒体在运作过程中,会同时存在数个金融热点话题,而造谣者便会围绕这些金融热点话题编织谣言,在短时间内造成网络金融热点事件,影响广泛。现有的谣言检测方法比较局限,并不能在谣言传播早期识别出文本内容所讨论针对的金融热点话题,从而无法高效地、迅速地治理谣言,阻止谣言的传播。
3.综上所述,现有技术中存在着网络谣言识别效率低的问题。


技术实现要素:

4.本发明提供一种基于热点事件的谣言识别方法、装置、电子设备及计算机可读存储介质,其主要目的在于解决网络谣言识别效率低的问题。
5.为实现上述目的,本发明提供的一种基于热点事件的谣言识别方法,包括:
6.获取热点事件的文本内容,对所述文本内容进行预训练处理,得到所述热点事件的文本嵌入向量;
7.获取传播事件的节点,对所述节点进行向量表示,得到所述传播事件的节点嵌入向量;
8.根据所述节点之间的关系构建邻接矩阵,根据所述邻接矩阵以及所述文本内容嵌入向量进行矩阵计算,得到拼接向量;
9.对所述拼接向量进行全连接及激活计算,得到所述拼接向量对应的相似度评分;
10.对所述相似度评分进行概率计算,得到所述拼接向量的概率,根据所述拼接向量的概率确定所述传播事件的谣言结果。
11.可选地,所述对所述文本内容进行预训练处理,得到所述热点事件的文本嵌入向量,包括:
12.对所述文本内容进行嵌入处理,得到所述文本内容的三种表示向量;
13.对所述三种表示向量进行向量求和,得到单一向量;
14.将所述单一向量输入到预设的训练语言模型中,得到所述热点事件的文本嵌入向量。
15.可选地,所述对所述节点进行向量表示,得到所述传播事件的节点嵌入向量,包括:
16.将所述节点的文本信息输入到预设训练语言模型的第一模块中,得到初始嵌入向量;
17.根据所述初始嵌入向量在所述训练语言模型的第二模块中生成转换向量,利用所述转换向量对所述文本信息进行注意力计算,得到注意力分数;
18.对所述注意力分数进行归一化处理,得到标准分数;
19.将所述标准分数与对应的所述初始嵌入向量进行向量计算,得到所述传播事件的节点嵌入向量。
20.可选地,所述根据所述节点之间的关系构建邻接矩阵,包括:
21.根据所述传播事件的节点绘制节点关系图,得到节点个数及节点之间的路径长度;
22.利用所述节点个数及节点之间的路径长度构建所述邻接矩阵。
23.可选地,所述根据所述邻接矩阵以及所述文本内容嵌入向量进行矩阵计算,得到拼接向量,包括:
24.对所述邻接矩阵进行转置,得到转置矩阵;
25.将所述邻接矩阵及所述文本内容嵌入向量输入到预设的第一神经网络中进行特征计算,得到第一特征向量;
26.将所述转置矩阵及所述文本内容嵌入向量输入到预设的第二神经网络中进行特征计算,得到第二特征向量;
27.将所述第一特征向量与所述第二特征向量进行拼接,得到初拼接特征向量,将所述初拼接特征向量与所述文本嵌入向量进行拼接,得到拼接向量。
28.可选地,所述对所述拼接向量进行全连接及激活计算,得到所述拼接向量对应的相似度评分,包括:
29.利用预设的全连接神经网络对所述拼接向量进行映射,得到映射向量;
30.获取所述映射向量对应的权重矩阵,对所述映射向量及所述映射向量对应的权重矩阵相乘,得到权重向量积;
31.对所述权重向量积进行激活计算,得到所述拼接向量对应的相似度评分。
32.可选地,所述对所述相似度评分进行概率计算,得到所述拼接向量的概率,包括:
33.利用下式对所述相似度评分进行概率计算:
[0034][0035]
其中,为所述拼接向量的概率值;softmax为概率计算函数;si为第i个所述拼接向量对应的相似度评分。
[0036]
为了解决上述问题,本发明还提供一种基于热点事件的谣言识别装置,所述装置包括:
[0037]
文本内容预处理模块,用于获取热点事件的文本内容,对所述文本内容进行预训练处理,得到所述热点事件的文本嵌入向量;
[0038]
节点嵌入向量生成模块,用于获取传播事件的节点,对所述节点进行向量表示,得到所述传播事件的节点嵌入向量;
[0039]
拼接向量生成模块,用于根据所述节点之间的关系构建邻接矩阵,根据所述邻接矩阵以及所述文本内容嵌入向量进行矩阵计算,得到拼接向量;
[0040]
相似度评分计算模块,用于对所述拼接向量进行全连接及激活计算,得到所述拼接向量对应的相似度评分;
[0041]
谣言结果判定模块,用于对所述相似度评分进行概率计算,得到所述拼接向量的概率,根据所述拼接向量的概率确定所述传播事件的谣言结果。
[0042]
为了解决上述问题,本发明还提供一种电子设备,所述电子设备包括:
[0043]
至少一个处理器;以及,
[0044]
与所述至少一个处理器通信连接的存储器;其中,
[0045]
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述所述的基于热点事件的谣言识别方法。
[0046]
为了解决上述问题,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个计算机程序,所述至少一个计算机程序被电子设备中的处理器执行以实现上述所述的基于热点事件的谣言识别方法。
[0047]
本发明实施例通过对金融热点事件的文本内容进行预训练处理,避免了大量文本内容的分析,减少了干扰性文本内容的影响,提高了文本内容的识别速度;根据传播事件的节点关系构建邻接矩阵,可以有序地存储传播事件的文本信息,便于文本信息的特征提取;通过对拼接向量进行全连接计算,可以有效地对拼接向量进行特征提取,提高传播事件特征提取的准确性;对相似度评分进行概率计算,实现了对传播事件的谣言结果判断,提高了谣言的识别效率和时效性。因此本发明提出的基于热点事件的谣言识别方法、装置、电子设备及计算机可读存储介质,可以解决网络金融谣言识别效率低的问题。
附图说明
[0048]
图1为本发明一实施例提供的基于热点事件的谣言识别方法的流程示意图;
[0049]
图2为本发明一实施例提供的对所述文本内容进行预训练处理,得到所述热点事件的文本嵌入向量的流程示意图;
[0050]
图3为本发明一实施例提供的根据所述邻接矩阵以及所述文本内容嵌入向量进行矩阵计算,得到拼接向量的流程示意图;
[0051]
图4为本发明一实施例提供的基于热点事件的谣言识别装置的功能模块图;
[0052]
图5为本发明一实施例提供的实现所述基于热点事件的谣言识别方法的电子设备的结构示意图。
[0053]
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
[0054]
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
[0055]
本技术实施例提供一种基于热点事件的谣言识别方法。所述基于热点事件的谣言识别方法的执行主体包括但不限于服务端、终端等能够被配置为执行本技术实施例提供的该方法的电子设备中的至少一种。换言之,所述基于热点事件的谣言识别方法可以由安装在终端设备或服务端设备的软件或硬件来执行,所述软件可以是区块链平台。所述服务端包括但不限于:单台服务器、服务器集群、云端服务器或云端服务器集群等。所述服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(contentdelivery network,cdn)、
以及大数据和人工智能平台等基础云计算服务的云服务器。
[0056]
参照图1所示,为本发明一实施例提供的基于热点事件的谣言识别方法的流程示意图。在本实施例中,所述基于热点事件的谣言识别方法包括:
[0057]
s1、获取热点事件的文本内容,对所述文本内容进行预训练处理,得到所述热点事件的文本嵌入向量;
[0058]
本发明实施例中,所述热点事件的文本内容是指受广大群众关注或者欢迎的金融新闻或者金融信息或某段时期内引人关注的经济话题、事件等焦点性内容,包括:金融热点事件的微博、与金融热点相关事件的所有微博、帖子及评论等;本发明实施例可以利用bert(bidirectional encoder representation from transformers,训练语言模型)模型进行预训练处理。
[0059]
请参阅图2所示,本发明实施例中,所述对所述文本内容进行预训练处理,得到所述热点事件的文本嵌入向量,包括:
[0060]
s21、对所述文本内容进行嵌入处理,得到所述文本内容的三种表示向量;
[0061]
s22、对所述三种表示向量进行向量求和,得到单一向量;
[0062]
s23、将所述单一向量输入到预设的训练语言模型中,得到所述热点事件的文本嵌入向量。
[0063]
本发明实施例中,所述预设的训练语言模型可以采用bert(bidirectional encoder representation from transformers,预训练模型),一种预训练的语言表征模型;嵌入处理是在所述训练语言模型中的嵌入层中进行的;所述三种表示向量包括所述文本内容中的词嵌入向量、segment(段)嵌入向量、position(位置)嵌入向量;词嵌入会将输入到所述嵌入层的所述文本内容进行转换,得到768维的向量;segment嵌入是为了便于所述训练语言模型能对所述文本内容进行区分;position嵌入是为了得到位置向量,让所述训练语言模型能对输入的所述文本内容进行顺序区分;所述单一向量是为对所述三个表示向量中进行向量求和而得到的一个1
×n×
768的单一向量,n为所述文本内容中的单词个数。
[0064]
本发明实施例中,可以用下述公式对所述单一向量进行计算,得到文本嵌入向量:
[0065][0066]
其中,为第i个热点事件ei的文本嵌入向量;tj为第j个所述单一向量;mean为均值计算;bert为所述训练语言模型的嵌入处理。
[0067]
s2、获取传播事件的节点,对所述节点进行向量表示,得到所述传播事件的节点嵌入向量;
[0068]
本发明实施例中,所述传播事件的节点是根据围绕所述传播事件的转发、评论生成的,例如,一个关于金融热点新闻的每一次转发及评论都会生成一个节点且下一个节点是基于上一个节点发生的动作自动生成,每个节点都包含着与金融热点相关的评论及转发的金融文本信息。
[0069]
本发明实施例中,所述对所述节点进行向量表示,得到所述传播事件的节点嵌入向量,包括:
[0070]
将所述节点的文本信息输入到预设训练语言模型的第一模块中,得到初始嵌入向量;
[0071]
根据所述初始嵌入向量在所述训练语言模型的第二模块中生成转换向量,利用所述转换向量对所述文本信息进行注意力计算,得到注意力分数;
[0072]
对所述注意力分数进行归一化处理,得到标准分数;
[0073]
将所述标准分数与对应的所述初始嵌入向量进行向量计算,得到所述传播事件的节点嵌入向量。
[0074]
本发明实施例中,所述训练语言模型的第一模块是对所述节点的文本信息进行嵌入向量生成的模块,其中,所述文本信息是与金融热点新闻相关的金融信息;所述第二模块就是针对所述文本信息中的每个单词生成的3个n维(最终所述节点嵌入向量的维度)向量q、向量k、向量v的模块;所述注意力分数就是利用所述向量q、向量k、向量v分别与所述文本信息的嵌入向量进行向量相乘得到;归一化处理可以利用softmax函数(归一化函数),所述softmax函数可以将一个数值向量归一化为一个概率分布向量,且各个概率之和为1;向量计算就是将所述标准分数与对应的所述向量v分别相乘后再相加。
[0075]
本发明实施例中,可以利用下式表示所述传播事件的节点嵌入向量:
[0076]
x=(x1,x2,

,xm)
[0077]
其中,x为所述传播事件的节点嵌入向量;xm为第m个节点包含的节点嵌入向量。
[0078]
s3、根据所述节点之间的关系构建邻接矩阵,根据所述邻接矩阵以及所述文本内容嵌入向量进行矩阵计算,得到拼接向量;
[0079]
本发明实施例中,所述根据所述节点之间的关系构建邻接矩阵,包括:
[0080]
根据所述传播事件的节点绘制节点关系图,得到节点个数及节点之间的路径长度;
[0081]
利用所述节点个数及节点之间的路径长度构建所述邻接矩阵。
[0082]
本发明实施例中,所述节点关系图为围绕所述传播事件生成的帖子转发以及评论之间的互相回复的金融消息的事件流程;所述节点个数就是所述邻接矩阵的维度,所述节点之间的路径长度就是所述邻接矩阵行和列之间的元素值。
[0083]
请参阅图3所示,本发明实施例中,所述根据所述邻接矩阵以及所述文本内容嵌入向量进行矩阵计算,得到拼接向量,包括:
[0084]
s31、对所述邻接矩阵进行转置,得到转置矩阵;
[0085]
s32、将所述邻接矩阵及所述文本内容嵌入向量输入到预设的第一神经网络中进行特征计算,得到第一特征向量;
[0086]
s33、将所述转置矩阵及所述文本内容嵌入向量输入到预设的第二神经网络中进行特征计算,得到第二特征向量;
[0087]
s34、将所述第一特征向量与所述第二特征向量进行拼接,得到初拼接特征向量,将所述初拼接特征向量与所述文本嵌入向量进行拼接,得到拼接向量。
[0088]
本发明实施例中,转置就是将所述邻接矩阵中的数据元素的行标和列标互换;所述预设的第一及第二神经网络是结构完全相同的但内部参数是独立的两个神经网络,特征计算在所述第一及第二神经网络中的卷积层中实现,例如,在所述第一神经网络中,对所述邻接矩阵及所述文本内容嵌入向量相乘,再将乘积与所述第一神经网络中的预设的参数矩
阵相乘并激活,得到第一特征向量,激活可以采用relu函数;本发明实施例可以利用concate函数对所述第一特征向量与所述第二特征向量进行拼接。
[0089]
s4、对所述拼接向量进行全连接及激活计算,得到所述拼接向量对应的相似度评分;
[0090]
本发明实施例中,所述对所述拼接向量进行全连接及激活计算,得到所述拼接向量对应的相似度评分,包括:
[0091]
利用预设的全连接神经网络对所述拼接向量进行映射,得到映射向量;
[0092]
获取所述映射向量对应的权重矩阵,对所述映射向量及所述映射向量对应的权重矩阵相乘,得到权重向量积;
[0093]
对所述权重向量积进行激活计算,得到所述拼接向量对应的相似度评分。
[0094]
本发明实施例中,所述映射向量是一个一维的输出值,例如,输入224
×
224
×
3的向量,可以通过所述全连接神经网络的全连接层得到一个1
×
4096的输出值。
[0095]
本发明实施例中,可以利用下述公式进行激活计算:
[0096]
si=relu(riwf)
[0097]
其中,si为第i个所述拼接向量对应的相似度评分;ri为第i个所述拼接向量;wf为第f层卷积层的权重矩阵;relu为激活函数。
[0098]
本发明实施例中,若所述拼接向量对应的相似度评分均小于0,那么认为所述拼接向量对应的所述传播事件谈论内容并不围绕所述热点事件中的任何一个,例如,所述相似度评分为-0.8,则说明当前有关金融热点的传播事件谈论内容与所述热点事件中的任何一个金融热点事件都不相关。
[0099]
s5、对所述相似度评分进行概率计算,得到所述拼接向量的概率,根据所述拼接向量的概率确定所述传播事件的谣言结果。
[0100]
本发明实施例中,可以利用下式对所述相似度评分进行概率计算,得到所述拼接向量的概率:
[0101][0102]
其中,为所述拼接向量的概率值;softmax为概率计算函数;si为第i个所述拼接向量对应的相似度评分。
[0103]
本发明实施例中,所述拼接向量的谣言概率的取值范围为[0,1];当所述拼接向量的概率值在[0.6,1]时,说明所述拼接向量对应的所述传播事件是谣言,当所述拼接向量的概率值在[0,0.6)时,说明所述拼接向量对应的所述传播事件不是谣言,例如,所述拼接向量的概率值为0.7,则说明所述拼接向量对应的金融热点传播事件是金融谣言。
[0104]
本发明通过对金融热点事件的文本内容进行预训练处理,避免了大量文本内容的分析,减少了干扰性文本内容的影响,提高了文本内容的识别速度;根据传播事件的节点关系构建邻接矩阵,可以有序地存储传播事件的文本信息,便于文本信息的特征提取;通过对拼接向量进行全连接计算,可以有效地对拼接向量进行特征提取,提高传播事件特征提取的准确性;对相似度评分进行概率计算,实现了对传播事件的谣言结果判断,提高了金融谣言的识别效率和时效性。因此本发明提出的基于热点事件的谣言识别方法,可以解决网络金融谣言识别效率低的问题。
[0105]
如图4所示,是本发明一实施例提供的基于热点事件的谣言识别装置的功能模块图。
[0106]
本发明所述基于热点事件的谣言识别装置100可以安装于电子设备中。根据实现的功能,所述基于热点事件的谣言识别装置100可以包括文本内容预处理模块101、节点嵌入向量生成模块102、拼接向量生成模块103、相似度评分计算模块104及谣言结果判定模块105。本发明所述模块也可以称之为单元,是指一种能够被电子设备处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子设备的存储器中。
[0107]
在本实施例中,关于各模块/单元的功能如下:
[0108]
所述文本内容预处理模块101,用于获取热点事件的文本内容,对所述文本内容进行预训练处理,得到所述热点事件的文本嵌入向量;
[0109]
所述节点嵌入向量生成模块102,用于获取传播事件的节点,对所述节点进行向量表示,得到所述传播事件的节点嵌入向量;
[0110]
所述拼接向量生成模块103,用于根据所述节点之间的关系构建邻接矩阵,根据所述邻接矩阵以及所述文本内容嵌入向量进行矩阵计算,得到拼接向量;
[0111]
所述相似度评分计算模块104,用于对所述拼接向量进行全连接及激活计算,得到所述拼接向量对应的相似度评分;
[0112]
所述谣言结果判定模块105,用于对所述相似度评分进行概率计算,得到所述拼接向量的概率,根据所述拼接向量的概率确定所述传播事件的谣言结果。
[0113]
详细地,本发明实施例中所述基于热点事件的谣言识别装置100中所述的各模块在使用时采用与附图中所述的基于热点事件的谣言识别方法一样的技术手段,并能够产生相同的技术效果,这里不再赘述。
[0114]
如图5所示,是本发明一实施例提供的实现基于热点事件的谣言识别方法的电子设备的结构示意图。
[0115]
所述电子设备1可以包括处理器10、存储器11、通信总线12以及通信接口13,还可以包括存储在所述存储器11中并可在所述处理器10上运行的计算机程序,如基于热点事件的谣言识别程序。
[0116]
其中,所述处理器10在一些实施例中可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(central processing unit,cpu)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述处理器10是所述电子设备的控制核心(control unit),利用各种接口和线路连接整个电子设备的各个部件,通过运行或执行存储在所述存储器11内的程序或者模块(例如执行基于热点事件的谣言识别程序等),以及调用存储在所述存储器11内的数据,以执行电子设备的各种功能和处理数据。
[0117]
所述存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如:sd或dx存储器等)、磁性存储器、磁盘、光盘等。所述存储器11在一些实施例中可以是电子设备的内部存储单元,例如该电子设备的移动硬盘。所述存储器11在另一些实施例中也可以是电子设备的外部存储设备,例如电子设备上配备的插接式移动硬盘、智能存储卡(smart media card,smc)、安全数字(secure digital,sd)卡、闪存卡(flash card)等。进一步地,所述存储器11还可以既包括电子设备的内部存储单
元也包括外部存储设备。所述存储器11不仅可以用于存储安装于电子设备的应用软件及各类数据,例如基于热点事件的谣言识别程序的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
[0118]
所述通信总线12可以是外设部件互连标准(peripheral component interconnect,简称pci)总线或扩展工业标准结构(extended industry standard architecture,简称eisa)总线等。该总线可以分为地址总线、数据总线、控制总线等。所述总线被设置为实现所述存储器11以及至少一个处理器10等之间的连接通信。
[0119]
所述通信接口13用于上述电子设备与其他设备之间的通信,包括网络接口和用户接口。可选地,所述网络接口可以包括有线接口和/或无线接口(如wi-fi接口、蓝牙接口等),通常用于在该电子设备与其他电子设备之间建立通信连接。所述用户接口可以是显示器(display)、输入单元(比如键盘(keyboard)),可选地,用户接口还可以是标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是led显示器、液晶显示器、触控式液晶显示器以及oled(organic light-emitting diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备中处理的信息以及用于显示可视化的用户界面。
[0120]
图5仅示出了具有部件的电子设备,本领域技术人员可以理解的是,图5示出的结构并不构成对所述电子设备1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
[0121]
例如,尽管未示出,所述电子设备还可以包括给各个部件供电的电源(比如电池),优选地,电源可以通过电源管理装置与所述至少一个处理器10逻辑相连,从而通过电源管理装置实现充电管理、放电管理、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备还可以包括多种传感器、蓝牙模块、wi-fi模块等,在此不再赘述。
[0122]
应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。
[0123]
所述电子设备1中的所述存储器11存储的基于热点事件的谣言识别程序是多个指令的组合,在所述处理器10中运行时,可以实现:
[0124]
获取热点事件的文本内容,对所述文本内容进行预训练处理,得到所述热点事件的文本嵌入向量;
[0125]
获取传播事件的节点,对所述节点进行向量表示,得到所述传播事件的节点嵌入向量;
[0126]
根据所述节点之间的关系构建邻接矩阵,根据所述邻接矩阵以及所述文本内容嵌入向量进行矩阵计算,得到拼接向量;
[0127]
对所述拼接向量进行全连接及激活计算,得到所述拼接向量对应的相似度评分;
[0128]
对所述相似度评分进行概率计算,得到所述拼接向量的概率,根据所述拼接向量的概率确定所述传播事件的谣言结果。
[0129]
具体地,所述处理器10对上述指令的具体实现方法可参考附图对应实施例中相关步骤的描述,在此不赘述。
[0130]
进一步地,所述电子设备1集成的模块/单元如果以软件功能单元的形式实现并作
为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。所述计算机可读存储介质可以是易失性的,也可以是非易失性的。例如,所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-only memory)。
[0131]
本发明还提供一种计算机可读存储介质,所述可读存储介质存储有计算机程序,所述计算机程序在被电子设备的处理器所执行时,可以实现:
[0132]
获取热点事件的文本内容,对所述文本内容进行预训练处理,得到所述热点事件的文本嵌入向量;
[0133]
获取传播事件的节点,对所述节点进行向量表示,得到所述传播事件的节点嵌入向量;
[0134]
根据所述节点之间的关系构建邻接矩阵,根据所述邻接矩阵以及所述文本内容嵌入向量进行矩阵计算,得到拼接向量;
[0135]
对所述拼接向量进行全连接及激活计算,得到所述拼接向量对应的相似度评分;
[0136]
对所述相似度评分进行概率计算,得到所述拼接向量的概率,根据所述拼接向量的概率确定所述传播事件的谣言结果。
[0137]
在本发明所提供的几个实施例中,应该理解到,所揭露的设备,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
[0138]
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
[0139]
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
[0140]
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。
[0141]
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。
[0142]
本技术实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(artificial intelligence,ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
[0143]
此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一、第二等词语用来表示名称,而并不表示任何特定的顺序。
[0144]
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照
较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。

技术特征:
1.一种基于热点事件的谣言识别方法,其特征在于,所述方法包括:获取热点事件的文本内容,对所述文本内容进行预训练处理,得到所述热点事件的文本嵌入向量;获取传播事件的节点,对所述节点进行向量表示,得到所述传播事件的节点嵌入向量;根据所述节点之间的关系构建邻接矩阵,根据所述邻接矩阵以及所述文本内容嵌入向量进行矩阵计算,得到拼接向量;对所述拼接向量进行全连接及激活计算,得到所述拼接向量对应的相似度评分;对所述相似度评分进行概率计算,得到所述拼接向量的概率,根据所述拼接向量的概率确定所述传播事件的谣言结果。2.如权利要求1所述的基于热点事件的谣言识别方法,其特征在于,所述对所述节点进行向量表示,得到所述传播事件的节点嵌入向量,包括:将所述节点的文本信息输入到预设训练语言模型的第一模块中,得到初始嵌入向量;根据所述初始嵌入向量在所述预设训练语言模型的第二模块中生成转换向量,利用所述转换向量对所述文本信息进行注意力计算,得到注意力分数;对所述注意力分数进行归一化处理,得到标准分数;将所述标准分数与对应的所述初始嵌入向量进行向量计算,得到所述传播事件的节点嵌入向量。3.如权利要求1所述的基于热点事件的谣言识别方法,其特征在于,所述对所述拼接向量进行全连接及激活计算,得到所述拼接向量对应的相似度评分,包括:利用预设的全连接神经网络对所述拼接向量进行映射,得到映射向量;获取所述映射向量对应的权重矩阵,对所述映射向量及所述映射向量对应的权重矩阵相乘,得到权重向量积;对所述权重向量积进行激活计算,得到所述拼接向量对应的相似度评分。4.如权利要求1所述的基于热点事件的谣言识别方法,其特征在于,所述根据所述邻接矩阵以及所述文本内容嵌入向量进行矩阵计算,得到拼接向量,包括:对所述邻接矩阵进行转置,得到转置矩阵;将所述邻接矩阵及所述文本内容嵌入向量输入到预设的第一神经网络中进行特征计算,得到第一特征向量;将所述转置矩阵及所述文本内容嵌入向量输入到预设的第二神经网络中进行特征计算,得到第二特征向量;将所述第一特征向量与所述第二特征向量进行拼接,得到初拼接特征向量,将所述初拼接特征向量与所述文本嵌入向量进行拼接,得到拼接向量。5.如权利要求1所述的基于热点事件的谣言识别方法,其特征在于,所述对所述文本内容进行预训练处理,得到所述热点事件的文本嵌入向量,包括:对所述文本内容进行嵌入处理,得到所述文本内容的三种表示向量;对所述三种表示向量进行向量求和,得到单一向量;将所述单一向量输入到预设的训练语言模型中,得到所述热点事件的文本嵌入向量。6.如权利要求1所述的基于热点事件的谣言识别方法,其特征在于,所述根据所述节点之间的关系构建邻接矩阵,包括:
根据所述传播事件的节点绘制节点关系图,得到节点个数及节点之间的路径长度;利用所述节点个数及节点之间的路径长度构建所述邻接矩阵。7.如权利要求1至6中任一项所述的基于热点事件的谣言识别方法,其特征在于,所述对所述相似度评分进行概率计算,得到所述拼接向量的概率,包括:利用下式对所述相似度评分进行概率计算:其中,为所述拼接向量的概率值;softmax为概率计算函数;s
i
为第i个所述拼接向量对应的相似度评分。8.一种基于热点事件的谣言识别装置,其特征在于,所述装置包括:文本内容预处理模块,用于获取热点事件的文本内容,对所述文本内容进行预训练处理,得到所述热点事件的文本嵌入向量;节点嵌入向量生成模块,用于获取传播事件的节点,对所述节点进行向量表示,得到所述传播事件的节点嵌入向量;拼接向量生成模块,用于根据所述节点之间的关系构建邻接矩阵,根据所述邻接矩阵以及所述文本内容嵌入向量进行矩阵计算,得到拼接向量;相似度评分计算模块,用于对所述拼接向量进行全连接及激活计算,得到所述拼接向量对应的相似度评分;谣言结果判定模块,用于对所述相似度评分进行概率计算,得到所述拼接向量的概率,根据所述拼接向量的概率确定所述传播事件的谣言结果。9.一种电子设备,其特征在于,所述电子设备包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至7中任意一项所述的基于热点事件的谣言识别方法。10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任意一项所述的基于热点事件的谣言识别方法。

技术总结
本发明涉及模型预测技术,揭露了一种基于热点事件的谣言识别方法,包括:获取热点事件的文本内容,对文本内容进行预训练处理,得到热点事件的文本嵌入向量;获取传播事件的节点,对节点进行向量表示,得到传播事件的节点嵌入向量;根据节点之间的关系构建邻接矩阵,根据邻接矩阵以及文本内容嵌入向量进行矩阵计算,得到拼接向量;对拼接向量进行全连接及激活计算,得到拼接向量对应的相似度评分;对相似度评分进行概率计算,得到拼接向量的概率,根据拼接向量的概率确定传播事件的谣言结果。本发明还提出一种基于热点事件的谣言识别装置、电子设备以及存储介质。本发明可以提高网络金融谣言识别效率。网络金融谣言识别效率。网络金融谣言识别效率。


技术研发人员:舒畅 陈又新
受保护的技术使用者:平安科技(深圳)有限公司
技术研发日:2023.06.08
技术公布日:2023/10/11
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐