基于端到端文本过滤的评分预测方法

未命名 07-15 阅读:144 评论:0


1.本发明涉及互联网信息分类技术领域,尤其涉及一种基于端到端文本过滤的评分预测方法。


背景技术:

2.评论文本评分预测是指根据线上平台用户对商品所撰写的评论文本,对其进行语义分析,并做出评分预测,其能够作为用户对商品的满意度的一种衡量。评论文本评分预测在现实生活中具有广泛的应用。具体而言,通过评论文本评分预测,商家可以了解消费者关于产品和服务的反馈信息,以对产品及服务进行改进,提高销量。线上平台可以通过评论文本评分预测,挖掘消费者对于产品属性的兴趣偏好,提供精准的个性化推荐。
3.然而,现有的评论文本评分预测方法主要通过对评论文本的语义信息进行挖掘,建立评论文本到评分的映射,该方法受限于单个文本的局部语义,容易受到文本语义波动性的影响,预测性能和预测精度较差。


技术实现要素:

4.为解决上述现有技术中存在的部分或全部技术问题,本发明提供一种基于端到端文本过滤的评分预测方法。
5.本发明的技术方案如下:
6.提供了一种基于端到端文本过滤的评分预测方法,所述方法包括:
7.获取待预测的评论文本,确定评论文本对应的用户和商品;
8.获取所述用户的至少一个历史评论文本和所述商品的至少一个历史评论文本;
9.利用预先训练的卷积神经网络分别对所述评论文本、所述用户的历史评论文本和所述商品的历史评论文本进行卷积处理,获取所述评论文本对应的词组级卷积特征向量和所述历史评论文本对应的词组级卷积特征向量;
10.利用预先训练的第一注意力机制模型分别对所述评论文本对应的词组级卷积特征向量和所述历史评论文本对应的词组级卷积特征向量进行处理,获取所述评论文本对应的特征向量和所述历史评论文本对应的特征向量;
11.根据所述特征向量,确定所述评论文本与所述历史评论文本之间的相似性;
12.基于所述相似性,对所述历史评论文本进行过滤,并根据过滤后的所述历史评论文本计算相似性文本特征向量;
13.对所述评论文本的特征向量和所述相似性文本特征向量进行融合,获取全局文本特征向量;
14.根据所述全局文本特征向量,确定所述评论文本的预测评分。
15.在一些可能的实现方式中,利用预先训练的卷积神经网络对评论文本进行卷积处理,获取评论文本对应的词组级卷积特征向量,进一步包括:
16.确定评论文本的组成单词;
17.利用预先训练的卷积神经网络获取每个单词的词组级卷积特征;
18.根据每个单词的词组级卷积特征,确定评论文本对应的词组级卷积特征向量。
19.在一些可能的实现方式中,利用以下公式获取所述评论文本对应的特征向量:
[0020][0021]
利用以下公式获取所述用户的历史评论文本对应的特征向量:
[0022][0023]
利用以下公式获取所述商品的历史评论文本对应的特征向量:
[0024][0025]
其中,w和b表示第一注意力机制模型参数,tanh表示非线性变换函数,其中,w和b表示第一注意力机制模型参数,tanh表示非线性变换函数,表示评论文本对应的词组级卷积特征向量,ci表示评论文本的第i个单词的卷积特征向量,n表示评论文本的组成单词数,d表示评论文本对应的特征向量,表示用户的历史评论文本对应的词组级卷积特征向量,c
u,i
表示用户的历史评论文本的第i个单词的卷积特征向量,u表示用户的历史评论文本的组成单词数,du表示用户的历史评论文本对应的特征向量,表示商品的历史评论文本对应的词组级卷积特征向量,c
p,i
表示商品的历史评论文本的第i个单词的卷积特征向量,p表示商品的历史评论文本的组成单词数,d
p
表示商品的历史评论文本对应的特征向量。
[0026]
在一些可能的实现方式中,利用以下公式计算确定所述评论文本与所述历史评论文本之间的相似性:
[0027]
αk=v
t
tanh(w1d+w2d
′k+b)
[0028]
其中,v、w1、w2和b表示第二注意力机制模型参数,αk表示评论文本与历史评论文本d
′k之间的相似性,d
′k表示历史评论文本d
′k对应的特征向量,d
′k∈du∪
p
,du表示用户的历史评论文本,d
p
表示商品的历史评论文本。
[0029]
在一些可能的实现方式中,基于所述相似性,对所述历史评论文本进行过滤,并根据过滤后的所述历史评论文本计算相似性文本特征向量,包括:
[0030]
基于所述相似性和预设过滤阈值,利用非线性变换构造用于对所述历史评论文本进行过滤的端到端文本过滤函数;
[0031]
根据所述相似性、所述端到端文本过滤函数和所述历史评论文本对应的特征向量,计算所述相似性文本特征向量。
[0032]
在一些可能的实现方式中,所述端到端文本过滤函数表示为:
[0033][0034]
所述相似性文本特征向量利用以下公式计算:
[0035][0036]
其中,η表示噪音过滤的缩放因子,θ表示预设过滤阈值,e表示自然常数,d

表示相似性文本特征向量。
[0037]
在一些可能的实现方式中,利用预先训练的门控神经网络对所述评论文本的特征向量和所述相似性文本特征向量进行融合,获取所述全局文本特征向量。
[0038]
在一些可能的实现方式中,所述全局文本特征向量利用以下公式获取:
[0039][0040]
其中,wg和bg表示门控神经网络参数,softmax是归一化非线性变换函数,dg表示考虑了端到端文本过滤的全局文本特征向量。
[0041]
在一些可能的实现方式中,利用预先训练的前向神经网络对所述全局文本特征向量进行处理,获取所述评论文本的预测评分。
[0042]
在一些可能的实现方式中,所述评论文本的预测评分利用以下公式获取:
[0043][0044]
其中,wy和by表示前向神经网络参数,表示预测评分向量,表示取预测向量数值最大所对应的维度,表示预测评分。
[0045]
本发明技术方案的主要优点如下:
[0046]
本发明的基于端到端文本过滤的评分预测方法通过对评论文本的相似性文本进行挖掘和过滤,并基于过滤后的相似性文本进行评论文本的评分预测,能够显著提高评论文本的评分预测性能和预测精度,得到更精确的预测评分。
附图说明
[0047]
此处所说明的附图用来提供对本发明实施例的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
[0048]
图1为本发明一实施例的基于端到端文本过滤的评分预测方法的流程图。
具体实施方式
[0049]
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明具体实施例及相应的附图对本发明技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本发明的
一部分实施例,而不是全部的实施例。基于本发明的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0050]
以下结合附图,详细说明本发明实施例提供的技术方案。
[0051]
参考图1,本发明一实施例提供了一种基于端到端文本过滤的评分预测方法,该方法包括以下步骤s1-s8:
[0052]
步骤s1,获取待预测的评论文本,确定评论文本对应的用户和商品。
[0053]
具体地,获取待预测评分的评论文本,确定该评论文本对应的用户和商品。
[0054]
步骤s2,获取用户的至少一个历史评论文本和商品的至少一个历史评论文本。
[0055]
本发明一实施例中,用户的历史评论文本表示已有的该用户对包括待预测评论文本对应的商品在内的所有商品的评论文本,商品的历史评论文本表示已有的包括待预测评论文本对应的用户在内的所有用户对该商品的评论文本。
[0056]
本发明一实施例中,从已有的用户的历史评论文本和商品的历史评论文本中随机选取一定数量的历史评论文本用于后续处理。其中,选取的历史评论文本的数量根据实际情况进行确定,通常来说,预测过程中所使用的历史评论文本的数量越多,预测精度越高,但处理成本和处理时间越多。
[0057]
步骤s3,利用预先训练的卷积神经网络分别对评论文本、用户的历史评论文本和商品的历史评论文本进行卷积处理,获取评论文本对应的词组级卷积特征向量和历史评论文本对应的词组级卷积特征向量。
[0058]
本发明一实施例中,利用预先训练的卷积神经网络对评论文本进行卷积处理,获取评论文本对应的词组级卷积特征向量,进一步包括:
[0059]
确定评论文本的组成单词;
[0060]
利用预先训练的卷积神经网络获取每个单词的词组级卷积特征;
[0061]
根据每个单词的词组级卷积特征,确定评论文本对应的词组级卷积特征向量。
[0062]
其中,所述的评论文本包括待预测的评论文本、用户的历史评论文本和商品的历史评论文本。
[0063]
具体地,设定:待预测的评论文本表示为d,用户的历史评论文本表示为du={d
u,1
,...,d
u,s
},商品的历史评论文本表示为d
p
={d
p,1
,...,d
p,t
},d
u,s
表示用户的第s个历史评论文本,d
p,t
表示商品的第t个历史评论文本。
[0064]
进一步地,以待预测的评论文本为例,假设:一个待预测的评论文本由n个单词组成,表示为wi表示第i个单词。
[0065]
通过嵌入检索操作,将n个单词一一映射为n个向量,而后通过预先训练的卷积神经网络,获取每个单词wi的词组级卷积特征。
[0066]
具体地,通过卷积神经网络获取的单词wi的词组级卷积特征表示为:
[0067][0068]
其中,c
i,f
表示单词wi的词组级卷积特征,f表示非线性变换函数,wf表示卷积核,bf表示偏置系数。该卷积操作为选取单词wi左右共l个单词进行卷积,形成相应的卷积特征c
i,f

[0069]
进一步地,假设卷积神经网络使用k个卷积核进行卷积操作,则针对每个单词,形
成关于单词的k维卷积特征向量,具体表示为:
[0070][0071]
其中,ci表示单词wi的k维卷积特征向量,表示由第k个卷积核得到的单词wi的词组级卷积特征。
[0072]
本发明一实施例中,针对待预测的评论文本、用户的每个历史评论文本和商品的每个历史评论文本,根据上述处理,能够获取待预测的评论文本对应的词组级卷积特征向量和每个历史评论文本对应的词组级卷积特征向量,能够很好地捕获到评论文本的词组信息。
[0073]
其中,卷积神经网络的参数通过在模型训练过程中自动学习更新确定。
[0074]
步骤s4,利用预先训练的第一注意力机制模型分别对评论文本对应的词组级卷积特征向量和历史评论文本对应的词组级卷积特征向量进行处理,获取评论文本对应的特征向量和历史评论文本对应的特征向量。
[0075]
本发明一实施例中,利用预先训练的第一注意力机制模型对待预测的评论文本对应的词组级卷积特征向量进行处理,获取待预测的评论文本对应的特征向量;利用预先训练的第一注意力机制模型对用户的历史评论文本对应的词组级卷积特征向量进行处理,获取用户的历史评论文本对应的特征向量;利用预先训练的第一注意力机制模型对商品的历史评论文本对应的词组级卷积特征向量进行处理,获取商品的历史评论文本对应的特征向量。
[0076]
具体地,设定:表示待预测的评论文本对应的词组级卷积特征向量,ci表示待预测的评论文本的第i个单词的卷积特征向量,n表示待预测的评论文本的组成单词数,表示用户的历史评论文本对应的词组级卷积特征向量,c
u,i
表示用户的历史评论文本的第i个单词的卷积特征向量,u表示用户的历史评论文本的组成单词数,表示商品的历史评论文本对应的词组级卷积特征向量,c
p,i
表示商品的历史评论文本的第i个单词的卷积特征向量,d表示商品的历史评论文本的组成单词数。
[0077]
利用第一注意力机制模型对待预测的评论文本对应的词组级卷积特征向量进行处理表示为:
[0078][0079]
利用第一注意力机制模型对用户的历史评论文本对应的词组级卷积特征向量进行处理表示为:
[0080][0081]
利用第一注意力机制模型对商品的历史评论文本对应的词组级卷积特征向量进
行处理表示为:
[0082][0083]
其中,w和b表示第一注意力机制模型参数,tanh表示非线性变换函数,d表示待预测的评论文本对应的特征向量,du表示用户的历史评论文本对应的特征向量,d
p
表示商品的历史评论文本对应的特征向量。其中,第一注意力机制模型的参数通过在模型训练过程中自动学习更新确定。
[0084]
本发明一实施例中,针对待预测的评论文本、用户的每个历史评论文本和商品的每个历史评论文本,通过上述处理,获取待预测的评论文本对应的特征向量、用户的每个历史评论文本对应的特征向量和商品的每个历史评论文本对应的特征向量。
[0085]
步骤s5,根据特征向量,确定评论文本与历史评论文本之间的相似性。
[0086]
本发明一实施例中,利用预先训练的第二注意力机制模型对待预测的评论文本对应的特征向量和历史评论文本对应的特征向量进行处理,确定待预测的评论文本与每个历史评论文本之间的相似性。
[0087]
具体地,利用以下公式计算确定评论文本与历史评论文本之间的相似性:
[0088]
αk=v
t
tanh(w1d+w2d
′k+b)
[0089]
其中,v、w1、w2和b表示第二注意力机制模型参数,tanh表示非线性变换函数,αk表示评论文本d与历史评论文本d
′k之间的相似性,d表示评论文本d对应的特征向量,d
′k表示历史评论文本d
′k对应的特征向量,d
′k∈duud
p
。其中,第二注意力机制模型的参数通过在模型训练过程中自动学习更新确定。
[0090]
考虑到可能存在选取的用户的某个历史评论文本与商品的某个历史评论文本是同一个历史评论文本的情况,本发明一实施例中,针对相同的历史评论文本,仅计算待预测的评论文本与其中一个历史评论文本之间的相似性。
[0091]
步骤s6,基于相似性,对历史评论文本进行过滤,并根据过滤后的历史评论文本计算相似性文本特征向量。
[0092]
本发明一实施例中,基于相似性,对历史评论文本进行过滤,并根据过滤后的历史评论文本计算相似性文本特征向量,进一步包括:
[0093]
基于相似性和预设过滤阈值,利用非线性变换构造用于对历史评论文本进行过滤的端到端文本过滤函数;
[0094]
根据相似性、端到端文本过滤函数和历史评论文本对应的特征向量,计算相似性文本特征向量。
[0095]
具体地,本发明一实施例中,构造的端到端文本过滤函数表示为:
[0096][0097]
其中,η表示噪音过滤的缩放因子,η为模型超参数,η越大表示过滤得越彻底,η

0表示不对历史评论文本进行过滤,αk表示评论文本与历史评论文本之间的相似性,θ表示预
设过滤阈值,e表示自然常数。其中,预设过滤阈值根据实际情况具体设置。
[0098]
本发明一实施例中,通过构造端到端文本过滤函数对历史评论文本进行过滤以去除噪音文本,能够使得模型对于过滤端对端可导。
[0099]
进一步地,本发明一实施例中,利用以下公式计算相似性文本特征向量:
[0100][0101]
其中,d

表示相似性文本特征向量,du表示用户的历史评论文本du的特征向量,d
p
表示商品的历史评论文本d
p
的特征向量。
[0102]
步骤s7,对评论文本的特征向量和相似性文本特征向量进行融合,获取全局文本特征向量。
[0103]
本发明一实施例中,利用预先训练的门控神经网络对待预测的评论文本的特征向量和相似性文本特征向量进行融合,获取全局文本特征向量。
[0104]
具体地,利用门控神经网络对评论文本的特征向量和相似性文本特征向量进行融合表示为:
[0105][0106]
其中,wg和bg表示门控神经网络参数,softmax是归一化非线性变换函数,dg表示考虑了端到端文本过滤的全局文本特征向量。门控神经网络的物理意义为根据两个不同的输入向量,自动确定它们的权重,再采取加权和的操作对两个输入向量进行融合。其中,门控神经网络的参数通过在模型训练过程中自动学习更新确定。
[0107]
步骤s8,根据全局文本特征向量,确定评论文本的预测评分。
[0108]
本发明一实施例中,利用预先训练的前向神经网络对全局文本特征向量进行处理,获取待预测的评论文本的预测评分。
[0109]
具体地,利用前向神经网络对全局文本特征向量进行处理表示为:
[0110][0111]
其中,wy和by表示前向神经网络参数,softmax是归一化非线性变换函数,表示前向神经网络参数,softmax是归一化非线性变换函数,表示预测评分向量,表示取预测向量数值最大所对应的维度,表示预测评分。其中,前向神经网络的参数通过在模型训练过程中自动学习更新确定。
[0112]
本发明一实施例中,预测评分向量用于表示评论文本的评分类别的输出结果,评论文本的评分类别的数量根据实际情况确定,例如可以为5类或者10类,当评分类别数量10时,向量为一个维度为10的向量,取向量中数值最大的维度作为对应的评分作为预测评分。
[0113]
进一步地,本发明一实施例中,上述涉及的卷积神经网络的参数、各个注意力机制模型的参数、门控神经网络的参数、以及前向神经网络的参数均通过模型训练进行更新优
化。
[0114]
具体地,本发明一实施例中,卷积神经网络、各个注意力机制模型、门控神经网络和前向神经网络通过以下步骤训练得到:
[0115]
获取训练数据集合,训练数据包括评论文本、评论文本对应的用户和商品、用户的历史评论文本、商品的历史评论文本、以及评论文本的实际评分;
[0116]
将训练数据中的评论文本、用户的历史评论文本和商品的历史评论文本作为输入,将训练数据中的评论文本的实际评分作为输出,基于预设的目标函数,利用反向传播算法训练得到卷积神经网络、各个注意力机制模型、门控神经网络和前向神经网络。
[0117]
具体地,在进行模型训练时,卷积神经网络、各个注意力机制模型、门控神经网络和前向神经网络均设置有初始化参数,基于设定的初始化参数和上述具体限定的数据处理过程及公式,对于输入的每个训练数据,能够得到一个对应的预测评分,根据实际评分和预测评分计算目标函数,根据目标函数,利用反向传播算法不断更新各个模型参数,直至达到设定的迭代停止条件时完成模型训练,确定卷积神经网络、各个注意力机制模型、门控神经网络和前向神经网络。
[0118]
本发明一实施例中,在进行模型训练时,目标函数设定为:
[0119][0120]
其中,l表示目标函数,x表示训练数据集合,r表示实际评分,表示预测评分。
[0121]
上述限定的目标函数表示计算预测评分与实际评分之间的误差,优化此目标函数即是最小化此项误差,等价于提高模型预测精度。
[0122]
进一步地,本发明一实施例中,利用以下公式对模型的参数进行更新:
[0123][0124]
其中,θ
t+1
表示第t+1次迭代时的所有模型的参数集合,θ
t
表示第t次迭代时的所有模型的参数集合,δ[
·
]表示优化器,η表示学习率,θ表示模型的参数集合。其中,优化器例如为adam、sgd等,学习率需要预先设置,用于控制参数更新的快慢。其中,所述的模型包括卷积神经网络、各个注意力机制模型、门控神经网络和前向神经网络。
[0125]
本发明一实施例提供的基于端到端文本过滤的评分预测方法通过对评论文本的相似性文本进行挖掘和过滤,并基于过滤后的相似性文本进行评论文本的评分预测,能够显著提高评论文本的评分预测性能和预测精度,得到更精确的预测评分。
[0126]
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。此外,本文中“前”、“后”、“左”、“右”、“上”、“下”均以附图中表示的放置状态为参照。
[0127]
最后应说明的是:以上实施例仅用于说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可
以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

技术特征:
1.一种基于端到端文本过滤的评分预测方法,其特征在于,包括:获取待预测的评论文本,确定评论文本对应的用户和商品;获取所述用户的至少一个历史评论文本和所述商品的至少一个历史评论文本;利用预先训练的卷积神经网络分别对所述评论文本、所述用户的历史评论文本和所述商品的历史评论文本进行卷积处理,获取所述评论文本对应的词组级卷积特征向量和所述历史评论文本对应的词组级卷积特征向量;利用预先训练的第一注意力机制模型分别对所述评论文本对应的词组级卷积特征向量和所述历史评论文本对应的词组级卷积特征向量进行处理,获取所述评论文本对应的特征向量和所述历史评论文本对应的特征向量;根据所述特征向量,确定所述评论文本与所述历史评论文本之间的相似性;基于所述相似性,对所述历史评论文本进行过滤,并根据过滤后的所述历史评论文本计算相似性文本特征向量;对所述评论文本的特征向量和所述相似性文本特征向量进行融合,获取全局文本特征向量;根据所述全局文本特征向量,确定所述评论文本的预测评分。2.根据权利要求1所述的基于端到端文本过滤的评分预测方法,其特征在于,利用预先训练的卷积神经网络对评论文本进行卷积处理,获取评论文本对应的词组级卷积特征向量,进一步包括:确定评论文本的组成单词;利用预先训练的卷积神经网络获取每个单词的词组级卷积特征;根据每个单词的词组级卷积特征,确定评论文本对应的词组级卷积特征向量。3.根据权利要求2所述的基于端到端文本过滤的评分预测方法,其特征在于,利用以下公式获取所述评论文本对应的特征向量:利用以下公式获取所述用户的历史评论文本对应的特征向量:利用以下公式获取所述商品的历史评论文本对应的特征向量:
其中,w和b表示第一注意力机制模型参数,tanh表示非线性变换函数,其中,w和b表示第一注意力机制模型参数,tanh表示非线性变换函数,其中,w和b表示第一注意力机制模型参数,tanh表示非线性变换函数,表示评论文本对应的词组级卷积特征向量,c
i
表示评论文本的第i个单词的卷积特征向量,n表示评论文本的组成单词数,d表示评论文本对应的特征向量,表示用户的历史评论文本对应的词组级卷积特征向量,c
u,i
表示用户的历史评论文本的第i个单词的卷积特征向量,u表示用户的历史评论文本的组成单词数,d
u
表示用户的历史评论文本对应的特征向量,表示商品的历史评论文本对应的词组级卷积特征向量,c
p,i
表示商品的历史评论文本的第i个单词的卷积特征向量,p表示商品的历史评论文本的组成单词数,d
p
表示商品的历史评论文本对应的特征向量。4.根据权利要求3所述的基于端到端文本过滤的评分预测方法,其特征在于,利用以下公式计算确定所述评论文本与所述历史评论文本之间的相似性:α
k
=v
t
tanh(w1d+w2d

k
+b)其中,v、w1、w2和b表示第二注意力机制模型参数,α
k
表示评论文本与历史评论文本d

k
之间的相似性,d

k
表示历史评论文本d

k
对应的特征向量,d

k
∈d
u

p
,d
u
表示用户的历史评论文本,d
p
表示商品的历史评论文本。5.根据权利要求4所述的基于端到端文本过滤的评分预测方法,其特征在于,基于所述相似性,对所述历史评论文本进行过滤,并根据过滤后的所述历史评论文本计算相似性文本特征向量,包括:基于所述相似性和预设过滤阈值,利用非线性变换构造用于对所述历史评论文本进行过滤的端到端文本过滤函数;根据所述相似性、所述端到端文本过滤函数和所述历史评论文本对应的特征向量,计算所述相似性文本特征向量。6.根据权利要求5所述的基于端到端文本过滤的评分预测方法,其特征在于,所述端到端文本过滤函数表示为:所述相似性文本特征向量利用以下公式计算:其中,η表示噪音过滤的缩放因子,θ表示预设过滤阈值,e表示自然常数,d

表示相似性
文本特征向量。7.根据权利要求6所述的基于端到端文本过滤的评分预测方法,其特征在于,利用预先训练的门控神经网络对所述评论文本的特征向量和所述相似性文本特征向量进行融合,获取所述全局文本特征向量。8.根据权利要求7所述的基于端到端文本过滤的评分预测方法,其特征在于,所述全局文本特征向量利用以下公式获取:其中,w
g
和b
g
表示门控神经网络参数,softmax是归一化非线性变换函数,表示门控神经网络参数,softmax是归一化非线性变换函数,d
g
表示考虑了端到端文本过滤的全局文本特征向量。9.根据权利要求8所述的基于端到端文本过滤的评分预测方法,其特征在于,利用预先训练的前向神经网络对所述全局文本特征向量进行处理,获取所述评论文本的预测评分。10.根据权利要求9所述的基于端到端文本过滤的评分预测方法,其特征在于,所述评论文本的预测评分利用以下公式获取:其中,w
y
和b
y
表示前向神经网络参数,表示预测评分向量,表示取预测向量数值最大所对应的维度,表示预测评分。

技术总结
本发明公开了一种基于端到端文本过滤的评分预测方法,包括:获取待预测评论文本,确定评论文本对应的用户和商品;获取用户的至少一个历史评论文本和商品的至少一个历史评论文本;获取评论文本对应的词组级卷积特征向量和历史评论文本对应的词组级卷积特征向量;获取评论文本对应的特征向量和历史评论文本对应的特征向量;根据特征向量,确定评论文本与历史评论文本之间的相似性;基于相似性,对历史评论文本进行过滤,并根据过滤后的历史评论文本计算相似性文本特征向量;对评论文本的特征向量和相似性文本特征向量进行融合,获取全局文本特征向量;根据全局文本特征向量,确定评论文本的预测评分。本发明能够提高评论文本的评分预测性能和精度。评分预测性能和精度。评分预测性能和精度。


技术研发人员:温家辉 方健 张光达 王会权 张拥军 郝锋
受保护的技术使用者:中国人民解放军军事科学院国防科技创新研究院
技术研发日:2023.03.01
技术公布日:2023/7/12
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐