一种金融文本核查方法及系统与流程
未命名
08-07
阅读:167
评论:0
1.本发明属于文本核查技术领域,具体涉及一种金融文本核查方法及系统。
背景技术:
2.在金融领域,文本核查是指对金融相关的文件、报告、公告等进行审核和验证的过程。为了确保信息的准确性和可信度,金融机构和专业人士会采用各种方法来核实文本中的信息。这些方法可能包括使用自动化工具和算法来检测错误或异常、进行数据分析和比对、查阅权威资料和数据库、与相关方沟通确认等等。通过应用适当的文本核查方法,可以帮助金融从业者更好地了解和评估金融文本所传递的信息,以支持决策和风险管理。
3.现有技术中,所有的金融文本核查都依赖于人工进行文本可信度判断,工作量大,主观性强,而且由于核查人员的知识局限性,给出的判断结果准确率低。
技术实现要素:
4.为了解决现有技术存在的所有的金融文本核查都依赖于人工进行文本可信度判断,工作量大,主观性强,而且由于核查人员的知识局限性,给出的判断结果准确率低的技术问题,本发明提供一种金融文本核查方法及系统。
5.第一方面
6.本发明提供了一种金融文本核查方法,包括:
7.s101:获取待核查金融文本;
8.s102:检索待核查金融文本的多条相关证据;
9.s103:将待核查金融文本和每个相关证据进行拼接,将每个拼接结果均作为节点进行全连接,构造关于待核查金融文本的推理图;
10.s104:结合基于核函数的注意力机制,计算目标节点中的词语对相邻节点的词语的第一注意力权重,获取相邻节点的细粒度信息,其中,目标节点为推理图中的任意一个节点;
11.s105:根据细粒度信息,计算目标节点对相邻节点的第二注意力权重;
12.s106:利用第二注意力权重对目标节点进行更新,得到多证据节点;
13.s107:结合多证据节点,计算目标节点为真实标签的第一概率;
14.s108:计算目标节点中的待核查金融文本和相关证据的匹配特征信息;
15.s109:根据匹配特征信息,计算目标节点在推理图中被选择的第二概率;
16.s110:整合所有的目标节点的第一概率和相应的第二概率,计算待核查金融文本为真实标签的目标概率。
17.第二方面
18.本发明提供了一种金融文本核查系统,用于执行第一方面中的金融文本核查方法。
19.与现有技术相比,本发明至少具有以下有益技术效果:
20.在本发明中,通过获取待核查金融文本的多条相关证据,并构建推理图,引入基于核函数的注意力机制抓取各节点之间的语义相似度,获取目标节点和相邻节点中相对应词语的细粒度信息,进而在词语级别上控制相邻节点到目标节点的证据传播,之后计算并利用目标节点对各相邻节点的第二注意力权重对目标节点进行更新,融合检索得到的多条相关证据进行联合推理得到多证据节点,并根据多证据节点计算目标节点为真的第一概率,预测准确率高。之后计算目标节点中的待核查金融文本和相关证据的匹配特征信息,进而计算得到目标节点为真第二概率,之后根据第一概率和第二概率进行整合,推理出目标节点中的待核查金融文本为真的目标概率,进一步提升预测准确性,避免单一证据推理和人工推理导致的结果局限性,在降低人工核查参与度,提升核查客观性的同时,减轻核查人员的工作负担,提升核查效率和核查结果的可信度。
附图说明
21.下面将以明确易懂的方式,结合附图说明优选实施方式,对本发明的上述特性、技术特征、优点及其实现方式予以进一步说明。
22.图1是本发明提供的一种金融文本核查方法的流程示意图;
23.图2是本发明提供的一种金融文本核查系统的结构示意图。
具体实施方式
24.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对照附图说明本发明的具体实施方式。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,并获得其他的实施方式。
25.为使图面简洁,各图中只示意性地表示出了与发明相关的部分,它们并不代表其作为产品的实际结构。另外,以使图面简洁便于理解,在有些图中具有相同结构或功能的部件,仅示意性地绘示了其中的一个,或仅标出了其中的一个。在本文中,“一个”不仅表示“仅此一个”,也可以表示“多于一个”的情形。
26.还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
27.在本文中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
28.另外,在本发明的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
29.实施例1
30.在一个实施例中,参考说明书附图1,示出了本发明提供的金融文本核查方法的流程示意图。
31.本发明提供的一种金融文本核查方法,包括:
32.s101:获取待核查金融文本。
33.其中,待核查金融文本的格式可以是.txt、.docx、.pdf、.md、.html等,对于不能直接自动识别的文本来源可以通过格式转换,转成相应的可读取格式进行文本识别。
34.需要说明的是,待核查金融文本可以是词语、句子或者一篇文章,这些内容均可作为一个单位进行自动核查。
35.s102:检索待核查金融文本的多条相关证据。
36.需要说明的是,检索方式可以通过百度、谷歌、必应或者维基百科等搜索引擎进行检索,也可以查询金融领域相关的数据库,如金融新闻数据库、学术论文数据库、金融报告数据库等,而且也可以直接访问一些可信度较高的软件api,获取金融相关信息,获取到多条相关证据。在检索的过程中,为了提高最终的预测准确性,可以分词、分句、分段的进行检索。对于概括性或者主旨性较强的文章可以直接按主题进行检索,提升检索效率。
37.s103:将待核查金融文本和每个相关证据进行拼接,将每个拼接结果均作为节点进行全连接,构造关于待核查金融文本的推理图。
38.其中,全连接是指神经网络中的一种连接方式,也被称为密集连接或全连接层。在全连接层中,每个神经元与前一层的所有神经元相连接。
39.具体而言,全连接层是指网络中的一层神经元,其中每个神经元与前一层的所有神经元都有连接。每个连接都有一个权重,用于调整传递的信号。全连接层中的每个神经元接收来自前一层所有神经元的输入,并通过对输入进行加权求和和激活函数处理,产生输出。全连接层的主要特点是每个神经元与前一层的所有神经元都有连接,这意味着它能够捕捉到前一层中所有神经元的信息。全连接层在神经网络中通常用于提取高级特征。在深度学习中,全连接层通常位于神经网络的最后一层,用于将高级特征映射到输出类别或进行回归预测。将全连接得到的连接图作为待核查金融文本的推理图,用于表示待核查文本和相关证据之间的关联关系。这样的推理图可以用于后续的分析、推理或预测任务,便于提取节点之间的特征信息,并进行联合推理,避免单一证据推理得到的结果不准确的情况。
40.s104:结合基于核函数的注意力机制,计算目标节点中的词语对相邻节点的词语的第一注意力权重,获取相邻节点的细粒度信息。
41.其中,核函数是一种用于度量两个数据样本之间相似性的函数。它将输入数据映射到一个高维特征空间,并计算在该特征空间中的相似度。
42.其中,细粒度信息是控制相邻节点向目标节点的证据传播的信息特征,通过获取到的相邻节点的细粒度信息,可以在词语级别上得到更加准确的向目标节点传播的能力,避免直接整段或者整篇文章进行推理导致的结果偏差较大的情况。
43.其中,目标节点为推理图中的任意一个节点。
44.在一种可能的实施方式中,s104具体包括:
45.s1041:利用余弦相似度,计算目标节点的词语对相邻节点的词语的相似度值:
[0046][0047]
其中,分别表示目标节点中的第i个词语隐状态和相邻节点中的第j个词语隐状态。
[0048]
其中,隐状态表示是一种通过建模语言的潜在结构或潜在变量来捕捉上下文信息的结构,它是基于神经网络模型构建的,通过在模型中引入隐状态,可以将上下文的语义信息编码到词语表示中。
[0049]
具体而言,隐状态表示是一种根据上下文动态调整词语表示的方法。它考虑了词语周围的语境和上下文,使得词语的表示能够更好地反映词语在不同上下文中的语义变化。通过引入隐状态表示,可以增强模型对句子或文本的语义理解和表达能力。通过捕捉每个词语的信息,并将其融入到词语的表示中,以提高对上下文语义的建模和理解能力,以便更好的为联合推理做铺垫。
[0050]
s1042:基于相似度值建立目标节点和相邻节点的交互矩阵。
[0051]
其中,交互矩阵的每个元素都是目标节点和相邻节点的余弦相似度值。
[0052]
s1043:结合交互矩阵,计算目标节点的词语对相邻节点的词语的语义匹配特征值:
[0053][0054]
其中,和分别表示第k个核函数的均值和方差,q表示相邻节点,p表示目标节点。
[0055]
s1044:利用linear线性变换函数和softmax激活函数,计算目标节点中的词语对相邻节点的词语的第一注意力权重:
[0056]
。
[0057]
其中, linear线性变换函数表示对输入参数进行线性变换,包括矩阵乘法、加权和等操作,以产生新的表示。线性变换的目的是通过学习适当的权重和偏置,将匹配特征映射到一个新的空间,以更好地表示目标节点的相关信,softmax函数是一种常用的激活函数,可以将输入转化为概率分布。将线性变换后的结果归一化为概率分布。
[0058]
s1045:利用第一注意力权重,整合目标节点的词语,得到相邻节点的细粒度信息,以控制相邻节点向目标节点的证据传播:
[0059][0060]
其中,m表示待核查金融文本的词语数量,n表示相关证据的词语数量。
[0061]
s105:根据细粒度信息,计算目标节点对相邻节点的第二注意力权重。
[0062]
在一种可能的实施方式中,s105具体为:
[0063]
s1051:引入多层感知机,结合softmax激活函数,计算目标节点对相邻节点的第二注意力权重:
[0064][0065]
其中,
“”
表示拼接操作,表示目标节点的初始化表示,即隐状态。
[0066]
需要说明的是,通过计算第二注意力权重,可以进一步确定目标节点对相邻节点的重要程度,从而更好地捕捉推理图中节点之间的关系和依赖。这有助于提供更准确的节点表示和更有效的信息传递,进而为预测待验证文本的事实验证标签提供更准确的依据。
[0067]
s106:利用第二注意力权重对目标节点进行更新,得到多证据节点。
[0068]
在一种可能的实施方式中,s106具体为:
[0069]
s1061:通过第二注意力权重对细粒度信息进行加权求和,对目标节点进行更新,得到目标节点的多证据节点:
[0070][0071]
其中,表示与相关证据相对应的节点总数量。
[0072]
需要说明的是,通过将待核查金融文本和检索到的相关证据,通过细粒度处理,从词语级别获取到相邻节点到目标节点的证据传播能力,而不是直接采用整篇文正进行模糊处理,这样增加了各个相关证据之间的传播准确性,提升最终的金融文本核查可信度。
[0073]
s107:结合多证据节点,计算目标节点为真实标签的第一概率。
[0074]
在一种可能的实施方式中,s107具体为:
[0075]
s1071:利用linear线性变换函数和softmax激活函数,计算目标节点为真实标签的第一概率:
[0076][0077]
其中,g表示推理图,表示目标节点。
[0078]
需要说明的是,每个目标节点相对应的多证据节点是通过汇总推理图中与之相邻的节点的推理信息,使用这个多证据节点对目标节点进行更新的,因此,每个目标节点的真实概率取决于与其相关联的相邻节点所提供的推理信息,这样融合多个节点推理得到的目标节点的真实性就得到了保障,避免单一因素影响。
[0079]
s108:计算目标节点中的待核查金融文本和相关证据的匹配特征信息。
[0080]
需要说明的是,在最开始每个节点的建立过程是直接将待核查金融文本分别与相关证据连接,并未考虑节点与相关证据的关联性,在这一步,通过计算目标节点中的待核查金融文本和相关证据的匹配特征信息,提取每个节点内部待核查金融文本和相关证据的相似度特征,将该因素加入到目标节点的真实性概率的计算过程,根据相似度特征确定每个节点的相应权重,降低可信度低证据的权重,最大程度的增加可信证据的权重,提升最终预测准确率。
[0081]
在一种可能的实施方式中,s108具体包括:
[0082]
s1081:建立目标节点中的待核查金融文本和相关证据的交互矩阵。
[0083]
s1082:利用核函数计算目标节点中的待核查金融文本和相关证据的匹配特征信息;
[0084][0085]
其中,c表示待验证文本,表示相关证据。
[0086]
s109:根据匹配特征信息,计算目标节点在推理图中被选择的第二概率。
[0087]
在一种可能的实施方式中,s109具体为:
[0088]
s1091:利用linear线性变换函数和softmax激活函数,计算目标节点为真实标签
的第二概率:
[0089]
。
[0090]
可以理解的是,在s108中通过计算每个节点内待核查金融文本和相关证据的相似性程度,基于此,在整个推理图中,为了区分每个节点的重要性程度,将每个节点的相似性程度作为度量标准,将相似性低的节点权重降低,相似性高的节点权重提高,这样通过最终的联合推理结果既避免了单一证据导致的推理偏差,也保证了推理结果的可靠性。
[0091]
s110:整合所有的目标节点的第一概率和相应的第二概率,计算待核查金融文本为真实标签的目标概率。
[0092]
需要说明的是,对于推理图中的每个节点都具有一个预测结果也就是第一概率,不论预测结果高低,结合s108中的节点内匹配特征信息对每个节点的预测结果进行权重分配,这个分配的过程也就是第二概率的计算过程,每个节点的第一概率和第二概率的乘积代表了该节点为真实标签的概率,通过将权重不同也就是与待核查金融文本相似度不同的各个节点的权重进行累加,得到最终的待核查金融文本为真实标签的目标概率。得到的目标概率融合了联合推理的优点,降低无关证据和低相关证据对待核查金融文本的可信度判定的影响,提高了预测准确性。
[0093]
在一种可能的实施方式中,s110具体为:
[0094]
s1101:将所有的目标节点的第一概率和相应的第二概率进行加权整合,计算待核查金融文本为真实标签的目标概率:
[0095]
。
[0096]
与现有技术相比,本发明至少具有以下有益技术效果:
[0097]
在本发明中,通过获取待核查金融文本的多条相关证据,并构建推理图,引入基于核函数的注意力机制抓取各节点之间的语义相似度,获取目标节点和相邻节点中相对应词语的细粒度信息,进而在词语级别上控制相邻节点到目标节点的证据传播,之后计算并利用目标节点对各相邻节点的第二注意力权重对目标节点进行更新,融合检索得到的多条相关证据进行联合推理得到多证据节点,并根据多证据节点计算目标节点为真的第一概率,预测准确率高。之后计算目标节点中的待核查金融文本和相关证据的匹配特征信息,进而计算得到目标节点为真第二概率,之后根据第一概率和第二概率进行整合,推理出目标节点中的待核查金融文本为真的目标概率,进一步提升预测准确性,避免单一证据推理和人工推理导致的结果局限性,在降低人工核查参与度,提升核查客观性的同时,减轻核查人员的工作负担,提升核查效率和核查结果的可信度。
[0098]
实施例2
[0099]
参考说明书附图2,示出了本发明提供的一种金融文本核查系统的结构示意图。
[0100]
在一个实施例中,本发明提供的一种金融文本核查系统20,用于执行实施例1中的金融文本核查方法,金融文本核查系统20包括:
[0101]
获取模块201,用于获取待核查金融文本;
[0102]
检索模块202,用于检索待核查金融文本的多条相关证据;
[0103]
拼接模块203,用于将待核查金融文本和每个相关证据进行拼接,将每个拼接结果
均作为节点进行全连接,构造关于待核查金融文本的推理图;
[0104]
第一计算模块204,用于结合基于核函数的注意力机制,计算目标节点中的词语对相邻节点的词语的第一注意力权重,获取相邻节点的细粒度信息,其中,目标节点为推理图中的任意一个节点;
[0105]
第二计算模块205,用于根据细粒度信息,计算目标节点对相邻节点的第二注意力权重;
[0106]
更新模块206,用于利用第二注意力权重对目标节点进行更新,得到多证据节点;
[0107]
第三计算模块207,用于结合多证据节点,计算目标节点为真实标签的第一概率;
[0108]
第四计算模块208,用于计算目标节点中的待核查金融文本和相关证据的匹配特征信息;
[0109]
第五计算模块209,用于根据匹配特征信息,计算目标节点在推理图中被选择的第二概率;
[0110]
整合模块210,用于整合所有的目标节点的第一概率和相应的第二概率,计算待核查金融文本为真实标签的目标概率。
[0111]
在一种可能的实施方式中,第一计算模块204具体包括:
[0112]
第一计算子模块,用于利用余弦相似度,计算目标节点的词语对相邻节点的词语的相似度值:
[0113][0114]
其中,分别表示目标节点中的第i个词语隐状态和相邻节点中的第j个词语隐状态;
[0115]
建立子模块,用于基于相似度值建立目标节点和相邻节点的交互矩阵;
[0116]
第二计算子模块,用于结合交互矩阵,计算目标节点的词语对相邻节点的词语的语义匹配特征值:
[0117][0118]
其中,和分别表示第k个核函数的均值和方差,q表示相邻节点,p表示目标节点;
[0119]
第三计算子模块,用于利用linear线性变换函数和softmax激活函数,计算目标节点中的词语对相邻节点的词语的第一注意力权重:
[0120]
;
[0121]
整合子模块,用于利用第一注意力权重,整合目标节点的词语,得到相邻节点的细粒度信息,以控制相邻节点向目标节点的证据传播:
[0122][0123]
其中,m表示待核查金融文本的词语数量,n表示相关证据的词语数量。
[0124]
在一种可能的实施方式中,第二计算模块205具体包括:
[0125]
第四计算子模块,用于引入多层感知机,结合softmax激活函数,计算目标节点对相邻节点的第二注意力权重:
[0126][0127]
其中,
“”
表示拼接操作,表示目标节点的初始化表示,即隐状态。
[0128]
在一种可能的实施方式中,更新模块206具体包括:
[0129]
更新子模块,用于通过第二注意力权重对细粒度信息进行加权求和,对目标节点进行更新,得到目标节点的多证据节点:
[0130][0131]
其中,l表示与相关证据相对应的节点总数量。
[0132]
在一种可能的实施方式中,第三计算模块207具体包括:
[0133]
第五计算子模块,用于利用linear线性变换函数和softmax激活函数,计算目标节点为真实标签的第一概率:
[0134][0135]
其中,g表示推理图,表示目标节点。
[0136]
在一种可能的实施方式中,第四计算模块208具体包括:
[0137]
建立子模块,用于建立目标节点中的待核查金融文本和相关证据的交互矩阵;
[0138]
第六计算子模块,用于利用核函数计算目标节点中的待核查金融文本和相关证据的匹配特征信息;
[0139][0140]
其中,c表示待验证文本,表示相关证据。
[0141]
在一种可能的实施方式中,第五计算模块209具体包括:
[0142]
第七计算子模块,用于利用linear线性变换函数和softmax激活函数,计算目标节点为真实标签的第二概率:
[0143]
。
[0144]
在一种可能的实施方式中,整合模块210具体包括:
[0145]
第八计算子模块,用于将所有的目标节点的第一概率和相应的第二概率进行加权整合,计算待核查金融文本为真实标签的目标概率:
[0146]
。
[0147]
本发明提供的一种金融文本核查系统20可以实现上述实施例1中的金融文本核查方法的步骤和效果,为避免重复,本发明不再赘述。
[0148]
与现有技术相比,本发明至少具有以下有益技术效果:
[0149]
在本发明中,通过获取待核查金融文本的多条相关证据,并构建推理图,引入基于核函数的注意力机制抓取各节点之间的语义相似度,获取目标节点和相邻节点中相对应词语的细粒度信息,进而在词语级别上控制相邻节点到目标节点的证据传播,之后计算并利用目标节点对各相邻节点的第二注意力权重对目标节点进行更新,融合检索得到的多条相关证据进行联合推理得到多证据节点,并根据多证据节点计算目标节点为真的第一概率,预测准确率高。之后计算目标节点中的待核查金融文本和相关证据的匹配特征信息,进而计算得到目标节点为真第二概率,之后根据第一概率和第二概率进行整合,推理出目标节点中的待核查金融文本为真的目标概率,进一步提升预测准确性,避免单一证据推理和人工推理导致的结果局限性,在降低人工核查参与度,提升核查客观性的同时,减轻核查人员的工作负担,提升核查效率和核查结果的可信度。
[0150]
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
[0151]
以上实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
技术特征:
1.一种金融文本核查方法,其特征在于,包括:s101:获取待核查金融文本;s102:检索所述待核查金融文本的多条相关证据;s103:将所述待核查金融文本和每个所述相关证据进行拼接,将每个拼接结果均作为节点进行全连接,构造关于所述待核查金融文本的推理图;s104:结合基于核函数的注意力机制,计算目标节点中的词语对相邻节点的词语的第一注意力权重,获取所述相邻节点的细粒度信息,其中,所述目标节点为所述推理图中的任意一个节点;s105:根据所述细粒度信息,计算所述目标节点对所述相邻节点的第二注意力权重;s106:利用所述第二注意力权重对所述目标节点进行更新,得到多证据节点;s107:结合所述多证据节点,计算所述目标节点为真实标签的第一概率;s108:计算所述目标节点中的待核查金融文本和相关证据的匹配特征信息;s109:根据所述匹配特征信息,计算所述目标节点在所述推理图中被选择的第二概率;s110:整合所有的所述目标节点的第一概率和相应的第二概率,计算所述待核查金融文本为真实标签的目标概率。2.根据权利要求1所述的金融文本核查方法,其特征在于,所述s104具体包括:s1041:利用余弦相似度,计算所述目标节点的词语对所述相邻节点的词语的相似度值:;其中,分别表示所述目标节点中的第i个词语隐状态和所述相邻节点中的第j个词语隐状态;s1042:基于所述相似度值建立所述目标节点和所述相邻节点的交互矩阵;s1043:结合所述交互矩阵,计算所述目标节点的词语对所述相邻节点的词语的语义匹配特征值:;其中,和分别表示第k个核函数的均值和方差,q表示所述相邻节点,p表示所述目标节点;s1044:利用linear线性变换函数和softmax激活函数,计算所述目标节点中的词语对相邻节点的词语的第一注意力权重:;s1045:利用所述第一注意力权重,整合所述目标节点的词语,得到所述相邻节点的细粒度信息,以控制所述相邻节点向所述目标节点的证据传播:;其中,m表示所述待核查金融文本的词语数量,n表示所述相关证据的词语数量。3.根据权利要求1所述的金融文本核查方法,其特征在于,所述s105具体为:
s1051:引入多层感知机,结合softmax激活函数,计算所述目标节点对所述相邻节点的第二注意力权重:;其中,
“”
表示拼接操作,表示所述目标节点的初始化表示,即隐状态。4.根据权利要求1所述的金融文本核查方法,其特征在于,所述s106具体为:s1061:通过所述第二注意力权重对所述细粒度信息进行加权求和,对所述目标节点进行更新,得到所述目标节点的多证据节点:;其中,表示与所述相关证据相对应的节点总数量。5.根据权利要求1所述的金融文本核查方法,其特征在于,所述s107具体为:s1071:利用linear线性变换函数和softmax激活函数,计算所述目标节点为真实标签的第一概率:;其中,g表示所述推理图,表示所述目标节点。6.根据权利要求1所述的金融文本核查方法,其特征在于,所述s108具体包括:s1081:建立所述目标节点中的待核查金融文本和相关证据的交互矩阵;s1082:利用核函数计算所述目标节点中的待核查金融文本和相关证据的匹配特征信息;;其中,c表示待验证文本,表示所述相关证据。7.根据权利要求1所述的金融文本核查方法,其特征在于,所述s109具体为:s1091:利用linear线性变换函数和softmax激活函数,计算所述目标节点为真实标签的第二概率:。8.根据权利要求1所述的金融文本核查方法,其特征在于,所述s110具体为:s1101:将所有的所述目标节点的第一概率和相应的第二概率进行加权整合,计算所述待核查金融文本为真实标签的目标概率:。9.一种金融文本核查系统,其特征在于,包括:获取模块,用于获取待核查金融文本;检索模块,用于检索所述待核查金融文本的多条相关证据;拼接模块,用于将所述待核查金融文本和每个所述相关证据进行拼接,将每个拼接结
果均作为节点进行全连接,构造关于所述待核查金融文本的推理图;第一计算模块,用于结合基于核函数的注意力机制,计算目标节点中的词语对相邻节点的词语的第一注意力权重,获取所述相邻节点的细粒度信息,其中,所述目标节点为所述推理图中的任意一个节点;第二计算模块,用于根据所述细粒度信息,计算所述目标节点对所述相邻节点的第二注意力权重;更新模块,用于利用所述第二注意力权重对所述目标节点进行更新,得到多证据节点;第三计算模块,用于结合所述多证据节点,计算所述目标节点为真实标签的第一概率;第四计算模块,用于计算所述目标节点中的待核查金融文本和相关证据的匹配特征信息;第五计算模块,用于根据所述匹配特征信息,计算所述目标节点在所述推理图中被选择的第二概率;整合模块,用于整合所有的所述目标节点的第一概率和相应的第二概率,计算所述待核查金融文本为真实标签的目标概率。10.根据权利要求9所述的金融文本核查系统,其特征在于,所述第一计算模块具体包括:第一计算子模块,用于利用余弦相似度,计算所述目标节点的词语对所述相邻节点的词语的相似度值:;其中,分别表示所述目标节点中的第i个词语隐状态和所述相邻节点中的第j个词语隐状态;建立子模块,用于基于所述相似度值建立所述目标节点和所述相邻节点的交互矩阵;第二计算子模块,用于结合所述交互矩阵,计算所述目标节点的词语对所述相邻节点的词语的语义匹配特征值:;其中,和分别表示第k个核函数的均值和方差,q表示所述相邻节点,p表示所述目标节点;第三计算子模块,用于利用linear线性变换函数和softmax激活函数,计算所述目标节点中的词语对相邻节点的词语的第一注意力权重:;整合子模块,用于利用所述第一注意力权重,整合所述目标节点的词语,得到所述相邻节点的细粒度信息,以控制所述相邻节点向所述目标节点的证据传播:;其中,m表示所述待核查金融文本的词语数量,n表示所述相关证据的词语数量。
技术总结
本发明公开了一种金融文本核查方法及系统,属于文本核查技术领域,方法包括:获取待核查金融文本;检索待核查金融文本的多条相关证据;将待核查金融文本和每个相关证据进行拼接,构造关于待核查金融文本的推理图;计算目标节点中的词语对相邻节点的词语的第一注意力权重,获取相邻节点的细粒度信息;计算目标节点对相邻节点的第二注意力权重;利用第二注意力权重对目标节点进行更新,得到多证据节点;计算目标节点为真实标签的第一概率;计算目标节点在推理图中被选择的第二概率;整合第一概率和相应的第二概率,计算待核查金融文本为真实标签的目标概率。降低人工核查参与度,提升核查客观性的同时,提升核查效率和核查结果的可信度。果的可信度。果的可信度。
技术研发人员:陈淑翠 王忠民
受保护的技术使用者:北京营加品牌管理有限公司
技术研发日:2023.07.07
技术公布日:2023/8/5
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
