信息识别模型建立方法、装置与信息识别方法、装置与流程

未命名 07-14 阅读:104 评论:0


1.本技术涉及计算机技术领域,特别是涉及一种信息识别模型建立方法、装置、计算机设备、存储介质和计算机程序产品,另外还涉及一种信息识别方法、装置、计算机设备、存储介质和计算机程序产品。


背景技术:

2.随着信息技术的发展,人与智能机器人之间的沟通变得更加频繁,所以识别某个事物所表达的信息背后的意图变得尤为重要。
3.传统技术中,以传统的对话机器人与用户之间的对话为例,对话机器人一般采用半双工方式,可以识别用户所表达的信息背后的意图。然而,利用这个方法,只有当对话机器人自己预设的语句结束播报后,才能实现用户的语句进行识别,这时,如果用户想要提前结束对话机器人,就必须得等待对话机器人预设的语句结束播报,对话机器人才能进行对用户的信息识别,这严重影响了人机交互的实时性。


技术实现要素:

4.基于此,有必要针对上述技术问题,提供一种可以支持人机实时交互的信息识别模型建立方法、装置、计算机设备、计算机可读存储介质和计算机程序产品,另外,还提供了一种实时的信息识别方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
5.第一方面,本技术提供了一种信息识别模型建立方法。所述方法包括:
6.获取待训练信息、正样本关键词库、初始bert(bidirectional encoder representation from transformers,基于变换器的双向编码器表示)深度网络模型以及预设待训练信息对应的标签;
7.对所述待训练信息进行分词处理,得到所述待训练信息的关键词,并将所述关键词与所述正样本关键词库进行匹配;
8.当匹配结果为一致时,根据匹配结果为一致的所述关键词构建关键词集合;
9.根据所述关键词集合,得到数值型矩阵;
10.将所述数值型矩阵以及所述预设待训练信息对应的标签输入至所述初始bert深度网络模型进行训练,得到目标信息识别模型。
11.在其中一个实施例中,获取正样本关键词库包括:
12.获取历史信息以及专家关键词库;
13.对所述历史信息进行分词处理,得到分词处理后的历史信息;
14.根据所述分词处理后的历史信息,得到预训练词向量矩阵;
15.对比所述预训练词向量矩阵以及所述专家关键词库,对所述专家关键词库进行扩充,得到正样本关键词库。
16.在其中一个实施例中,所述根据所述分词处理后的历史信息,得到预训练词向量矩阵包括:
17.采用fasttext算法对所述分词处理后的历史信息进行无监督学习,得到预训练词向量矩阵。
18.在其中一个实施例中,所述根据所述关键词集合,得到数值型矩阵包括:
19.对所述关键词集合进行掩码处理,获取掩码处理后的关键词集合;
20.根据所述掩码处理后的关键词集合,进行文本编码,得到数值型矩阵。
21.第二方面,本技术还提供了一种信息识别模型建立装置。所述装置包括:
22.训练信息获取模块,用于获取待训练信息、正样本关键词库、初始bert深度网络模型以及预设待训练信息对应的标签;
23.训练信息匹配模块,用于对所述待训练信息进行分词处理,得到所述待训练信息的关键词,并将所述关键词与所述正样本关键词库进行匹配;
24.训练集合获取模块,用于当匹配结果为一致时,根据匹配结果为一致的所述关键词构建关键词集合;
25.训练矩阵获取模块,用于根据所述关键词集合,得到数值型矩阵;
26.训练模型建立模块,用于将所述数值型矩阵以及所述预设待训练信息对应的标签输入至初始bert深度网络模型进行训练,得到目标信息识别模型。
27.第三方面,本技术还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
28.获取待训练信息、正样本关键词库、初始bert深度网络模型以及预设待训练信息对应的标签;
29.对所述待训练信息进行分词处理,得到所述待训练信息的关键词,并将所述关键词与所述正样本关键词库进行匹配;
30.当匹配结果为一致时,根据匹配结果为一致的所述关键词构建关键词集合;
31.根据所述关键词集合,得到数值型矩阵;
32.将所述数值型矩阵以及所述预设待训练信息对应的标签输入至所述初始bert深度网络模型进行训练,得到目标信息识别模型。
33.第四方面,本技术还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
34.获取待训练信息、正样本关键词库、初始bert深度网络模型以及预设待训练信息对应的标签;
35.对所述待训练信息进行分词处理,得到所述待训练信息的关键词,并将所述关键词与所述正样本关键词库进行匹配;
36.当匹配结果为一致时,根据匹配结果为一致的所述关键词构建关键词集合;
37.根据所述关键词集合,得到数值型矩阵;
38.将所述数值型矩阵以及所述预设待训练信息对应的标签输入至所述初始bert深度网络模型进行训练,得到目标信息识别模型。
39.第五方面,本技术还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
40.获取待训练信息、正样本关键词库、初始bert深度网络模型以及预设待训练信息对应的标签;
41.对所述待训练信息进行分词处理,得到所述待训练信息的关键词,并将所述关键词与所述正样本关键词库进行匹配;
42.当匹配结果为一致时,根据匹配结果为一致的所述关键词构建关键词集合;
43.根据所述关键词集合,得到数值型矩阵;
44.将所述数值型矩阵以及所述预设待训练信息对应的标签输入至所述初始bert深度网络模型进行训练,得到目标信息识别模型。
45.上述信息识别模型建立方法、装置、计算机设备、存储介质和计算机程序产品,获取待训练信息、正样本关键词库、初始bert深度网络模型以及预设待训练信息对应的标签;对待训练信息进行分词处理,得到待训练信息的关键词,并将关键词与正样本关键词库进行匹配;当匹配结果为一致时,根据匹配结果为一致的关键词构建关键词集合;对关键词集合进行掩码处理,得到掩码处理后的关键词集合;根据掩码处理后的关键词集合,得到数值型矩阵;将数值型矩阵以及预设待训练信息对应的标签输入至初始bert深度网络模型进行训练,得到目标信息识别模型。通过利用正样本关键词库对待训练信息的关键词进行匹配,能够对关键词进行一个初步的过滤,并利用过滤后的关键词得到数值型矩阵,将数值型矩阵以及预设待训练信息对应的标签输入至初始bert深度网络模型,能够训练出一个后续可以实时识别出输入矩阵的标签的目标信息识别模型,建立的目标信息识别模型可以支持人机实时交互。
46.第六方面,本技术提供了一种信息识别方法。所述方法包括:
47.获取待识别信息;
48.根据所述待识别信息,生成所述待识别信息对应的数值型矩阵;
49.将所述数值型矩阵输入至目标信息识别模型,得到信息识别结果;
50.其中,所述目标信息识别模型采用如上述所述信息识别模型建立方法建立。
51.在其中一个实施例中,所述根据所述待识别信息,生成所述待识别信息对应的数值型矩阵包括:
52.获取正样本关键词库、业务逻辑需求数据以及词性规则;
53.根据所述业务逻辑需求数据以及所述词性规则,对所述待识别信息进行初步识别,得到初步识别结果;
54.当所述初步识别结果表征需要二次识别时,对所述初步识别的信息进行分词处理,并将所述分词处理后的初步识别的信息与所述正样本关键词库进行匹配;
55.当匹配结果为一致时,根据匹配结果为一致的关键词构建所述待识别信息对应的关键词集合;
56.对所述关键词集合进行掩码以及文本编码处理,生成所述待识别信息对应的数值型矩阵。
57.第七方面,本技术提供了一种信息识别装置。所述装置包括:
58.待识别信息获取模块,用于获取待识别信息;
59.待识别矩阵生成模块,用于根据所述待识别信息,生成所述待识别信息对应的数值型矩阵;
60.信息识别模块,用于将所述数值型矩阵输入至目标信息识别模型,得到信息识别结果;
61.其中,所述目标信息识别模型采用如上述所述信息识别模型建立方法建立。
62.第八方面,本技术还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
63.获取待识别信息;
64.根据所述待识别信息,生成所述待识别信息对应的数值型矩阵;
65.将所述数值型矩阵输入至目标信息识别模型,得到信息识别结果;
66.其中,所述目标信息识别模型采用如上述所述信息识别模型建立方法建立。
67.第九方面,本技术还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
68.获取待识别信息;
69.根据所述待识别信息,生成所述待识别信息对应的数值型矩阵;
70.将所述数值型矩阵输入至目标信息识别模型,得到信息识别结果;
71.其中,所述目标信息识别模型采用如上述所述信息识别模型建立方法建立。
72.第十方面,本技术还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
73.获取待识别信息;
74.根据所述待识别信息,生成所述待识别信息对应的数值型矩阵;
75.将所述数值型矩阵输入至目标信息识别模型,得到信息识别结果;
76.其中,所述目标信息识别模型采用如上述所述信息识别模型建立方法建立。
77.上述信息识别方法、装置、计算机设备、存储介质和计算机程序产品,获取待识别信息、正样本关键词库、业务逻辑需求以及词性规则;根据业务逻辑需求以及词性规则,对待识别信息进行初步识别,得到初步识别结果;当初步识别结果为不输出标签时,对初步识别的信息进行分词处理,并与正样本关键词库进行匹配;当匹配结果为一致时,根据匹配结果为一致的关键词构建关键词集合,并对关键词集合进行掩码以及文本编码处理,得到数值型矩阵;将数值型矩阵输入至目标信息识别模型,得到识别结果。整个方案可以在获取到待识别信息后立即根据业务逻辑需求、词性规则以及目标信息识别模型,实时识别用户所表达的信息背后的意图,提高了人机交互的实时性。
附图说明
78.图1为一个实施例中信息识别建立方法以及信息识别方法的应用环境图;
79.图2为一个实施例中信息识别模型建立方法的流程示意图;
80.图3为另一个实施例中信息识别模型建立方法的流程示意图;
81.图4为一个实施例中信息识别方法的流程示意图;
82.图5为一个实施例中信息识别模型建立装置的结构框图;
83.图6为一个实施例中信息识别装置的结构框图;
84.图7为一个实施例中计算机设备的内部结构图。
具体实施方式
85.为了使本技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对
本技术进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本技术,并不用于限定本技术。
86.本技术实施例提供的信息识别方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。数据存储系统可以存储服务器104需要处理的数据。数据存储系统可以集成在服务器104上,也可以放在云上或其他网络服务器上。整个信息识别方法包括信息识别模型构建阶段和信息识别模型应用阶段,下面将针对两个阶段在实际应用中的数据处理过程展开描述。
87.信息识别模型构建阶段。终端102发送信息识别模型建立请求至服务器104,信息识别模型建立请求中携带待训练信息、正样本关键词库、初始bert深度网络模型以及预设待训练信息对应的标签,服务器104接收终端102发送的信息识别模型建立请求,提取信息识别模型建立请求中携带的待训练信息、正样本关键词库、初始bert深度网络模型以及预设待训练信息对应的标签;服务器104对待训练信息进行分词处理,得到待训练信息的关键词,并将关键词与正样本关键词库进行匹配;当匹配结果为一致时,根据匹配结果为一致的关键词构建关键词集合;根据关键词集合,得到数值型矩阵;将数值型矩阵以及预设待训练信息对应的标签输入至初始bert深度网络模型进行训练,得到目标信息识别模型。
88.信息识别模型应用阶段。服务器104在接收到终端102发送的信息识别请求时,提取信息识别请求中携带的待识别信息;根据待识别信息,生成待识别信息对应的数值型矩阵;将数值型矩阵输入至目标信息识别模型,得到信息识别结果。更进一步地,信息识别结果会被反馈至终端102。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备,物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
89.在一个实施例中,如图2所示,提供了一种信息识别模型建立方法,以该方法应用于图1中的服务器104为例进行说明,包括以下步骤:
90.s100,获取待训练信息、正样本关键词库、初始bert深度网络模型以及预设待训练信息对应的标签。
91.其中,待训练信息是指在一个业务领域中可以用于训练的信息;正样本是指由与待训练信息在一个业务领域中的历史信息得到的样本;正样本关键词库是指与待训练信息在一个业务领域中的历史信息得到的样本关键词集合;bert深度网络模型是一种利用自注意力方式得到多层深度网络的预训练语言表征模型,它不再像以往一样采用传统的单向语言模型或者把两个单向语言模型进行浅层拼接的方法来进行预训练,而是采用新的掩码语言模型,能生成深度的双向语言表征,且能够对文本句意进行很好的表征;初始bert深度网络模型是指初始的未进行训练的bert深度网络模型。
92.具体地,终端发送信息识别模型建立请求至服务器,信息识别模型建立请求中携带待训练信息、正样本关键词库、初始bert深度网络模型以及预设待训练信息对应的标签,服务器104接收终端102发送的信息识别模型建立请求,提取信息识别模型建立请求中携带的待训练信息、正样本关键词库、初始bert深度网络模型以及预设待训练信息对应的标签。
93.s200,对待训练信息进行分词处理,得到待训练信息的关键词,并将关键词与正样本关键词库进行匹配。
94.具体地,服务器对待训练信息进行如jieba切词等分词方式的处理,得到待训练信息的若干关键词,将得到的关键词与正样本关键词库进行匹配,判断得到的关键词中是否有与正样本关键词库中的关键词能够匹配一致的,并获取匹配结果,匹配结果包括一致和不一致。
95.s300,当匹配结果为一致时,根据匹配结果为一致的关键词构建关键词集合。
96.具体地,当待训练信息的关键词与正样本关键词库中的关键词的匹配结果为一致时,即待训练信息的关键词在正样本关键词库中能够找到相同的关键词时,服务器会将所有在正样本关键词库中能找到相同关键词的待训练信息的关键词集合起来,来构建关键词集合。
97.s400,根据关键词集合,得到数值型矩阵。
98.其中,数值型矩阵是指用人为定义的数字(如整数、小数、有理数等)表示的矩阵。
99.具体地,服务器对匹配结果为一致的关键词集合进行处理,来得到可以被初始bert深度网络模型识别的数值型矩阵。
100.s500,将数值型矩阵以及预设待训练信息对应的标签输入至初始bert深度网络模型进行训练,得到目标信息识别模型。
101.具体地,由于数值型矩阵是待训练信息进行一系列处理后得到的矩阵,所以服务器将数值型矩阵以及预设待训练信息对应的标签输入至初始bert深度网络模型,根据数值型矩阵以及预设待训练信息对应的标签对初始bert深度网络模型中的预训练bert模块和mlp(multilayer perceptron,多层感知机)模块进行训练,得到目标信息识别模型,其中,mlp模块是全连接模型,根据设置的神经元个数n可以将高维度矩阵降维到设定的n维,即本技术中mlp模块起降维作用,并下游连接分类类别标签,其中,分类类别数目可以为二分类、三分类等分类数目。如当预设待训练信息对应的标签为打断标签和不打断标签时,此时的分类类别数目为二分类,且目标信息识别模型可以识别的是与历史信息同一业务领域的信息。
102.更进一步地,当输入新的信息时,训练好的目标信息识别模型会输出信息对应的标签。
103.上述信息识别模型建立方法、装置、计算机设备、存储介质和计算机程序产品,获取待训练信息、正样本关键词库、初始bert深度网络模型以及预设待训练信息对应的标签;对待训练信息进行分词处理,得到待训练信息的关键词,并将关键词与正样本关键词库进行匹配;当匹配结果为一致时,根据匹配结果为一致的关键词构建关键词集合;对关键词集合进行掩码处理,得到掩码处理后的关键词集合;根据掩码处理后的关键词集合,得到数值型矩阵;将数值型矩阵以及预设待训练信息对应的标签输入至初始bert深度网络模型进行训练,得到目标信息识别模型。通过利用正样本关键词库对待训练信息的关键词进行匹配,能够对关键词进行一个初步的过滤,并利用过滤后的关键词得到数值型矩阵,将数值型矩阵以及预设待训练信息对应的标签输入至初始bert深度网络模型,能够训练出一个后续可以实时识别出输入矩阵的标签的目标信息识别模型,建立的目标信息识别模型可以支持人机实时交互。
104.在一个实施例中,获取正样本关键词库包括:
105.获取历史信息以及专家关键词库;对历史信息进行分词处理,得到分词处理后的
历史信息。
106.其中,专家关键词库是指人工总结的重要度高的关键词库,在不同行业、不同业务场景中都存在不同的专家关键词库。
107.具体地,服务器获取与待训练信息同一业务领域里的历史信息以及与历史信息同一业务领域的人工总结的重要度高的关键词库后,会对历史信息进行分词处理,将每条历史信息划分为若干关键词,此时得到分词处理后的历史信息。
108.更进一步地,对历史信息进行分词处理的方式可以是jieba切词等可以将信息划分为若干关键词的分词方式。
109.根据分词处理后的历史信息,得到预训练词向量矩阵。
110.其中,预训练词向量是指在大型数据集上通过自编码方式对文本词汇进行学习得到词编码向量,结果可以应用在邻域内的其他任务中。本技术中的预训练词向量矩阵是指对关键词进行预训练后得到的向量矩阵。
111.具体地,服务器根据分词处理后的历史信息,对分词处理后的历史信息进行预训练学习,得到预训练词向量矩阵。
112.对比预训练词向量矩阵以及专家关键词库,对专家关键词库进行扩充,得到正样本关键词库。
113.具体地,得到预训练词向量矩阵后,服务器对同一业务领域的专家关键词库进行遍历,同时将专家关键词库与预训练词向量矩阵对比,此时专家关键词库中的每一个关键词都能在预训练词向量矩阵中找到t个意思相近的词,其中,t可以被限定为0、1、2等任何自然数。此时利用预训练词向量矩阵中找到的t个意思相近的词对原专家关键词库进行扩充并去重,得到扩充后的专家关键词库,即正样本关键词库。
114.更进一步地,在得到扩充后的专家关键词库之后,为了使得到的正样本关键词库更加准确,还可以人工对扩充后的专家关键词库进行逐条复核,剔除扩充后的专家关键词库中一些不属于与历史信息同一业务领域的关键词。
115.本实施例中,通过利用预训练词向量矩阵对专家关键词库进行扩充,能够使专家关键词库更加丰富,确保后续能够利用更丰富的专家关键词库来更准确地对信息识别模型进行建模。
116.在其中一个实施例中,根据分词处理后的历史信息,得到预训练词向量矩阵包括:
117.采用fasttext算法对分词处理后的历史信息进行无监督学习,得到预训练词向量矩阵。
118.其中,fasttext算法是一个能够自己训练词向量的快速文本分类算法,是对海量文本进行无监督的自编码算法进行文本表征学习的过程,具备高精度、高训练速度、以及高测试速度性。
119.具体地,本技术对分词处理后的历史信息进行无监督学习的方法是采用fasttext算法,它通过n-gram的思想对文本之间字和词的组合关系进行学习,从而得到预训练词向量矩阵。
120.更进一步地,为了使模型更好地去捕获错别字,本技术的fasttext算法中最大n-gram的参数设置为2,即参数设置被设置为小窗口,此时将会通过小窗口学习到两个词汇之间的共性,比如在一些文本信息中,“安装”会出现手写导致的错别字“按装”(同形字),以及
同音错别字“似乎”和“是乎”,就会学习到这些同形错别字和同音错别字之间的共性,使得得到的词向量之间的距离会更近,对信息中的部分错误有鲁棒性,缓解信息词汇的长尾问题。
121.本实施例中,通过采用fasttext算法对分词处理后的历史信息进行无监督学习,能够缓解信息词汇的长尾问题,并得到预训练词向量矩阵,从而辅助构建包含长尾分布的鲁棒性更高的正样本关键词库。
122.在其中一个实施例中,如图3所示,s400包括:
123.s420,对关键词集合进行掩码处理,获取掩码处理后的关键词集合。
124.其中,掩码处理是指mask处理,相当于在原始张量上盖上一层掩膜,从而屏蔽或选择一些特定元素。
125.具体地,服务器获取到匹配结果为一致的关键词集合后,随机对关键词集合中的关键词进行顺序打乱处理,并对打乱顺序后的关键词集合中的每一个关键词进行掩码处理,获取掩码处理后的关键词集合。
126.更进一步地,对打乱顺序后的关键词集合中的每一个关键词进行掩码处理的方法是对每一个关键词按照85%概率保留15%概率删除的mask方式进行处理。
127.s440,根据掩码处理后的关键词集合,进行文本编码,得到数值型矩阵。
128.其中,文本编码是指通过数据变换或者映射将文本转化为其他表达形式,本技术中是指将文本转换为数值型矩阵。
129.具体地,掩码处理后的关键词集合为{kws1,kws2},转换为文本格式如下[cls]text[sep]kws1[sep]kws2[sep],若掩码处理后的关键词集合为空则文本格式为:[cls]text[sep];以文本格式为:[cls]麻烦给我转接人工吧![sep]人工[sep]为例,对该文本格式进行编码处理,得到可以被初始bert深度网络模型识别的数值型矩阵:[101,7558,584,336,215,468,2104,5589,23,347,4611,102,5589,23,102]。
[0130]
更进一步地,对文本格式进行编码处理的方法之一可以是将文本格式送入初始bert深度网络模型中,利用模型中的映射表可以输出token+segment数值型矩阵,其中,在模型的映射表中每个汉字或标识符都对应一个数字,且输出的token+segment数值型矩阵可以重新输入至初始bert深度网络模型来训练模型中的预训练bert模块和mlp模块。
[0131]
本实施例中,对关键词集合进行掩码处理的目的是为了既保证重要词让模型侧重训练,又减弱模型对关键词的识别依赖,提高模型的泛化能力;且通过编码能够得到可以被初始bert深度网络模型模块识别计算的数值型矩阵。
[0132]
在一个实施例中,如图4所示,提供了一种信息识别方法,以该方法应用于图1中的服务器104为例进行说明,包括以下步骤:
[0133]
s600,获取待识别信息。
[0134]
其中,待识别信息是与建立的目标信息识别模型能识别的业务领域信息一致的信息。
[0135]
具体地,服务器在接收到终端发送的信息识别请求时,提取信息识别请求中携带的待识别信息。
[0136]
s700,根据待识别信息,生成待识别信息对应的数值型矩阵。
[0137]
具体地,服务器得到待识别信息后,会对待识别信息进行进一步处理,从而得到可
以被目标信息识别模型识别的待识别信息对应的数值型矩阵。
[0138]
s800,将数值型矩阵输入至目标信息识别模型,得到信息识别结果。
[0139]
其中,目标信息识别模型采用如上述信息识别模型建立方法建立。
[0140]
具体地,将数值型矩阵输入目标信息识别模型进行推理,目标信息识别模型可以输出待识别信息对应的标签,该标签即为信息识别结果,如当建立的目标信息识别模型所需预设待训练信息对应的标签为打断标签和不打断标签时,将数值型矩阵输入至目标信息识别模型后,输出的标签会为二分类标签中的一个,即会输出打断标签或不打断标签。
[0141]
上述信息识别方法、装置、计算机设备、存储介质和计算机程序产品,获取待识别信息、正样本关键词库、业务逻辑需求以及词性规则;根据业务逻辑需求以及词性规则,对待识别信息进行初步识别,得到初步识别结果;当初步识别结果为不输出标签时,对初步识别的信息进行分词处理,并与正样本关键词库进行匹配;当匹配结果为一致时,根据匹配结果为一致的关键词构建关键词集合,并对关键词集合进行掩码以及文本编码处理,得到数值型矩阵;将数值型矩阵输入至目标信息识别模型,得到识别结果。整个方案可以在获取到待识别信息后立即根据业务逻辑需求、词性规则以及目标信息识别模型,实时识别用户所表达的信息背后的意图,提高了人机交互的实时性。
[0142]
在一个实施例中,根据待识别信息,生成待识别信息对应的数值型矩阵包括:
[0143]
获取正样本关键词库、业务逻辑需求数据以及词性规则。
[0144]
其中,正样本关键词库为上述目标信息识别模型建立的过程中得到的正样本关键词库;业务逻辑需求数据为与待识别信息同一业务领域的可以满足业务特殊需求的数据;词性规则是指符合完整语法的规则。
[0145]
根据业务逻辑需求数据以及词性规则,对待识别信息进行初步识别,得到初步识别结果。
[0146]
具体地,以初步识别结果为打断标签或不打断标签为例,对于业务逻辑需求数据来说,根据业务逻辑需求数据对待识别信息进行初步识别,且当信息满足业务逻辑需求数据,认定可以直接输出时就可以直接输出初步识别结果为不打断标签,另外若业务逻辑需求数据中认为此业务领域对a敏感,此时对待识别信息进行初步识别时,就需要直接将含a以及a相似字眼的信息直接输出初步识别结果为打断标签;对于词性规则来说,基于信息本身的语法词性,本技术利用jieba库的词性标注功能对待识别信息进行初步识别,当识别出不符合完整语法的部分时,将待识别信息认定为流式中间结果,并将不打断标签作为初步识别结果直接输出;若根据业务逻辑需求数据以及词性规则对待识别信息进行初步识别时无法直接输出不打断标签或打断标签时,认定初步识别结果表征需要二次识别。
[0147]
当初步识别结果表征需要二次识别时,对初步识别的信息进行分词处理,并将分词处理后的初步识别的信息与正样本关键词库进行匹配。
[0148]
具体地,当初步识别结果表征需要二次识别时,对初步识别的信息进行分词处理,得到若干关键词,并将分词处理后得到的关键词与正样本关键词库进行匹配,得到匹配结果,匹配结果包括一致或不一致。
[0149]
当匹配结果为一致时,根据匹配结果为一致的关键词构建待识别信息对应的关键词集合。
[0150]
具体地,当匹配结果为一致时,即分词处理后的初步识别的信息在正样本关键词
库中能寻找到一致的关键词,则根据匹配结果为一致的关键词构建待识别信息对应的关键词集合。
[0151]
对关键词集合进行掩码以及文本编码处理,生成待识别信息对应的数值型矩阵。
[0152]
具体地,随机打乱关键词集合中关键词的顺序,并对每一个关键词按照85%保留15%概率删除的mask掩码方式进行处理,并对掩码处理后的关键词集合的文本格式进行文本编码处理,生成待识别信息对应的数值型矩阵。
[0153]
本实施例中,能够根据业务逻辑需求数据以及词性规则对待识别信息进行初步识别,提高对信息识别准确性,并生成了利用目标信息识别模型进行识别的待识别信息对应的数值型矩阵。
[0154]
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
[0155]
基于同样的发明构思,本技术实施例还提供了一种用于实现上述所涉及的信息识别模型建立方法的信息识别模型建立装置以及信息识别方法的信息识别装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个信息识别模型建立装置以及信息识别装置实施例中的具体限定可以参见上文中对于信息识别模型建立方法以及信息识别方法的限定,在此不再赘述。
[0156]
在一个实施例中,如图5所示,提供了一种信息识别模型建立装置,包括:训练信息获取模块100、训练信息匹配模块200、训练集合获取模块300、训练矩阵获取模块400和训练模型建立模块500,其中:
[0157]
训练信息获取模块100,用于获取待训练信息、正样本关键词库、初始bert深度网络模型以及预设待训练信息对应的标签;
[0158]
训练信息匹配模块200,用于对待训练信息进行分词处理,得到待训练信息的关键词,并将关键词与正样本关键词库进行匹配;
[0159]
训练集合获取模块300,用于当匹配结果为一致时,根据匹配结果为一致的关键词构建关键词集合;
[0160]
训练矩阵获取模块400,用于根据关键词集合,得到数值型矩阵;
[0161]
训练模型建立模块500,用于将数值型矩阵以及预设待训练信息对应的标签输入至初始bert深度网络模型进行训练,得到目标信息识别模型。
[0162]
在一个实施例中,还包括正样本关键词库获取模块,正样本关键词库获取用于获取历史信息以及专家关键词库;对历史信息进行分词处理,得到分词处理后的历史信息;根据分词处理后的历史信息,得到预训练词向量矩阵;对比预训练词向量矩阵以及专家关键词库,对专家关键词库进行扩充,得到正样本关键词库。
[0163]
在一个实施例中,还包括预训练词向量模块,预训练词向量模块用于采用fasttext算法对分词处理后的历史信息进行无监督学习,得到预训练词向量矩阵。
[0164]
在一个实施例中,训练矩阵获取模块400还用于对关键词集合进行掩码处理,获取掩码处理后的关键词集合;根据掩码处理后的关键词集合,进行文本编码,得到数值型矩阵。
[0165]
在一个实施例中,如图6所示,提供了一种信息识别装置,包括:待识别信息获取模块600、待识别矩阵生成模块700和信息识别模块800,其中:
[0166]
待识别信息获取模块600,用于获取待识别信息;
[0167]
待识别矩阵生成模块700,用于根据待识别信息,生成待识别信息对应的数值型矩阵;
[0168]
信息识别模块800,用于将数值型矩阵输入至目标信息识别模型,得到信息识别结果;
[0169]
其中,目标信息识别模型采用上述信息识别模型建立方法建立。
[0170]
在一个实施例中,待识别矩阵生成模块700还用于获取正样本关键词库、业务逻辑需求数据以及词性规则;根据业务逻辑需求数据以及词性规则,对待识别信息进行初步识别,得到初步识别结果;当初步识别结果表征需要二次识别时,对初步识别的信息进行分词处理,并将分词处理后的初步识别的信息与正样本关键词库进行匹配;当匹配结果为一致时,根据匹配结果为一致的关键词构建待识别信息对应的关键词集合;对关键词集合进行掩码以及文本编码处理,生成待识别信息对应的数值型矩阵。
[0171]
上述信息识别模型建立装置以及信息识别装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
[0172]
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图7所示。该计算机设备包括处理器、存储器、输入/输出接口(input/output,简称i/o)和通信接口。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储待训练信息、正样本关键词库、初始bert深度网络模型以及预设待训练信息对应的标签等数据。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种信息识别模型建立方法以及信息识别方法。
[0173]
本领域技术人员可以理解,图7中示出的结构,仅仅是与本技术方案相关的部分结构的框图,并不构成对本技术方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
[0174]
在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
[0175]
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
[0176]
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
[0177]
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本技术所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(read-only memory,rom)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(reram)、磁变存储器(magnetoresistive random access memory,mram)、铁电存储器(ferroelectric random access memory,fram)、相变存储器(phase change memory,pcm)、石墨烯存储器等。易失性存储器可包括随机存取存储器(random access memory,ram)或外部高速缓冲存储器等。作为说明而非局限,ram可以是多种形式,比如静态随机存取存储器(static random access memory,sram)或动态随机存取存储器(dynamic random access memory,dram)等。本技术所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本技术所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
[0178]
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
[0179]
以上所述实施例仅表达了本技术的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本技术专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本技术构思的前提下,还可以做出若干变形和改进,这些都属于本技术的保护范围。因此,本技术的保护范围应以所附权利要求为准。

技术特征:
1.一种信息识别模型建立方法,其特征在于,所述方法包括:获取待训练信息、正样本关键词库、初始bert深度网络模型以及预设待训练信息对应的标签;对所述待训练信息进行分词处理,得到所述待训练信息的关键词,并将所述关键词与所述正样本关键词库进行匹配;当匹配结果为一致时,根据匹配结果为一致的所述关键词构建关键词集合;根据所述关键词集合,得到数值型矩阵;将所述数值型矩阵以及所述预设待训练信息对应的标签输入至所述初始bert深度网络模型进行训练,得到目标信息识别模型。2.根据权利要求1所述的方法,其特征在于,获取正样本关键词库包括:获取历史信息以及专家关键词库;对所述历史信息进行分词处理,得到分词处理后的历史信息;根据所述分词处理后的历史信息,得到预训练词向量矩阵;对比所述预训练词向量矩阵以及所述专家关键词库,对所述专家关键词库进行扩充,得到正样本关键词库。3.根据权利要求2所述的方法,其特征在于,所述根据所述分词处理后的历史信息,得到预训练词向量矩阵包括:采用fasttext算法对所述分词处理后的历史信息进行无监督学习,得到预训练词向量矩阵。4.根据权利要求1所述的方法,其特征在于,所述根据所述关键词集合,得到数值型矩阵包括:对所述关键词集合进行掩码处理,获取掩码处理后的关键词集合;根据所述掩码处理后的关键词集合,进行文本编码,得到数值型矩阵。5.一种信息识别方法,其特征在于,所述方法包括:获取待识别信息;根据所述待识别信息,生成所述待识别信息对应的数值型矩阵;将所述数值型矩阵输入至目标信息识别模型,得到信息识别结果;其中,所述目标信息识别模型采用如权利要求1-4任意一项所述方法建立。6.根据权利要求5所述的方法,其特征在于,所述根据所述待识别信息,生成所述待识别信息对应的数值型矩阵包括:获取正样本关键词库、业务逻辑需求数据以及词性规则;根据所述业务逻辑需求数据以及所述词性规则,对所述待识别信息进行初步识别,得到初步识别结果;当所述初步识别结果表征需要二次识别时,对所述初步识别的信息进行分词处理,并将所述分词处理后的初步识别的信息与所述正样本关键词库进行匹配;当匹配结果为一致时,根据匹配结果为一致的关键词构建所述待识别信息对应的关键词集合;对所述关键词集合进行掩码以及文本编码处理,生成所述待识别信息对应的数值型矩阵。
7.一种信息识别模型建立装置,其特征在于,所述装置包括:训练信息获取模块,用于获取待训练信息、正样本关键词库、初始bert深度网络模型以及预设待训练信息对应的标签;训练信息匹配模块,用于对所述待训练信息进行分词处理,得到所述待训练信息的关键词,并将所述关键词与所述正样本关键词库进行匹配;训练集合获取模块,用于当匹配结果为一致时,根据匹配结果为一致的所述关键词构建关键词集合;训练矩阵获取模块,用于根据所述关键词集合,得到数值型矩阵;训练模型建立模块,用于将所述数值型矩阵以及所述预设待训练信息对应的标签输入至所述初始bert深度网络模型进行训练,得到目标信息识别模型。8.一种信息识别装置,其特征在于,所述装置包括:待识别信息获取模块,用于获取待识别信息;待识别矩阵生成模块,用于根据所述待识别信息,生成所述待识别信息对应的数值型矩阵;信息识别模块,用于将所述数值型矩阵输入至目标信息识别模型,得到信息识别结果;其中,所述目标信息识别模型采用如权利要求1-4任意一项所述方法建立。9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。

技术总结
本申请涉及一种信息识别模型建立方法、装置、计算机设备、存储介质和计算机程序产品。方法包括:获取待训练信息、正样本关键词库、初始bert深度网络模型以及预设待训练信息对应的标签;对待训练信息进行分词处理,得到待训练信息的关键词,并将关键词与正样本关键词库进行匹配;当匹配结果为一致时,根据匹配结果为一致的关键词构建关键词集合;根据关键词集合,得到数值型矩阵;将数值型矩阵以及预设待训练信息对应的标签输入至初始bert深度网络模型进行训练,得到目标信息识别模型。采用本方法能够支持人机实时交互。另外,本申请还提供了一种信息识别方法、装置、计算机设备、存储介质和计算机程序产品。介质和计算机程序产品。介质和计算机程序产品。


技术研发人员:毛宇 贾钱森 徐伟 林昊 张文锋 邓文强
受保护的技术使用者:招联消费金融有限公司
技术研发日:2023.02.07
技术公布日:2023/7/12
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐