一种槽位信息处理方法以及电子设备与流程
未命名
10-09
阅读:92
评论:0
1.本技术涉及数据处理技术领域,特别涉及一种槽位信息处理方法以及电子设备。
背景技术:
2.随着科技的发展,智能问答技术被广泛应用到多个领域中。在智能问答技术中,需要将用户问句与预设问句进行匹配,进而查询对应的答复信息。
3.在相关技术中,通过提取文本(用户问句)中的关键词(槽位信息),基于关键词与预设问句进行匹配。
4.然而,由于文本中句式组合的多样性,以及用户表达方式的差异,不同含义的文本可能会提取出相同的槽位信息,因此,上述方式中所提取的槽位信息难以确切地反映出用户的真实意图,影响智能问答的准确性。
技术实现要素:
5.本技术提供了一种槽位信息处理方法以及电子设备,用以确定出反映用户真实意图的信息。
6.第一方面,本技术实施例提供一种槽位信息处理方法,所述方法包括:
7.在收到待处理文本后,确定所述待处理文本对应的特征信息;其中,所述特征信息包括槽位信息以及并列连词;
8.基于所述槽位信息以及所述并列连词,确定多个槽位字段;其中,任一槽位字段中包含属性相同的槽位信息;
9.对所述多个槽位字段进行分配,得到所述待处理文本对应的多个目标字段组合;其中,任一目标字段组合包含预设的各属性的一个槽位字段。
10.上述方案,在收到待处理文本后,不仅确定出待处理文本的槽位信息,还确定出待处理文本的并列连词(并列连词描述了槽位信息之间的关系);进而根据槽位信息以及并列连词,确定待处理文本的多个槽位字段,通过将多个槽位字段进行分配,得到待处理文本对应的多个目标字段组合,这多个目标字段组合反映了用户真实的意图,基于多个目标字段能够精准地进行智能问答。
11.在一些可选的实施方式中,基于所述槽位信息以及所述并列连词,确定多个槽位字段,包括:
12.基于各槽位信息的属性以及所述并列连词,将所有槽位信息划分到属性对应的槽位信息组合中;
13.针对任一槽位信息组合,基于所述槽位信息组合的属性对应的预设层级关系,将所述槽位信息进行组合,得到至少一个槽位字段。
14.在一些可选的实施方式中,基于各槽位信息的属性以及所述并列连词,将所有槽位信息划分到属性对应的槽位信息组合中,包括:
15.将相同属性的槽位信息划分到同一个初始槽位信息组合中;
16.针对任一初始槽位信息组合,若所述并列连词关联所述初始槽位信息组合中的槽位信息,则确定所述并列连词所关联的槽位信息是否层级不同;其中,所述并列所连词关联的槽位信息为与所述并列连词相邻的槽位信息;
17.若是,则将所述初始槽位信息组合中所述并列连词之前的槽位信息与所述并列连词之后的槽位信息划分到不同子槽位信息组合中;否则不对所述初始槽位信息组合进行划分;其中,所述槽位信息是按照在所述待处理文本中的位置进行排序的。
18.在一些可选的实施方式中,对所述多个槽位字段进行分配,得到所述待处理文本对应的多个目标字段组合,包括:
19.将所述槽位字段按照目标槽位信息在所述待处理文本中的位置进行排序,并将相邻且属性相同的槽位字段进行绑定;其中,所述目标槽位信息为各槽位字段中最低层级对应的槽位信息;
20.针对任一槽位字段,若上一初始字段组合中有与所述槽位字段的属性相同的其他槽位字段,则将所述槽位字段分配在下一初始字段组合中;否则,将所述槽位字段分配在所述上一初始字段组合中;
21.针对任一初始字段组合,将缺失属性的目标槽位字段添加至所述初始字段组合内,并将所述初始字段组合中绑定的槽位字段分别与所述初始字段组合中其他属性的槽位字段进行组合,得到目标字段组合。
22.在一些可选的实施方式中,通过以下方式确定所述缺失属性的目标槽位字段:
23.针对任一初始字段组合,若第一字段组合中有所述缺失属性对应的槽位字段,则将所述第一字段组合中所述缺失属性对应的最后一个槽位字段确定为所述目标槽位字段;
24.若所述第一字段组合中没有所述缺失属性对应的槽位字段,则将第二字段组合中所述缺失属性对应的第一个槽位字段确定为所述目标槽位字段;
25.其中,所述第一字段组合为在所述初始字段组合之前的其他初始字段组合;所述第二字段组合为在所述初始字段组合之后的其他初始字段组合。
26.在一些可选的实施方式中,确定所述待处理文本对应的特征信息,包括:
27.基于所述待处理文本的词向量以及词性向量,确定所述待处理文本的融合特征向量;
28.基于所述融合特征向量,识别所述待处理文本对应的特征信息。
29.在一些可选的实施方式中,所述特征信息还包括意图信息;在对所述多个槽位字段进行分配,得到所述待处理文本对应的多个目标字段组合之后,还包括:
30.针对任一目标字段组合,将所述目标字段组合与所述意图信息对应的预设问句进行匹配,并从所述预设问句中选择匹配成功的目标问句;
31.通过预设通知方式将所述目标问句对应的答复信息进行通知。
32.第二方面,本技术实施例提供一种电子设备,包括通信单元和处理器;
33.所述通信单元,用于接收待处理文本;
34.所述处理器,用于在收到待处理文本后,确定所述待处理文本对应的特征信息;其中,所述特征信息包括槽位信息以及并列连词;基于所述槽位信息以及所述并列连词,确定多个槽位字段;其中,任一槽位字段中包含属性相同的槽位信息;对所述多个槽位字段进行分配,得到所述待处理文本对应的多个目标字段组合;其中,任一目标字段组合包含预设的
各属性的一个槽位字段。
35.第三方面,本技术实施例提供一种槽位信息处理装置,包括:
36.特征提取模块,用于在收到待处理文本后,确定所述待处理文本对应的特征信息;其中,所述特征信息包括槽位信息以及并列连词;
37.字段确定模块,用于基于所述槽位信息以及所述并列连词,确定多个槽位字段;其中,任一槽位字段中包含属性相同的槽位信息;
38.字段分配模块,用于对所述多个槽位字段进行分配,得到所述待处理文本对应的多个目标字段组合;其中,任一目标字段组合包含预设的各属性的一个槽位字段。
39.第四方面,本技术实施例提供一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时,实现如第一方面任一项所述的槽位信息处理方法。
40.另外,第二方面至第四方面中任一种实现方式所带来的技术效果可参见第一方面中不同实现方式所带来的技术效果,此处不再赘述。
附图说明
41.为了更清楚地说明本技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
42.图1为本技术实施例提供的第一种应用场景示意图;
43.图2为本技术实施例提供的第一种槽位信息处理方法的示意流程图;
44.图3为本技术实施例提供的特征信息确定方法的示意图;
45.图4为本技术实施例提供的向量融合示意图;
46.图5为本技术实施例提供的自注意力计算过程示意图;
47.图6为本技术实施例提供的特征信息确定过程示意图;
48.图7为本技术实施例提供的第二种槽位信息处理方法的示意流程图;
49.图8为本技术实施例提供的槽位字段确定方法的示意流程图;
50.图9为本技术实施例提供的槽位信息划分方法的示意流程图;
51.图10为本技术实施例提供的初始槽位信息组合示意图;
52.图11为本技术实施例提供的子槽位信息组合示意图;
53.图12为本技术实施例提供的第三种槽位信息处理方法的示意流程图;
54.图13为本技术实施例提供的目标字段组合确定方法的示意流程图;
55.图14为本技术实施例提供的目标槽位字段确定方法的示意流程图;
56.图15为本技术实施例提供的第四种槽位信息处理方法的示意流程图;
57.图16为本技术实施例提供的第五种槽位信息处理方法的示意流程图;
58.图17为本技术实施例提供的第一种槽位信息处理装置的结构示意图;
59.图18为本技术实施例提供的第二种槽位信息处理装置的结构示意图;
60.图19为本技术实施例提供的电子设备的示意框图;
61.图20为本技术实施例提供的程序产品示意图。
具体实施方式
62.为了使本技术的目的、技术方案和优点更加清楚,下面将结合附图对本技术作进一步地详细描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本技术保护的范围。
63.术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本技术的描述中,除非另有说明,“多个”的含义是两个或两个以上。
64.在本技术的描述中,除非另有明确的规定和限定,术语“连接”应做广义理解,例如,可以是直接相连,也可以通过中间媒介间接相连,可以是两个器件内部的连通。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本技术中的具体含义。
65.在智能问答技术中,需要将用户问句与预设问句进行匹配,进而查询对应的答复信息。
66.在相关技术中,通过提取文本(用户问句)中的关键词(槽位信息),基于关键词与预设问句进行匹配。
67.然而,由于文本中句式组合的多样性,以及用户表达方式的差异,不同含义的文本可能会提取出相同的槽位信息。
68.例如,文本1为“2021年3月青岛市和济南市的国民生产总值、国民幸福指数分别是多少”,文本2为“2021年3月青岛市的国民生产总值和济南市的国民幸福指数分别是多少”两句话表达含义不同,但是文本1和文本2提取的槽位信息均为{"city(城市)":["青岛市","济南市"],"index(指标)":["国民生产总值","国民幸福指数"],"month(月)":["3"],"year(年)":["2021"]}。虽然文本1和文本2的含义不同,但槽位信息相同,匹配的预设问句一致,对应的答复信息是相同的,至少有一项答复信息是错误的。
[0069]
因此,上述方式中所提取的槽位信息难以确切地反映出用户的真实意图,影响智能问答的准确性。
[0070]
基于此,本技术实施例提供了一种槽位信息处理方法以及电子设备,该方法包括:在收到待处理文本后,确定所述待处理文本对应的特征信息;其中,所述特征信息包括槽位信息以及并列连词;基于所述槽位信息以及所述并列连词,确定多个槽位字段;其中,任一槽位字段中包含属性相同的槽位信息;对所述多个槽位字段进行分配,得到所述待处理文本对应的多个目标字段组合;其中,任一目标字段组合包含预设的各属性的一个槽位字段。
[0071]
参阅图1所示,为本技术实施例提供的一种应用场景。在该应用场景中包括电子设备以及终端;
[0072]
在一些实施例中,电子设备与终端进行数据通信。可允许电子设备通过局域网(lan)、无线局域网(wlan)和其他网络与终端进行通信连接,终端可将用户触发的待处理文本(用户问句)发送给电子设备。
[0073]
电子设备在收到待处理文本后,确定所述待处理文本对应的特征信息;其中,所述特征信息包括槽位信息以及并列连词;基于所述槽位信息以及所述并列连词,确定多个槽位字段;其中,任一槽位字段中包含属性相同的槽位信息;对所述多个槽位字段进行分配,
得到所述待处理文本对应的多个目标字段组合;其中,任一目标字段组合包含预设的各属性的一个槽位字段。
[0074]
本技术实施例中的终端可以为手机、笔记本、平板等用户端设备。
[0075]
本技术实施例中的电子设备可以包括一类或多类服务器。
[0076]
上述方案,在收到待处理文本后,不仅确定出待处理文本的槽位信息,还确定出待处理文本的并列连词(并列连词描述了槽位信息之间的关系);进而根据槽位信息以及并列连词,确定待处理文本的多个槽位字段,通过将多个槽位字段进行分配,得到待处理文本对应的多个目标字段组合,这多个目标字段组合反映了用户真实的意图,基于多个目标字段能够精准地进行智能问答。
[0077]
下面将结合附图及具体实施例,对本技术的技术方案以及本技术的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。
[0078]
本技术实施例提供了第一种槽位信息处理方法,可应用于上述电子设备,如图2所示,该方法可以包括:
[0079]
步骤s201:在收到待处理文本后,确定所述待处理文本对应的特征信息。
[0080]
其中,所述特征信息包括槽位信息以及并列连词。
[0081]
实施中,对于某些复杂句式,槽位信息并不能精准体现出用户真实意图,存在槽位信息分配问题。如“2020年第一季度和2021年第三季度青岛市的gdp以及济南市的国民幸福指数怎么样”,可以抽取出{"city":["青岛市",济南市"],"index":["gdp","国民幸福指数"],"season":["1","3"],"year":["2020","2021"]},但是对于“city”,“index”以及“season”和“year”的组合并未涉及,仅从时间“season”和“year”的组合就存在与“2020年第一、三季度和2021年第一、三季度”、“2020年第一、三季度和2021年第三季度”槽位信息抽取结果一致的情况,无法将其分开处理。
[0082]
由于文本中的并列连词描述了槽位信息之间的关系;基于此,在收到待处理文本后,不仅确定出待处理文本的槽位信息,还确定出待处理文本的并列连词。
[0083]
步骤s202:基于所述槽位信息以及所述并列连词,确定多个槽位字段。
[0084]
其中,任一槽位字段中包含属性相同的槽位信息。
[0085]
示例性,槽位信息以及并列连词都是独立的信息,属性相同的槽位信息之间可能会存在上下层级关联,基于此,本实施例需要根据槽位信息以及并列连词,确定待处理文本的多个槽位字段。
[0086]
步骤s203:对所述多个槽位字段进行分配,得到所述待处理文本对应的多个目标字段组合。
[0087]
其中,任一目标字段组合包含预设的各属性的一个槽位字段。
[0088]
实施中,各属性对应有至少一个槽位字段,这些槽位字段可以组合成多个目标字段组合,每个目标字段组合都包含各属性的一个槽位字段,所有目标字段组合完整地反映出用户真实意图。
[0089]
本实施例,有些槽位设计的类别相同,对应相同的属性,如年、月、日都属于时间,因此属性为“time”;省、市、区都属于地点,因此属性为“place”等等。
[0090]
上述方案,在收到待处理文本后,不仅确定出待处理文本的槽位信息,还确定出待
处理文本的并列连词(并列连词描述了槽位信息之间的关系);进而根据槽位信息以及并列连词,确定待处理文本的多个槽位字段,通过将多个槽位字段进行分配,得到待处理文本对应的多个目标字段组合,这多个目标字段组合反映了用户真实的意图,基于多个目标字段能够精准地进行智能问答。
[0091]
参阅图3所示,在一些可选的实施方式中,上述确定特征信息,可通过但不限于如下方式实现:
[0092]
步骤s301:基于所述待处理文本的词向量以及词性向量,确定所述待处理文本的融合特征向量。
[0093]
本实施例,需要确定并列连词,词向量是单个字段的向量表示,仅通过词向量难以精准地确定出并列连词。并列连词与其他字段最显著的区别在于词性,通过将词性信息加入提取特征中将显著提升对并列连词的提取。
[0094]
参阅图4所示,通过将长度为n的文本w={w1,w2,
……
,wn},经过基于transformer(利用注意力机制来提高模型训练速度的模型)的双向编码器表示(bidirectional encoder representation from transformers,bert),对w进行处理,得到包含标记嵌入、句嵌入及位置嵌入信息的bert词向量h={h1,h2,
……
,hn},假设每个字或词使用m维向量表示,h矩阵eh∈r
m*v
,v为字段数量;
[0095]
经过word2vec(一种向量模型)对w进行处理,得到初始词性向量p={p1,p2,
……
,pn};并列连词在文本中一般存在与两个槽位信息之间,通过自注意力层来提取每一个位置的词性向量与其他位置词性向量之间的相关度,从而获取各位置词性向量对其他位置词性向量的依赖程度;
[0096]
参阅图5所示,以初始词性向量p1为例,经softmax(一种激活函数)归一化后得到注意力得分,即要p1给予所有向量的关注程度,通过注意力得分得到对当前位置词性向量不同影响程度的特征,这样每个词性向量都参与了对词性向量的计算,关注了全局信息,但是每个词性向量的参与程度不同,聚焦了关键词性信息;
[0097]
将词向量h以及词性向量p
′
进行融合,得到融合特征向量。
[0098]
以待处理文本为“2021年青岛市和济南市的gdp是多少”为例,整个向量处理过程可参阅图6所示,提取出如表1所示的信息:
[0099]
表1
[0100][0101]
其中,[cls]为起始符,[sep]为分句符;槽位标注中的year为年,city为市,side为并列连词,index为指标,o为其他连词。
[0102]
步骤s302:基于所述融合特征向量,识别所述待处理文本对应的特征信息。
[0103]
上述方案,在词向量中融入词性向量,通过引入词性信息丰富文本特征,利用词性规则引入辅助槽位信息的识别,同时提升并列连词的识别率。
[0104]
对应的,本技术实施例提供了第二种槽位信息处理方法,如图7所示,该方法可以包括:
[0105]
步骤s701:在收到待处理文本后,基于所述待处理文本的词向量以及词性向量,确定所述待处理文本的融合特征向量。
[0106]
步骤s702:基于所述融合特征向量,识别所述待处理文本对应的特征信息。
[0107]
步骤s703:基于所述槽位信息以及所述并列连词,确定多个槽位字段。
[0108]
步骤s704:对所述多个槽位字段进行分配,得到所述待处理文本对应的多个目标字段组合。
[0109]
该步骤s701~s704的具体实现方式可参照上述实施例,此处不再赘述。
[0110]
参阅图8所示,在一些可选的实施方式中,上述槽位字段可通过但不限于如下方式确定:
[0111]
步骤s801:基于各槽位信息的属性以及所述并列连词,将所有槽位信息划分到属性对应的槽位信息组合中。
[0112]
如上所述,属性相同的槽位信息之间可能会存在上下层级关联,基于此,本实施例需要先根据槽位信息的属性以及并列连词,将槽位信息划分到属性对应的槽位信息组合中。
[0113]
步骤s802:针对任一槽位信息组合,基于所述槽位信息组合的属性对应的预设层级关系,将所述槽位信息进行组合,得到至少一个槽位字段。
[0114]
示例性的,每个槽位信息组合中的槽位信息可以相互组合,得到不同的槽位字段,如果一个槽位信息组合中缺少预设层级关系中目标层级(如最高层级),需要填充目标层级的槽位信息,可将其他槽位信息组合中该目标层级的槽位信息或该目标层级的默认信息添加到该槽位信息组合。
[0115]
上述方案,由于属性相同的槽位信息之间可能会存在上下层级关联,根据槽位信息的属性以及并列连词,将槽位信息划分到属性对应的槽位信息组合中;进而基于槽位信息组合的属性对应的预设层级关系,将槽位信息进行组合,得到各属性预设层级关系对应的槽位字段。
[0116]
参阅图9所示,在一些可选的实施方式中,上述槽位信息可通过但不限于如下方式进行划分:
[0117]
步骤s901:将相同属性的槽位信息划分到同一个初始槽位信息组合中。
[0118]
示例性的,不同属性的槽位信息所在的槽位信息组合不同,因此,可将相同属性的槽位信息首先划分到同一个初始槽位信息组合。
[0119]
步骤s902:针对任一初始槽位信息组合,若所述并列连词关联所述初始槽位信息组合中的槽位信息,则确定所述并列连词所关联的槽位信息是否层级不同;其中,所述并列所连词关联的槽位信息为与所述并列连词相邻的槽位信息。
[0120]
本实施例,由于并列连词描述了槽位信息之间的关系,并列连词对所关联的前后槽位信息之间有修饰作用,如果所关联的前后槽位信息层级相同,那这两个槽位信息就是并列的同级关系,可进行相互组合,即可划分在同一个槽位信息组合中;如果所关联的前后槽位信息层级不同,那这两个槽位信息就是并列的非同级关系,不可进行相互组合,即不可划分在同一个槽位信息组合中。
[0121]
步骤s903:若是,则将所述初始槽位信息组合中所述并列连词之前的槽位信息与所述并列连词之后的槽位信息划分到不同子槽位信息组合中;否则不对所述初始槽位信息
组合进行划分;其中,所述槽位信息是按照在所述待处理文本中的位置进行排序的。
[0122]
示例性的,如果所关联的前后槽位信息层级相同,那这两个槽位信息就是并列的同级关系,可进行相互组合,即可划分在同一个槽位信息组合中,不对初始槽位信息组合进行划分,保留该属性的初始槽位信息组合;
[0123]
如果所关联的前后槽位信息层级不同,那这两个槽位信息就是并列的非同级关系,不可进行相互组合,即不可划分在同一个槽位信息组合中,因此将该初始槽位信息组合中并列连词之前的槽位信息与并列连词之后的槽位信息划分到不同子槽位信息组合中。
[0124]
参阅图10所示,将槽位信息按照在待处理文本中的位置进行排序,得到初始槽位信息组合1,包含槽位信息1、槽位信息2、槽位信息3以及槽位信息4;并列连词关联槽位信息2以及槽位信息3,槽位信息2和槽位信息3的层级不同,需要对初始槽位信息组合1进行进一步划分;
[0125]
参阅图11所示,将槽位信息1以及槽位信息2划分到子槽位信息组合1中,将槽位信息3以及槽位信息4划分到子槽位信息组合2中。
[0126]
上述图10以及图11只是示例性说明,本实施例对初始槽位信息组合以及子槽位信息组合不做具体限定。
[0127]
上述方案,通过将相同属性的槽位信息首先划分到同一个初始槽位信息组合,保证槽位信息组合中槽位信息的属性统一;由于并列连词描述了槽位信息之间的关系,如果并列连词所关联的前后槽位信息层级相同,那这两个槽位信息就是并列的同级关系,保留该属性的初始槽位信息组合,使得并列连词先后的同属性槽位信息可进行相互组合;如果所关联的前后槽位信息层级不同,那这两个槽位信息就是并列的非同级关系,将该初始槽位信息组合中并列连词之前的槽位信息与并列连词之后的槽位信息划分到不同子槽位信息组合中,避免这两部分槽位信息之间相互组合。
[0128]
下面以两个具体的示例进行说明:
[0129]
一、待处理文本为“2021年青岛市和济南市2022年的gdp怎么样”。
[0130]
排序后槽位键(keylist)为:【“year”,“city”,“side”,“city”,“year”,“index”】;
[0131]
对应槽位值(valuelist)为:[“2021年”,“青岛市”,“和”,“济南市”,"2022年","gdp"];
[0132]
对应位置信息(positionlist)为:【0,5,8,9,12,18】。
[0133]
1、将相同属性的槽位信息划分到一个初始槽位信息组合中,time属性对应的初始槽位信息组合包含槽位信息{year:2021},{year:2022};place属性对应的初始槽位信息组合包含槽位信息{city:青岛市},{city:济南市};index属性对应的初始槽位信息组合包含槽位信息{index:gdp}。
[0134]
2、并列连词“side”关联的是“青岛市”和“济南市”,“青岛市”和“济南市”层级相同(都是place属性中的市),初始槽位信息组合不用进行进一步划分。
[0135]
3、以time属性为例:time属性对应的预设层级关系为年-月-日,time属性对应的初始槽位信息组合中仅包含年这一层级的槽位信息,不需要再进行组合,得到槽位字段time1(包含槽位信息{year:2021}),槽位字段time2(包含槽位信息{year:2022})。
[0136]
二、待处理文本为“2021年3月和4月青岛市济南市的国民生产总值国民幸福指数分别是多少”。
[0137]
排序后槽位键(keylist)为:【“year”,“month”,“side”,“month”,“city”,“city”,“index”,“index”】;
[0138]
对应槽位值(valuelist)为:[“2021年”,“3月”,“和”,“4月”,"青岛市","济南市","国民生产总值","国民幸福指数"];
[0139]
对应位置信息(positionlist)为:【0,5,7,8,10,13,17,23】。
[0140]
1、将相同属性的槽位信息划分到一个初始槽位信息组合中,time属性对应的初始槽位信息组合包含槽位信息{year:2021},{month:3月},{month:4月};place属性对应的初始槽位信息组合包含槽位信息{city:青岛市},{city:济南市};index属性对应的初始槽位信息组合包含槽位信息{index:国民生产总值},{index:国民幸福指数}。
[0141]
2、并列连词“side”关联的是“3月”和“4月”,“3月”和“4月”层级相同(都是time属性中的月),初始槽位信息组合不用进行进一步划分。
[0142]
3、以time属性为例,time属性对应的预设层级关系为年-月-日,需要将“2021年”分别于“3月”和“4月”进行组合,得到槽位字段time1(包含槽位信息{year:2021,month:3月}),槽位字段time2(包含槽位信息{year:2021,month:4月})。
[0143]
上述示例只是对槽位字段的示例性说明,本技术对此不做具体限定。
[0144]
对应的,本技术实施例提供了第三种槽位信息处理方法,如图12所示,该方法可以包括:
[0145]
步骤s1201:在收到待处理文本后,确定所述待处理文本对应的特征信息。
[0146]
步骤s1202:基于各槽位信息的属性以及所述并列连词,将所有槽位信息划分到属性对应的槽位信息组合中。
[0147]
步骤s1203:针对任一槽位信息组合,基于所述槽位信息组合的属性对应的预设层级关系,将所述槽位信息进行组合,得到至少一个槽位字段。
[0148]
步骤s1204:对所述多个槽位字段进行分配,得到所述待处理文本对应的多个目标字段组合。
[0149]
该步骤s1201~s1204的具体实现方式可参照上述实施例,此处不再赘述。
[0150]
参阅图13所示,在一些可选的实施方式中,上述目标字段组合可通过但不限于如下方式确定:
[0151]
步骤s1301:将所述槽位字段按照目标槽位信息在所述待处理文本中的位置进行排序,并将相邻且属性相同的槽位字段进行绑定。
[0152]
其中,所述目标槽位信息为各槽位字段中最低层级对应的槽位信息。
[0153]
步骤s1302:针对任一槽位字段,若上一初始字段组合中有与所述槽位字段的属性相同的其他槽位字段,则将所述槽位字段分配在下一初始字段组合中;否则,将所述槽位字段分配在所述上一初始字段组合中。
[0154]
步骤s1303:针对任一初始字段组合,将缺失属性的目标槽位字段添加至所述初始字段组合内,并将所述初始字段组合中绑定的槽位字段分别与所述初始字段组合中其他属性的槽位字段进行组合,得到目标字段组合。
[0155]
实施中,为了确定出所有槽位字段组合得到的所有目标字段组合,各目标字段组合均包含各属性的一个槽位字段,且不同目标字段组合中至少一个属性的槽位字段是不同的;
[0156]
基于此,本实施例先将槽位字段按照其中的最低层级对应的槽位信息在文本中的位置进行排序,相邻同属性的槽位字段进行绑定(先分配在同一个初始字段组合中);
[0157]
进而确定在当前初始字段组合中是否有与下一个槽位字段的属性相同的其他槽位字段,如果有说明当前初始字段组合中已经不缺该属性的槽位字段了,需要将该槽位字段分配在下一初始字段组合中;如果没有说明当前初始字段组合中还缺少该属性的槽位字段,需要将该槽位字段分配在当前初始字段组合中;
[0158]
在将所有槽位字段分配到初始字段组合后,可能会有缺少槽位字段的初始字段组合(即初始字段组合中缺少部分属性的槽位字段),通过将缺失属性的目标槽位字段添加至初始字段组合内,保证过了各字段组合中有每个属性的槽位字段;
[0159]
如上所述,本实施例将相邻同属性的槽位字段进行了绑定,而各目标字段组合只包含各属性的一个槽位字段,还需要对相邻同属性的槽位字段进行解绑,将初始字段组合中绑定的槽位字段分别与该初始字段组合中其他属性的槽位字段进行组合。
[0160]
参阅图14所示,在一些可选的实施方式中,上述目标槽位字段可通过但不限于如下方式确定:
[0161]
步骤s1401:针对任一初始字段组合,若第一字段组合中有所述缺失属性对应的槽位字段,则将所述第一字段组合中所述缺失属性对应的最后一个槽位字段确定为所述目标槽位字段。
[0162]
其中,所述第一字段组合为在所述初始字段组合之前的其他初始字段组合。
[0163]
步骤s1402:若所述第一字段组合中没有所述缺失属性对应的槽位字段,则将第二字段组合中所述缺失属性对应的第一个槽位字段确定为所述目标槽位字段。
[0164]
其中,所述第二字段组合为在所述初始字段组合之后的其他初始字段组合。
[0165]
本实施例,为了避免生成重复的目标字段组合,需要按照顺序进行槽位字段填充。
[0166]
示例性的,先从初始字段组合之前的其他初始字段(第一字段组合)组合寻找是否有缺失属性对应的槽位字段;
[0167]
如果有,就将第一字段组合中缺失属性对应的最后一个槽位字段(与上述初始字段组合最接近的槽位字段)确定为目标槽位字段;
[0168]
如果没有,从初始字段组合之后的其他初始字段(第二字段组合)组合寻找缺失属性对应的第一个槽位字段(与上述初始字段组合最接近的槽位字段),作为目标槽位字段。
[0169]
通过上述方式,不仅确定出所有槽位字段组合得到的所有目标字段组合,还避免了生成重复的目标字段组合的情况发生。
[0170]
下面以两个具体的示例进行说明:
[0171]
一、待处理文本为“2021年青岛市和济南市2022年的gdp怎么样”。
[0172]
1、经处理得到5个槽位字段:time1(包含槽位信息{year:2021}),place1(包含槽位信息{city:青岛}),place2(包含槽位信息{city:济南}),time2(包含槽位信息{year:2022}),index1(包含槽位信息{index:gdp})。
[0173]
2、place1和place2相邻且属性相同,对这两个槽位字段进行绑定,得到【time1,place1,place2】(初始字段组合1),[time2,index1](初始字段组合2)。
[0174]
3、初始字段组合1中缺少index属性的槽位字段,将上述index1补充到初始字段组合1中;
[0175]
初始字段组合1中缺少place属性的槽位字段,将绑定的place1和place2补充到初始字段组合2中;
[0176]
得到【time1,place1,place2,index1】(初始补全字段组合1),以及[time2,index1,place1,place2](初始补全字段组合2)。
[0177]
4、将初始补全字段组合1中place1,place2与初始补全字段组合1中其他属性的槽位字段进行组合,得到目标字段组合1【time1,place1,index1】,以及目标字段组合2[time1,place2,index1];
[0178]
将初始补全字段组合2中place1,place2与初始补全字段组合2中其他属性的槽位字段进行组合,得到目标字段组合3[time2,index1,place1],以及目标字段组合4[time2,index1,place2]。
[0179]
其中,目标字段组合1为:{year:2021,city:青岛,index:gdp};
[0180]
目标字段组合2为:{year:2021,city:济南,index:gdp};
[0181]
目标字段组合3为:{year:2022,city:青岛,index:gdp};
[0182]
目标字段组合4为:{year:2022,city:济南,index:gdp}。
[0183]
二、待处理文本为“2021年3月和4月青岛市济南市的国民生产总值国民幸福指数分别是多少”。
[0184]
1、经处理得到6个槽位字段:time1(包含槽位信息{year:2021,month:3月}),time2(包含槽位信息{year:2021,month:4月}),place1(包含槽位信息{city:青岛,}),place2(包含槽位信息{city:济南}),index1(包含槽位信息{index:国民生产总值}),index2(包含槽位信息{index:国民幸福指数})。
[0185]
2、time1和time2相邻且属性相同,对这两个槽位字段进行绑定;place1和place2相邻且属性相同,对这两个槽位字段进行绑定;index1和index2相邻且属性相同,对这两个槽位字段进行绑定;
[0186]
得到初始字段组合【time1,time2,place1,place2,index1,index2】。
[0187]
3、初始字段组合不缺少任何属性的槽位字段;将初始字段组合中time1,time2与初始字段组合中其他属性的槽位字段进行组合,将初始字段组合中place1,place2与初始字段组合中其他属性的槽位字段进行组合,将初始字段组合中index1,index2与初始字段组合中其他属性的槽位字段进行组合,得到目标字段组合1【time1,place1,index1】,目标字段组合2【time2,place1,index1】,目标字段组合3【time1,place2,index1】,目标字段组合4【time2,place2,index1】,目标字段组合5【time1,place1,index2】,目标字段组合6【time2,plac1e,index2】,目标字段组合7【time1,place2,index2】,目标字段组合8【time2,place2,index2】;
[0188]
目标字段组合1为:{year:2021,month:3月,city:青岛,index:国民生产总值};
[0189]
目标字段组合2为:{year:2021,month:4月,city:青岛,index:国民生产总值};
[0190]
目标字段组合3为:{year:2021,month:3月,city:济南,index:国民生产总值};
[0191]
目标字段组合4为:{year:2021,month:4月,city:济南,index:国民生产总值};
[0192]
目标字段组合5为:{year:2021,month:3月,city:青岛,index国民幸福指数};
[0193]
目标字段组合6为:{year:2021,month:4月,city:青岛,index:国民幸福指数};
[0194]
目标字段组合7为:{year:2021,month:3月,city:济南,index:国民幸福指数};
[0195]
目标字段组合8为:{year:2021,month:4月,city:济南,index:国民幸福指数}。
[0196]
上述示例只是对目标字段组合的示例性说明,本技术对此不做具体限定。
[0197]
对应的,本技术实施例提供了第四种槽位信息处理方法,如图15所示,该方法可以包括:
[0198]
步骤s1501:在收到待处理文本后,确定所述待处理文本对应的特征信息。
[0199]
步骤s1502:基于所述槽位信息以及所述并列连词,确定多个槽位字段。
[0200]
步骤s1503:将所述槽位字段按照目标槽位信息在所述待处理文本中的位置进行排序,并将相邻且属性相同的槽位字段进行绑定。
[0201]
步骤s1504:针对任一槽位字段,若上一初始字段组合中有与所述槽位字段的属性相同的其他槽位字段,则将所述槽位字段分配在下一初始字段组合中;否则,将所述槽位字段分配在所述上一初始字段组合中。
[0202]
步骤s1505:针对任一初始字段组合,将缺失属性的目标槽位字段添加至所述初始字段组合内,并将所述初始字段组合中绑定的槽位字段分别与所述初始字段组合中其他属性的槽位字段进行组合,得到目标字段组合。
[0203]
该步骤s1501~s1505的具体实现方式可参照上述实施例,此处不再赘述。
[0204]
本技术实施例提供了第五种槽位信息处理方法,如图16所示,该方法可以包括:
[0205]
步骤s1601:在收到待处理文本后,确定所述待处理文本对应的特征信息。
[0206]
步骤s1602:基于所述槽位信息以及所述并列连词,确定多个槽位字段。
[0207]
步骤s1603:对所述多个槽位字段进行分配,得到所述待处理文本对应的多个目标字段组合。
[0208]
该步骤s1601~s1603的具体实现方式可参照上述实施例,此处不再赘述。
[0209]
步骤s1604:针对任一目标字段组合,将所述目标字段组合与所述意图信息对应的预设问句进行匹配,并从所述预设问句中选择匹配成功的目标问句。
[0210]
如上所述,多个目标字段组合完整地反映了用户真实的意图,基于多个目标字段能够精准地进行智能问答。
[0211]
不同意图的槽位设计不同,匹配的预设问题也不同,如“2021年青岛市和济南市的gdp是多少”的意图是问指标,“2021年崂山区及市北区在山东省内gdp排名多少”的意图是问排名。
[0212]
本实施例对上述匹配过程不做具体限定,如确定预设问句中是否包含目标字段组合,如果包含确定与该预设问句匹配成功;或者,确定预设问句的关键词是否与目标字段组合相同,如果相同确定与该预设问句匹配成功。
[0213]
步骤s1605:通过预设通知方式将所述目标问句对应的答复信息进行通知。
[0214]
示例性的,各预设问句对应有答复信息,目标问句是与目标字段组合匹配成功的预设问句,因此,目标问句对应的答复信息是针对于用户的真实意图的答复,在智能问答过程中需要将这些答复信息进行通知,如发送给上述终端。
[0215]
上述方案,通过结合语义理解用户的真实意图,对可能产生冲突或误解的槽位信息进行合理分配,将各目标字段组合分别与意图信息对应的预设问句进行匹配,进而从该预设问句中选择匹配成功的目标问句,该目标问句是针对于用户的真实意图匹配得到的,因此通过将目标问句对应的答复信息进行通知,提高智能问答的准确性。
[0216]
如图17所示,基于相同的发明构思,本技术实施例提供第一种槽位信息处理装置1700,包括:
[0217]
特征提取模块1701,用于在收到待处理文本后,确定所述待处理文本对应的特征信息;其中,所述特征信息包括槽位信息以及并列连词;
[0218]
字段确定模块1702,用于基于所述槽位信息以及所述并列连词,确定多个槽位字段;其中,任一槽位字段中包含属性相同的槽位信息;
[0219]
字段分配模块1703,用于对所述多个槽位字段进行分配,得到所述待处理文本对应的多个目标字段组合;其中,任一目标字段组合包含预设的各属性的一个槽位字段。
[0220]
一些可选的实施方式中,字段确定模块1702,具体用于:
[0221]
基于各槽位信息的属性以及所述并列连词,将所有槽位信息划分到属性对应的槽位信息组合中;
[0222]
针对任一槽位信息组合,基于所述槽位信息组合的属性对应的预设层级关系,将所述槽位信息进行组合,得到至少一个槽位字段。
[0223]
一些可选的实施方式中,字段确定模块1702,具体用于:
[0224]
将相同属性的槽位信息划分到同一个初始槽位信息组合中;
[0225]
针对任一初始槽位信息组合,若所述并列连词关联所述初始槽位信息组合中的槽位信息,则确定所述并列连词所关联的槽位信息是否层级不同;其中,所述并列所连词关联的槽位信息为与所述并列连词相邻的槽位信息;
[0226]
若是,则将所述初始槽位信息组合中所述并列连词之前的槽位信息与所述并列连词之后的槽位信息划分到不同子槽位信息组合中;否则不对所述初始槽位信息组合进行划分;其中,所述槽位信息是按照在所述待处理文本中的位置进行排序的。
[0227]
一些可选的实施方式中,字段分配模块1703,具体用于:
[0228]
将所述槽位字段按照目标槽位信息在所述待处理文本中的位置进行排序,并将相邻且属性相同的槽位字段进行绑定;其中,所述目标槽位信息为各槽位字段中最低层级对应的槽位信息;
[0229]
针对任一槽位字段,若上一初始字段组合中有与所述槽位字段的属性相同的其他槽位字段,则将所述槽位字段分配在下一初始字段组合中;否则,将所述槽位字段分配在所述上一初始字段组合中;
[0230]
针对任一初始字段组合,将缺失属性的目标槽位字段添加至所述初始字段组合内,并将所述初始字段组合中绑定的槽位字段分别与所述初始字段组合中其他属性的槽位字段进行组合,得到目标字段组合。
[0231]
一些可选的实施方式中,通过以下方式确定所述缺失属性的目标槽位字段:
[0232]
针对任一初始字段组合,若第一字段组合中有所述缺失属性对应的槽位字段,则将所述第一字段组合中所述缺失属性对应的最后一个槽位字段确定为所述目标槽位字段;
[0233]
若所述第一字段组合中没有所述缺失属性对应的槽位字段,则将第二字段组合中所述缺失属性对应的第一个槽位字段确定为所述目标槽位字段;
[0234]
其中,所述第一字段组合为在所述初始字段组合之前的其他初始字段组合;所述第二字段组合为在所述初始字段组合之后的其他初始字段组合。
[0235]
一些可选的实施方式中,特征提取模块1701,具体用于:
[0236]
基于所述待处理文本的词向量以及词性向量,确定所述待处理文本的融合特征向量;
[0237]
基于所述融合特征向量,识别所述待处理文本对应的特征信息。
[0238]
参阅图18所示,一些可选的实施方式中,所述特征信息还包括意图信息;本技术实施例提供第二种槽位信息处理装置1800,在上述槽位信息处理装置1700的基础上,还包括通知模块1704,用于:
[0239]
在字段分配模块1703对所述多个槽位字段进行分配,得到所述待处理文本对应的多个目标字段组合之后,针对任一目标字段组合,将所述目标字段组合与所述意图信息对应的预设问句进行匹配,并从所述预设问句中选择匹配成功的目标问句;
[0240]
通过预设通知方式将所述目标问句对应的答复信息进行通知。
[0241]
由于该装置即是本技术实施例中的方法中的装置,并且该装置解决问题的原理与该方法相似,因此该装置的实施可以参见方法的实施,重复之处不再赘述。
[0242]
如图19所示,基于相同的发明构思,本技术实施例提供一种电子设备1900,包括:处理器1901和存储器1902;
[0243]
存储器1902可以是易失性存储器(volatile memory),例如随机存取存储器(random-access memory,ram);存储器1902也可以是非易失性存储器(non-volatile memory),例如只读存储器,快闪存储器(flash memory),硬盘(hard disk drive,hdd)或固态硬盘(solid-state drive,ssd);或者存储器1902是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。存储器1902可以是上述存储器的组合。
[0244]
处理器1901,可以包括一个或多个中央处理单元(central processing unit,cpu),图形处理单元(graphics processing unit,gpu)或者数字处理单元等等。
[0245]
本技术实施例中不限定上述存储器1902和处理器1901之间的具体连接介质。本技术实施例在图19中以存储器1902和处理器1901之间通过总线1903连接,总线1903在图19中以粗线表示,所述总线1903可以分为地址总线、数据总线、控制总线等。为便于表示,图19中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
[0246]
其中,所述存储器1902存储有程序代码,当所述程序代码被所述处理器1901执行时,使得所述处理器1901执行下列过程:
[0247]
在收到待处理文本后,确定所述待处理文本对应的特征信息;其中,所述特征信息包括槽位信息以及并列连词;
[0248]
基于所述槽位信息以及所述并列连词,确定多个槽位字段;其中,任一槽位字段中包含属性相同的槽位信息;
[0249]
对所述多个槽位字段进行分配,得到所述待处理文本对应的多个目标字段组合;其中,任一目标字段组合包含预设的各属性的一个槽位字段。
[0250]
一些可选的实施方式中,所述处理器1901具体执行:
[0251]
基于各槽位信息的属性以及所述并列连词,将所有槽位信息划分到属性对应的槽位信息组合中;
[0252]
针对任一槽位信息组合,基于所述槽位信息组合的属性对应的预设层级关系,将所述槽位信息进行组合,得到至少一个槽位字段。
[0253]
一些可选的实施方式中,所述处理器1901具体执行:
[0254]
将相同属性的槽位信息划分到同一个初始槽位信息组合中;
[0255]
针对任一初始槽位信息组合,若所述并列连词关联所述初始槽位信息组合中的槽位信息,则确定所述并列连词所关联的槽位信息是否层级不同;其中,所述并列所连词关联的槽位信息为与所述并列连词相邻的槽位信息;
[0256]
若是,则将所述初始槽位信息组合中所述并列连词之前的槽位信息与所述并列连词之后的槽位信息划分到不同子槽位信息组合中;否则不对所述初始槽位信息组合进行划分;其中,所述槽位信息是按照在所述待处理文本中的位置进行排序的。
[0257]
一些可选的实施方式中,所述处理器1901具体执行:
[0258]
将所述槽位字段按照目标槽位信息在所述待处理文本中的位置进行排序,并将相邻且属性相同的槽位字段进行绑定;其中,所述目标槽位信息为各槽位字段中最低层级对应的槽位信息;
[0259]
针对任一槽位字段,若上一初始字段组合中有与所述槽位字段的属性相同的其他槽位字段,则将所述槽位字段分配在下一初始字段组合中;否则,将所述槽位字段分配在所述上一初始字段组合中;
[0260]
针对任一初始字段组合,将缺失属性的目标槽位字段添加至所述初始字段组合内,并将所述初始字段组合中绑定的槽位字段分别与所述初始字段组合中其他属性的槽位字段进行组合,得到目标字段组合。
[0261]
一些可选的实施方式中,通过以下方式确定所述缺失属性的目标槽位字段:
[0262]
针对任一初始字段组合,若第一字段组合中有所述缺失属性对应的槽位字段,则将所述第一字段组合中所述缺失属性对应的最后一个槽位字段确定为所述目标槽位字段;
[0263]
若所述第一字段组合中没有所述缺失属性对应的槽位字段,则将第二字段组合中所述缺失属性对应的第一个槽位字段确定为所述目标槽位字段;
[0264]
其中,所述第一字段组合为在所述初始字段组合之前的其他初始字段组合;所述第二字段组合为在所述初始字段组合之后的其他初始字段组合。
[0265]
一些可选的实施方式中,所述处理器1901具体执行:
[0266]
基于所述待处理文本的词向量以及词性向量,确定所述待处理文本的融合特征向量;
[0267]
基于所述融合特征向量,识别所述待处理文本对应的特征信息。
[0268]
一些可选的实施方式中,所述特征信息还包括意图信息;在对所述多个槽位字段进行分配,得到所述待处理文本对应的多个目标字段组合之后,所述处理器1901还执行:
[0269]
针对任一目标字段组合,将所述目标字段组合与所述意图信息对应的预设问句进行匹配,并从所述预设问句中选择匹配成功的目标问句;
[0270]
通过预设通知方式将所述目标问句对应的答复信息进行通知。
[0271]
由于该电子设备即是执行本技术实施例中的方法的电子设备,并且该电子设备解决问题的原理与该方法相似,因此该电子设备的实施可以参见方法的实施,重复之处不再赘述。
[0272]
本技术实施例提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述槽位信息处理方法的步骤。其中,可读存储介质可以为非易失可
读存储介质。
[0273]
在一些可能的实施方式中,本技术的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在电子设备上运行时,程序代码用于使电子设备的处理器执行上述描述的根据本技术各种示例性实施方式的槽位信息处理方法的步骤。
[0274]
程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。
[0275]
如图20所示,描述了根据本技术的实施方式的程序产品2000,其可以采用便携式紧凑盘只读存储器(cd-rom)并包括程序代码,并可以在电子设备上运行。然而,本技术的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
[0276]
以上参照示出根据本技术实施例的方法、装置(系统)和/或计算机程序产品的框图和/或流程图描述本技术。应理解,可以通过计算机程序指令来实现框图和/或流程图示图的一个块以及框图和/或流程图示图的块的组合。可以将这些计算机程序指令提供给通用计算机、专用计算机的处理器和/或其它可编程装置,以产生机器,使得经由计算机处理器和/或其它可编程装置执行的指令创建用于实现框图和/或流程图块中所指定的功能/动作的方法。
[0277]
相应地,还可以用硬件和/或软件(包括固件、驻留软件、微码等)来实施本技术。更进一步地,本技术可以采取计算机可使用或计算机可读存储介质上的计算机程序产品的形式,其具有在介质中实现的计算机可使用或计算机可读程序代码,以由指令执行系统来使用或结合指令执行系统而使用。在本技术上下文中,计算机可使用或计算机可读介质可以是任意介质,其可以包含、存储、通信、传输、或传送程序,以由指令执行系统、装置或设备使用,或结合指令执行系统、装置或设备使用。
[0278]
尽管已描述了本技术的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本技术范围的所有变更和修改。
[0279]
显然,本领域的技术人员可以对本技术进行各种改动和变型而不脱离本技术的精神和范围。这样,倘若本技术的这些修改和变型属于本技术权利要求及其等同技术的范围之内,则本技术也意图包含这些改动和变型在内。
技术特征:
1.一种槽位信息处理方法,其特征在于,该方法包括:在收到待处理文本后,确定所述待处理文本对应的特征信息;其中,所述特征信息包括槽位信息以及并列连词;基于所述槽位信息以及所述并列连词,确定多个槽位字段;其中,任一槽位字段中包含属性相同的槽位信息;对所述多个槽位字段进行分配,得到所述待处理文本对应的多个目标字段组合;其中,任一目标字段组合包含预设的各属性的一个槽位字段。2.如权利要求1所述的方法,其特征在于,基于所述槽位信息以及所述并列连词,确定多个槽位字段,包括:基于各槽位信息的属性以及所述并列连词,将所有槽位信息划分到属性对应的槽位信息组合中;针对任一槽位信息组合,基于所述槽位信息组合的属性对应的预设层级关系,将所述槽位信息进行组合,得到至少一个槽位字段。3.如权利要求2所述的方法,其特征在于,基于各槽位信息的属性以及所述并列连词,将所有槽位信息划分到属性对应的槽位信息组合中,包括:将相同属性的槽位信息划分到同一个初始槽位信息组合中;针对任一初始槽位信息组合,若所述并列连词关联所述初始槽位信息组合中的槽位信息,则确定所述并列连词所关联的槽位信息是否层级不同;其中,所述并列所连词关联的槽位信息为与所述并列连词相邻的槽位信息;若是,则将所述初始槽位信息组合中所述并列连词之前的槽位信息与所述并列连词之后的槽位信息划分到不同子槽位信息组合中;否则不对所述初始槽位信息组合进行划分;其中,所述槽位信息是按照在所述待处理文本中的位置进行排序的。4.如权利要求1所述的方法,其特征在于,对所述多个槽位字段进行分配,得到所述待处理文本对应的多个目标字段组合,包括:将所述槽位字段按照目标槽位信息在所述待处理文本中的位置进行排序,并将相邻且属性相同的槽位字段进行绑定;其中,所述目标槽位信息为各槽位字段中最低层级对应的槽位信息;针对任一槽位字段,若上一初始字段组合中有与所述槽位字段的属性相同的其他槽位字段,则将所述槽位字段分配在下一初始字段组合中;否则,将所述槽位字段分配在所述上一初始字段组合中;针对任一初始字段组合,将缺失属性的目标槽位字段添加至所述初始字段组合内,并将所述初始字段组合中绑定的槽位字段分别与所述初始字段组合中其他属性的槽位字段进行组合,得到目标字段组合。5.如权利要求4所述的方法,其特征在于,通过以下方式确定所述缺失属性的目标槽位字段:针对任一初始字段组合,若第一字段组合中有所述缺失属性对应的槽位字段,则将所述第一字段组合中所述缺失属性对应的最后一个槽位字段确定为所述目标槽位字段;若所述第一字段组合中没有所述缺失属性对应的槽位字段,则将第二字段组合中所述缺失属性对应的第一个槽位字段确定为所述目标槽位字段;
其中,所述第一字段组合为在所述初始字段组合之前的其他初始字段组合;所述第二字段组合为在所述初始字段组合之后的其他初始字段组合。6.如权利要求1所述的方法,其特征在于,确定所述待处理文本对应的特征信息,包括:基于所述待处理文本的词向量以及词性向量,确定所述待处理文本的融合特征向量;基于所述融合特征向量,识别所述待处理文本对应的特征信息。7.如权利要求1~6任一所述的方法,其特征在于,所述特征信息还包括意图信息;在对所述多个槽位字段进行分配,得到所述待处理文本对应的多个目标字段组合之后,还包括:针对任一目标字段组合,将所述目标字段组合与所述意图信息对应的预设问句进行匹配,并从所述预设问句中选择匹配成功的目标问句;通过预设通知方式将所述目标问句对应的答复信息进行通知。8.一种电子设备,其特征在于,包括通信单元和处理器;所述通信单元,用于接收待处理文本;所述处理器,用于在收到待处理文本后,确定所述待处理文本对应的特征信息;其中,所述特征信息包括槽位信息以及并列连词;基于所述槽位信息以及所述并列连词,确定多个槽位字段;其中,任一槽位字段中包含属性相同的槽位信息;对所述多个槽位字段进行分配,得到所述待处理文本对应的多个目标字段组合;其中,任一目标字段组合包含预设的各属性的一个槽位字段。9.如权利要求8所述的电子设备,其特征在于,所述处理器,具体用于:基于各槽位信息的属性以及所述并列连词,将所有槽位信息划分到属性对应的槽位信息组合中;针对任一槽位信息组合,基于所述槽位信息组合的属性对应的预设层级关系,将所述槽位信息进行组合,得到至少一个槽位字段。10.如权利要求9所述的电子设备,其特征在于,所述处理器,具体用于:将相同属性的槽位信息划分到同一个初始槽位信息组合中;针对任一初始槽位信息组合,若所述并列连词关联所述初始槽位信息组合中的槽位信息,则确定所述并列连词所关联的槽位信息是否层级不同;其中,所述并列所连词关联的槽位信息为与所述并列连词相邻的槽位信息;若是,则将所述初始槽位信息组合中所述并列连词之前的槽位信息与所述并列连词之后的槽位信息划分到不同子槽位信息组合中;否则不对所述初始槽位信息组合进行划分;其中,所述槽位信息是按照在所述待处理文本中的位置进行排序的。
技术总结
本申请涉及数据处理技术领域,公开了一种槽位信息处理方法以及电子设备,该方法包括:在收到待处理文本后,确定待处理文本对应的特征信息;其中,特征信息包括槽位信息以及并列连词;基于槽位信息以及并列连词,确定多个槽位字段;其中,任一槽位字段中包含属性相同的槽位信息;对多个槽位字段进行分配,得到待处理文本对应的多个目标字段组合;其中,任一目标字段组合包含预设的各属性的一个槽位字段。上述方案,根据槽位信息以及并列连词,确定待处理文本的多个槽位字段,通过将多个槽位字段进行分配,得到待处理文本对应的多个目标字段组合,这多个目标字段组合反映了用户真实的意图,基于多个目标字段能够精准地进行智能问答。答。答。
技术研发人员:王彦芳 孟卫明 王月岭 高雪松
受保护的技术使用者:海信集团控股股份有限公司
技术研发日:2023.01.19
技术公布日:2023/10/8
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
