一种语句意图纠正方法及其装置、电子设备、存储介质与流程

未命名 08-15 阅读:202 评论:0


1.本公开实施例涉及音频处理技术领域,特别涉及一种语句意图纠正方法及其装置、电子设备、存储介质。


背景技术:

2.随着移动互联网及人工智能技术的广泛发展应用,许多金融机构理财及代销产品销售过程由线下搬到线上,为规范银行业金融机构理财及代销产品销售行为,有效防范和治理误导销售、私售等市场乱象,相关部门规定银行业金融机构应对自有理财产品及代销产品的销售过程进行同步录音录像,完整、客观地记录营销推介、相关风险和关键信息提示、消费者确认和反馈等重点销售环节,消费者确认内容应至少包括其充分了解销售人员所揭示的产品风险等。
3.为了满足录音录像的监管合格要求,目前可以通过人脸识别、ocr(optical character recognition,文字识别)、tts(text to speech,语音合成)、asr(automatic speech recognition,自动语音识别)等相关ai(artificial intelligence,人工智能)技术,使得消费者自助完成录音录像,并在录音录像中完整表达本人真实意愿。
4.然而由于消费者口音差异、回答简短等原因,导致ai技术识别出来的文字与消费者真实意愿相比出现非常大的差异,导致消费者意愿回答通过率比较低。目前技术为了提升消费者意愿回答通过率,在比对意愿词库里配置了大量同音词和近音词,然而意愿词库维护的同音词和近音词比较多,导致维护困难。


技术实现要素:

5.本公开提供一种语句意图纠正方法及其装置、电子设备、存储介质,能够提高语句意图纠正准确率,提高消费者意愿回答通过率。
6.第一方面,本公开提供了一种语句意图纠正方法,所述方法可以包括:
7.获取待纠正的语句;
8.对所述语句进行分词,获取一组或多组文字;
9.将所述一组或多组文字转化为相应的一组或多组拼音;
10.从预设的意图词拼音库中查找所述一组或多组拼音对应的意图词;所述意图词拼音库包括:拼音与所述意图词之间的对应关系;
11.采用查找到的意图词纠正所述语句中相应的文字,获得所述语句的语句意图纠正结果。
12.第二方面,本公开提供了一种语句意图纠正装置,可以包括:
13.获取模块,用于获取待纠正的语句;
14.分词模块,用于对所述语句进行分词,获取一组或多组文字;
15.转化模块,用于将所述一组或多组文字转化为相应的一组或多组拼音;
16.查找模块,用于从预设的意图词拼音库中查找所述一组或多组拼音对应的意图
词;所述意图词拼音库包括:拼音与所述意图词之间的对应关系;
17.纠正模块,用于采用查找到的意图词纠正所述语句中相应的文字,获得所述语句的语句意图纠正结果。
18.第三方面,本公开提供了一种电子设备,可以包括:
19.至少一个处理器;以及
20.与所述至少一个处理器通信连接的存储器;其中,
21.所述存储器存储有可被所述至少一个处理器执行的一个或多个计算机程序,一个或多个所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行所述的语句意图纠正方法。
22.第四方面,本公开提供了一种计算机可读存储介质,其上存储有计算机程序,其中,所述计算机程序在被处理器执行时实现所述的语句意图纠正方法。
23.本公开所提供的实施例中通过语句对应的拼音从意图词拼音库中得到意图词,对语句意图进行纠正,方案简单、易于实施,并提高了语句意图纠正准确率,提高了消费者意愿回答通过率。另外,意图词拼音库中包括拼音与意图词之间的对应关系,使得意图词拼音库仅维护所需意图词以及该意图词对应的拼音,数量少、易于维护,不易遗漏;解决了目前方案中维护语音文字和意图词的对应关系时遇到的需要维护该意图词的形式各异且数量众多的同音字、近音字,难以维护,且易于遗漏等诸多问题。
24.应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
25.附图用来提供对本公开的进一步理解,并且构成说明书的一部分,与本公开的实施例一起用于解释本公开,并不构成对本公开的限制。通过参考附图对详细示例实施例进行描述,以上和其他特征和优点对本领域技术人员将变得更加显而易见,在附图中:
26.图1为本公开实施例提供的一种语句意图纠正方法的流程图;
27.图2为本公开实施例提供的对语句进行分词,获取一组或多组文字的方法流程图;
28.图3为本公开实施例提供的意图词拼音库示意图;
29.图4为本公开实施例提供的从预设的意图词拼音库中查找一组或多组拼音对应的意图词的方法流程图;
30.图5为本公开实施例提供的消费者与ai交流场景下消费者语音处理方法流程图;
31.图6为本公开实施例提供的一种语句意图纠正装置的组成框图;
32.图7为本公开实施例提供的一种电子设备的组成框图。
具体实施方式
33.为使本领域的技术人员更好地理解本公开的技术方案,以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
34.在不冲突的情况下,本公开各实施例及实施例中的各特征可相互组合。
35.如本文所使用的,术语“和/或”包括一个或多个相关列举条目的任何和所有组合。
36.本文所使用的术语仅用于描述特定实施例,且不意欲限制本公开。如本文所使用的,单数形式“一个”和“该”也意欲包括复数形式,除非上下文另外清楚指出。还将理解的是,当本说明书中使用术语“包括”和/或“由
……
制成”时,指定存在所述特征、整体、步骤、操作、元件和/或组件,但不排除存在或添加一个或多个其它特征、整体、步骤、操作、元件、组件和/或其群组。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电性的连接,不管是直接的还是间接的。
37.除非另外限定,否则本文所用的所有术语(包括技术和科学术语)的含义与本领域普通技术人员通常理解的含义相同。还将理解,诸如那些在常用字典中限定的那些术语应当被解释为具有与其在相关技术以及本公开的背景下的含义一致的含义,且将不解释为具有理想化或过度形式上的含义,除非本文明确如此限定。
38.已知由于消费者口音差异、回答简短等原因,导致ai技术识别出来的文字与消费者真实意愿相比出现非常大的差异,导致消费者意愿回答通过率比较低。目前技术为了提升消费者意愿回答通过率,通过意愿词库匹配出消费者的语音文字对应的意愿词,该意愿图库需要维护意图词与该意愿词的同音词及近音词之间的对应关系,因此在意愿词库里配置了大量同音词和近音词,然而通常一个词语的同音词和近音词众多,而且各种排列组合情况全部涵盖的情况下,需要维护的同音词和近音词的数量远远超过我们的想象,因此,导致意愿词库维护困难,再加上考虑不周全的情况下很有可能某些同音词和近音词,以及某些字词的排列组合情况没有包含在意愿词库内,使得意愿词库出现遗漏,从而使得语音文字通过意愿词库匹配意愿词时匹配不到满意的意愿词,降低消费者的满意度,甚至出现由于消费者口音差异,例如,消费者回答“是的”时,而asr识别出如“似的”、“死的”、“使得”等大量词不达意的词,并且意愿词库当中并未存在这些词匹配的意愿词时,使得这些词出现在质检报告中,导致合格监管存在风险。
39.本公开所提供的实施例中通过语句对应的拼音从意图词拼音库中得到意图词,对语句意图进行纠正,方案简单、易于实施,并提高了语句意图纠正准确率,提高了消费者意愿回答通过率;另外,意图词拼音库中包括拼音与意图词之间的对应关系,使得意图词拼音库仅维护所需意图词对应的拼音,而对于各种同音词、近音词来说,拼音的数量远远少于词语的数量,使得本公开实施例的意图词拼音库易于维护,且不易遗漏;解决了目前方案中维护语音文字和意图词的对应关系时遇到的需要维护该意图词的形式各异且数量众多的同音字、近音字,难以维护、易于遗漏等诸多问题。下面对本公开实施例方案进行详细介绍。
40.本公开实施例的意图词识别方法可以由终端设备或服务器等电子设备执行,终端设备可以为车载设备、用户设备(user equipment,ue)、移动设备、用户终端、终端、蜂窝电话、无绳电话、个人数字助理(personal digital assistant,pda)、手持设备、计算设备、车载设备、可穿戴设备等,所述语音检测方法可以通过处理器调用存储器中存储的计算机可读程序指令的方式来实现。或者,可通过服务器执行所述语音检测方法。
41.图1为本公开实施例提供的一种语句意图纠正方法的流程图。参照图1,该方法可以包括步骤s11-s15:
42.s11、获取待纠正的语句;
43.s12、对语句进行分词,获取一组或多组文字;
44.s13、将一组或多组文字转化为相应的一组或多组拼音;
45.s14、从预设的意图词拼音库中查找一组或多组拼音对应的意图词;意图词拼音库包括:拼音与意图词之间的对应关系;
46.s15、采用查找到的意图词纠正语句中相应的文字,获得语句的语句意图纠正结果。
47.在本公开实施例中,该待纠正的语句可以是通过ai技术,例如asr,对消费者语音进行识别获得的语音文字(属于文本数据),该语音文字可以是与消费者实时对话过程中获取的消费者回答语音转换成的文字。
48.在本公开实施例中,如图2所示,对语句进行分词,获取一组或多组文字,可以包括步骤s21-s22:
49.s21、获取语句中的每一个字。
50.s22、根据获取的字在语句中的位置从语句中划分出包含该字的一组或多组文字;其中,包含该字的一组或多组文字中该字为每组文字的第一个字。
51.在本公开实施例中,通过按照字对语句进行分词,使得可以从一个语句中划分出该语句任何能够出现的字词,基于这些字词去匹配意图词时可以保证该语句的全面匹配,避免了对某些字和/或词的遗漏匹配造成对该语句的语义错误解析。
52.在本公开实施例中,根据获取的字在所述语句中的位置从语句中划分出包含该字的一组或多组文字,包括:
53.在该字位于语句的句尾的情况下:将该字划分为一组文字;
54.在该字是语句的倒数第二个字的情况下:将该字划分为一组文字,并将该字与位于语句的句尾的字组合划分为一组文字;
55.在该字位于语句的句首或句中,并且该字不是语句的倒数第二个字的情况下:将该字划分为一组文字,将该字与该字后面的一个字划分为一组文字,并将该字与该字后面每连续的多个字分别划分为一组文字。
56.在本公开实施例中,例如,对于获得的一个语句“四德我同意”进行分词时可以将该语句分解为:
[0057]“四”、“四德”、“四德我”、“四德我同”、“四德我同意”;
[0058]“德”、“德我”、“德我同”、“德我同意”;
[0059]“我”、“我同”、“我同意”;
[0060]“同”、“同意”;
[0061]“意”。
[0062]
在本公开实施例中,对语句分词后,可以获得一组或多组文字,例如上述的“四”、“四德”、“四德我”、“四德我同”、“四德我同意”、“德”、“德我”、“德我同”、“德我同意”、“我”、“我同”、“我同意”、“同”、“同意”、“意”分别作为语句“四德我同意”进行分词后获得的一组文字。
[0063]
在本公开实施例中,上述语句划分方法保证了语句划分到最小粒度,从而保证了语句被全面划分。
[0064]
在本公开实施例中,可以将上述的每一组文字均转化为相应的一组拼音,例如:
[0065]“四”:“si”、“四德”:“side”、“四德我”:“sidewo”、“四德我同
”ꢀ
:“sidewotong”、“四德我同意
”ꢀ
:“sidewotongyi”;
[0066]“德”:
ꢀ“
de”、“德我”:“dewo”、“德我同”:“dewotong”、“德我同意”:“dewotongyi”;
[0067]“我”:“wo”、“我同”:“wotong”、“我同意”:“wotongyi”;
[0068]“同”:“tong”、“同意”:“tongyi”;
[0069]“意”:“yi”。
[0070]
在本公开实施例中,根据转化成的一组或多组拼音,可以从预设的意图词拼音库中查找该一组或多组拼音对应的意图词。在此之前,需要首先创建该意图词拼音库。
[0071]
在本公开实施例中,如图3所示,意图词拼音库可以包含拼音与意图词之间的对应关系,一个意图词可以对应多个拼音,每个意图词对应的拼音为意图音,意图音可以包括但不限于以下任意一种或多种:意图词的标准拼音、方言拼音以及近似拼音;例如,对于意图词“是的”来说,对应的拼音可以包括:shide、side、xide;对于意图词“同意”来说,对应的拼音可以包括:tongyi、tengyi、tengwei;对于意图词“了解”来说,对应的拼音可以包括:liaojie、yaojie、leji;对于意图词“确认”来说,对应的拼音可以包括:queren、quere。
[0072]
在本公开实施例中,可以预先收集消费者回答问题时可能用到的任何词语作为意图词,针对获取的意图词可以找到该意图词的标准用语、各种方言用语以及相似用语,分别将该标准用语、各种方言用语以及相似用语转化为拼音,作为该意图词对应的意图音。
[0073]
在本公开实施例中,意图词拼音库中的每个意图词和每个意图音均具有唯一性,从而可以避免一个拼音对应到多个意图词,造成意图词匹配不唯一,从而造成匹配语义错误的情况发生。
[0074]
在本公开实施例中,意图词拼音库中包含的意图词均为正常词语,例如,“是的”、“确定”、“好”、“我是张三”等词,其中,单独的一个字均可以作为正常词语,该正常词语指的是能够表达一种语义的词语。
[0075]
在本公开实施例中,对于非正常词语,不能作为意图词存储在意图词拼音库中,例如,上述的“德我”、“德我同”,或者是“的我”、“的我同”等之类的词语,这些词语对应的拼音和相似拼音也不会出现在意图词拼音库中,该非正常词语指的是不能够表达一种语义的词语。
[0076]
在本公开实施例中,在创建了上述意图词拼音库的基础上,可以从预设的意图词拼音库中查找该一组或多组拼音对应的意图词。
[0077]
在本公开实施例中,如图4所示,从预设的意图词拼音库中查找一组或多组拼音对应的意图词,可以包括步骤s31-s32:
[0078]
s31、将一组或多组拼音分别与意图词拼音库中的意图音相比较。
[0079]
在本公开实施例中,将一组或多组拼音分别与意图词拼音库中的意图音相比较,包括:
[0080]
将一组或多组拼音分别与意图词拼音库中每一个意图音相比较;或者,
[0081]
针对一组或多组拼音中的任意一组拼音,根据该任意一组拼音对应的文字的字长,从意图词拼音库中选出与该任意一组拼音对应的待比较的意图音,将该任意一组拼音与待比较的意图音相比较。
[0082]
在本公开实施例中,由于意图词拼音库维护的拼音数量相较于需维护的同音词和
近音词的数量大幅度降低,在将获得的文字对应的拼音与意图词拼音库中的拼音相比较时计算量也大幅降低。在此基础上,为了提高匹配准确度,避免遗漏,可以将一组或多组拼音分别与意图词拼音库中每一个意图音相比较,尤其是对于较短的语句,进行分词后获得的文字的组数也较少,因此,即便将每组文字对应的拼音与意图词拼音库中每一个意图音相比较,计算量也不会大很多。例如,对于语句“是的”,分词后最多获得“是”、“是的”、“的”三组文字,相应地获得三组拼音;对于语句“好”,分词后只获得“好”这一组文字,相应地,仅获得一组拼音。
[0083]
在本公开实施例中,对于获得的拼音组数较少的语句,在将该语句对应的一组或多组拼音与意图词拼音库中的拼音比较之前,可以检测一下拼音组数,如果拼音组数小于或等于预设的组数阈值,可以直接将每组拼音分别与意图词拼音库中每一个标准拼音和近似拼音相比较。
[0084]
在本公开实施例中,为了进一步提高工作效率,在将语句对应的一组或多组拼音与意图词拼音库中的拼音比较之前,可以针对每组拼音,根据该组拼音对应的文字的字长,从意图词拼音库中选出与该组拼音对应的待比较的意图音,从而可以将该组拼音仅与选出的待比较的意图音相比较。
[0085]
在本公开实施例中,根据该任意一组拼音对应的文字的字长,从意图词拼音库中选出与该任意一组拼音对应的待比较的意图音,包括:
[0086]
获得该任意一组拼音对应的文字的字长;
[0087]
从意图词拼音库中找到具有相同字长的一个或多个意图词;
[0088]
从意图词拼音库中选出具有相同字长的一个或多个意图词对应的意图音,作为待比较的意图音。
[0089]
在本公开实施例中,语句被分词后,获得的多组文字可能包括不同的字长,为了提高工作效率,可以根据文字的字长去寻找具有相同字长的意图词对应的意图音,作为待比较的意图音,从而大幅缩小比较范围,相应提高工作效率。
[0090]
在本公开实施例中,例如,对于“四德我同意”这五个文字,其对应的拼音“sidewotongyi”可以仅与五个字的意图词对应的意图音相比较;对于“四德我同
”ꢀ
这四个文字,其对应的拼音“sidewotong
”ꢀ
可以仅与四个字的意图词对应的意图音相比较。
[0091]
在本公开实施例中,在根据该任意一组拼音对应的文字的字长,从意图词拼音库中选出与该任意一组拼音对应的待比较的意图音之前,该方法还可以包括:检测该文字的字长是否大于预设的字长阈值,如果大于字长阈值,则可以从意图词拼音库中选出与该组拼音对应的待比较的意图音,以将该组拼音与对应的待比较的意图音相比较。
[0092]
在本公开实施例中,从意图词拼音库中选出与一组拼音对应的待比较的意图音,并将该组拼音与对应的待比较的意图音相比较这一方案可以直接实施,也可以在确定文字的字长太长时才实施,采用哪种方案可以根据需求进行相应的选择,在此不做限定。
[0093]
在本公开实施例中,在根据该任意一组拼音对应的文字的字长,从意图词拼音库中选出与该任意一组拼音对应的待比较的意图音之前,该方法还可以包括:
[0094]
对一组或多组文字按照字长进行降序排序;和/或,
[0095]
对意图词拼音库中的意图词按照字长进行降序排序。
[0096]
在本公开实施例中,为了便于找到与每组拼音对应的文字字长具有相同字长的意
图词,可以预先对每组文字计算字长并排序,和/或,可以预先对每个意图词计算字长并排序;排序后的文字字长可以便于快速找出大于字长阈值的文字,而且对于每组文字对应的拼音,根据排序依次与意图词拼音库中的拼音比较,可以避免遗漏;排序后的意图词可以使得一组文字快速地匹配到与该组文字具有相同字长的意图词。
[0097]
s32、在任意一组拼音与任意一个意图音相同的情况下,获得与该任意一个意图音对应的意图词,作为该任意一组拼音对应的意图词。
[0098]
在本公开实施例中,通过前述的比较方案将一个语句对应的每组拼音与意图词拼音库中的拼音相比较后,有可能在意图词拼音库中匹配到一个与该组拼音相同的拼音(该匹配到的拼音可能是标准拼音,可能是方言拼音、也可能是近似拼音),这时,可以根据意图词拼音库中意图音与意图词的对应关系,找到该匹配到的拼音对应的意图词,将该意图词作为进行比较的该组拼音对应的文字所对应的意图词,从而获得一个意图词匹配结果。
[0099]
在本公开实施例中,通过前述的比较方案将一个语句对应的每组拼音与意图词拼音库中的拼音相比较后,有可能在意图词拼音库中匹配不到任何一个与该组拼音相同的拼音,这说明意图库中没有包含该组拼音,因为,在意图词拼音库中仅保存正常词语对应的意图音,对于一些非正常词语,例如,“德我”、“德我同”等之类的词,肯定不能作为意图词保存在一图库中,因此,这些词对应的拼音不会出现在意图词拼音库中,从而在进行拼音匹配时也不会得到匹配结果。对于未从意图词拼音库中匹配到相同拼音的一组或多组拼音,则可以直接忽略或删除。
[0100]
在本公开实施例中,为了提高工作效率,可以在对词语进行分词以后,对获得的一组或多组文字中属于正常词语的文字筛选出来,或者将属于非正常词语的文字删除。 例如,对于前述的多组文字“四”、“四德”、“四德我”、“四德我同”、“四德我同意”、“德”、“德我”、“德我同”、“德我同意”、“我”、“我同”、“我同意”、“同”、“同意”、“意”,可以将其中的“四德我”、“四德我同
”ꢀ“
德我”、“德我同”、“德我同意”、“我同”等文字作为非正常词语删除,剩余“四”、“四德”、
ꢀ“
四德我同意”、“德”、
ꢀ“
我”、
ꢀ“
我同意”、“同”、“同意”、“意”等文字转换成相应的拼音后与意图词拼音库中的意图音相比较,剩余的这些文字已经足够用于匹配出语句“四德我同意”相应的意图词。在后续操作中也仅需将剩余的一组或多组文字转化为相应的拼音,从而为后续的一系列操作节省了计算量。
[0101]
在本公开实施例中,通过上述方案匹配出待匹配的一组或多组拼音对应的意图词以后,可以将该组拼音对应的文字与匹配出的意图词组成纠正词对,例如,(四德:是的)、(四德我同意:是的我同意),并根据获得的一个或多个纠正词对,采用匹配出的意图词替换该待匹配的一组或多组拼音在语句中对应的文字,从而实现对语句的意图纠正,例如,根据(四德:是的)纠正词对,将“四德我同意”中的“四德”替换为“是的”,根据纠正词对(四德我同意:是的我同意),将“四德我同意”替换为“是的我同意”。
[0102]
在本公开实施例中,下面给出本公开实施例方案在消费者与ai交流场景中应用的一个实施流程图,如图5所示,可以包括步骤s41-s47:
[0103]
s41、根据预设的流程话术,通过tts(文本转换语音)算法把流程话术文本转换为语音。
[0104]
s42、将转换的语音播放出给消费者。
[0105]
s43、获取消费者根据播放的语音问题回答的意愿。
[0106]
s44、通过asr算法把消费者回答的意愿的语音转换为文本。
[0107]
s45、通过本公开实施例方案的语句意图纠正方法对转换的文本(消费者回答问题对应的文本)中的语句进行意图纠正。
[0108]
s46、对消费者回答的意愿对应的文本进行意图纠正以后,获得消费者的真实意图。
[0109]
s47、入库消费者的真实意图,并把消费者的真实意图显示给消费者。
[0110]
在本公开实施例中,至少包含以下优势:
[0111]
1、降低意图词拼音库维护复杂度。
[0112]
在意图词拼音库中只需要维护“是的”“好的”“同意”“确认”等意图词,而不像目前技术方案,在意图词库中配置如“似的”“死的”“湿的”等诸多词不达意的同音词、近音词,由于这类词语数量众多,使得意图词库难以维护,并且容易出现遗漏。
[0113]
2、避免监管合规风险。
[0114]
由于目前技术方案在质检报告中直接展示asr转写的文本,使得如“似的”“死的”“湿的”等词不达意的同音词和近音词均有可能出现在质检报告中,导致监管合规有风险,而本公开实施例方案的语句纠正方法将这些近音词均纠正为标准的意图词“是的”,避免了同音词和近音词出现在质检报告中导致的监控合规风险。
[0115]
3、提升消费者满意度。
[0116]
由于消费者口音差异,导致asr直接将语音转换成文本后,会在消费者端显示的回答内容中出现诸如“似的”“死的”“湿的”等词不达意的同音词和近音词,导致消费者体验较差,采用本公开实施例方案的语句纠正方法,使得展示给消费者的是标准的意图词“是的”,大幅提升用户使用满意度。
[0117]
如图6所示,为本公开实施例提供的一种语句意图纠正装置的框图。
[0118]
参照图6,本公开实施例提供了一种语句意图纠正装置100,可以包括:
[0119]
获取模块101,用于获取待纠正的语句;
[0120]
分词模块102,用于对所述语句进行分词,获取一组或多组文字;
[0121]
转化模块103,用于将所述一组或多组文字转化为相应的一组或多组拼音;
[0122]
查找模块104,用于从预设的意图词拼音库中查找所述一组或多组拼音对应的意图词;所述意图词拼音库包括:拼音与所述意图词之间的对应关系;
[0123]
纠正模块105,用于采用查找到的意图词纠正所述语句中相应的文字,获得所述语句的语句意图纠正结果。
[0124]
如图7所示,为本公开实施例提供的一种电子设备的框图。
[0125]
参照图7,本公开实施例提供了一种电子设备200,该电子设备200包括:至少一个处理器201;以及
[0126]
与至少一个处理器201通信连接的存储器202;其中,
[0127]
存储器202存储有可被至少一个处理器201执行的一个或多个计算机程序,一个或多个计算机程序被至少一个处理器201执行,以使至少一个处理器201能够执行上述的语句意图纠正方法。
[0128]
在本公开实施例中,电子设备200还可以包括:一个或多个i/o(输入/输出)接口203,连接在处理器201与存储器202之间。
[0129]
本公开实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,其中,所述计算机程序在被处理器执行时实现上述的语句意图纠正方法。计算机可读存储介质可以是易失性或非易失性计算机可读存储介质。
[0130]
本公开实施例还提供了一种计算机程序产品,包括计算机可读代码,或者承载有计算机可读代码的非易失性计算机可读存储介质,当所述计算机可读代码在电子设备的处理器中运行时,所述电子设备中的处理器执行上述的语句意图纠正方法。
[0131]
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施方式中,在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分;例如,一个物理组件可以具有多个功能,或者一个功能或步骤可以由若干物理组件合作执行。某些物理组件或所有物理组件可以被实施为由处理器,如中央处理器、数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读存储介质上,计算机可读存储介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。
[0132]
如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读程序指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom)、静态随机存取存储器(sram)、闪存或其他存储器技术、便携式压缩盘只读存储器(cd-rom)、数字多功能盘(dvd)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读程序指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。
[0133]
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
[0134]
用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(isa)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如smalltalk、c++等,以及常规的过程式编程语言—诸如“c”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(lan)或广域网(wan)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(fpga)或可
编程逻辑阵列(pla),该电子电路可以执行计算机可读程序指令,从而实现本公开的各个方面。
[0135]
这里所描述的计算机程序产品可以具体通过硬件、软件或其结合的方式实现。在一个可选实施例中,所述计算机程序产品具体体现为计算机存储介质,在另一个可选实施例中,计算机程序产品具体体现为软件产品,例如软件开发包(software development kit,sdk)等等。
[0136]
这里参照根据本公开实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
[0137]
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
[0138]
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
[0139]
附图中的流程图和框图显示了根据本公开的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
[0140]
本文已经公开了示例实施例,并且虽然采用了具体术语,但它们仅用于并仅应当被解释为一般说明性含义,并且不用于限制的目的。在一些实例中,对本领域技术人员显而易见的是,除非另外明确指出,否则可单独使用与特定实施例相结合描述的特征、特性和/或元素,或可与其他实施例相结合描述的特征、特性和/或元件组合使用。因此,本领域技术人员将理解,在不脱离由所附的权利要求阐明的本公开的范围的情况下,可进行各种形式和细节上的改变。

技术特征:
1.一种语句意图纠正方法,其特征在于,所述方法包括:获取待纠正的语句;对所述语句进行分词,获取一组或多组文字;将所述一组或多组文字转化为相应的一组或多组拼音;从预设的意图词拼音库中查找所述一组或多组拼音对应的意图词;所述意图词拼音库包括:拼音与所述意图词之间的对应关系;采用查找到的意图词纠正所述语句中相应的文字,获得所述语句的语句意图纠正结果。2.根据权利要求1所述的语句意图纠正方法,其特征在于,所述对所述语句进行分词,获取一组或多组文字,包括:获取所述语句中的每一个字;根据获取的字在所述语句中的位置从所述语句中划分出包含所述字的一组或多组文字;其中,在所述包含所述字的一组或多组文字中,所述字为每组文字的第一个字。3.根据权利要求2所述的语句意图纠正方法,其特征在于,所述根据获取的字在所述语句中的位置从所述语句中划分出包含所述字的一组或多组文字,包括:在所述字位于所述语句的句尾的情况下:将所述字划分为一组文字;在所述字是所述语句的倒数第二个字的情况下:将所述字划分为一组文字,并将所述字与位于所述语句的句尾的字组合划分为一组文字;在所述字位于所述语句的句首或句中,并且所述字不是所述语句的倒数第二个字的情况下:将所述字划分为一组文字,将所述字与所述字后面的一个字划分为一组文字,并将所述字与所述字后面每连续的多个字分别划分为一组文字。4.根据权利要求1所述的语句意图纠正方法,其特征在于,所述意图词拼音库中每个所述意图词对应的拼音为意图音,所述意图音包括以下任意一种或多种:所述意图词的标准拼音、方言拼音以及近似拼音;其中,所述意图词拼音库中每个所述意图词、每个所述标准拼音、每个所述方言拼音以及每个所述近似拼音均具有唯一性。5.根据权利要求4所述的语句意图纠正方法,其特征在于,所述从预设的意图词拼音库中查找所述一组或多组拼音对应的意图词,包括:将所述一组或多组拼音分别与所述意图词拼音库中的所述意图音相比较;在任意一组拼音与任意一个所述意图音相同的情况下,获得与所述任意一个所述意图音对应的意图词,作为所述任意一组拼音对应的意图词。6.根据权利要求5所述的语句意图纠正方法,其特征在于,所述将所述一组或多组拼音分别与所述意图词拼音库中的所述意图音相比较,包括:将所述一组或多组拼音分别与所述意图词拼音库中每一个所述意图音相比较;或者,针对所述一组或多组拼音中的任意一组拼音,根据所述任意一组拼音对应的文字的字长,从所述意图词拼音库中选出与所述任意一组拼音对应的待比较的所述意图音,将所述任意一组拼音与待比较的所述意图音相比较。7.根据权利要求6所述的语句意图纠正方法,其特征在于,所述根据所述任意一组拼音对应的文字的字长,从所述意图词拼音库中选出与所述任意一组拼音对应的待比较的所述
意图音,包括:获得所述任意一组拼音对应的文字的字长;从所述意图词拼音库中找到具有相同字长的一个或多个意图词;从所述意图词拼音库中选出所述具有相同字长的一个或多个意图词对应的所述意图音,作为待比较的所述意图音。8.根据权利要求6或7所述的语句意图纠正方法,其特征在于,在根据所述任意一组拼音对应的文字的字长,从所述意图词拼音库中选出与所述任意一组拼音对应的待比较的所述意图音之前,所述方法还包括:对所述一组或多组文字按照字长进行降序排序;和/或,对所述意图词拼音库中的意图词按照字长进行降序排序。9.一种语句意图纠正装置,其特征在于,包括:获取模块,用于获取待纠正的语句;分词模块,用于对所述语句进行分词,获取一组或多组文字;转化模块,用于将所述一组或多组文字转化为相应的一组或多组拼音;查找模块,用于从预设的意图词拼音库中查找所述一组或多组拼音对应的意图词;所述意图词拼音库包括:拼音与所述意图词之间的对应关系;纠正模块,用于采用查找到的意图词纠正所述语句中相应的文字,获得所述语句的语句意图纠正结果。10.一种电子设备,其特征在于,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的一个或多个计算机程序,一个或多个所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1-8中任一项所述的语句意图纠正方法。11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序在被处理器执行时实现如权利要求1-8中任一项所述的语句意图纠正方法。

技术总结
本公开提供了一种语句意图纠正方法及其装置、电子设备、存储介质,涉及音频处理技术领域,该方法包括:获取待纠正的语句;对语句进行分词,获取一组或多组文字;将一组或多组文字转化为相应的一组或多组拼音;从预设的意图词拼音库中查找一组或多组拼音对应的意图词;意图词拼音库包括:拼音与意图词之间的对应关系;采用查找到的意图词纠正语句中相应的文字,获得语句的语句意图纠正结果。根据本公开的实施例提高了语句意图纠正准确率,提高了消费者意愿回答通过率。费者意愿回答通过率。费者意愿回答通过率。


技术研发人员:张磊 刘涛 周健
受保护的技术使用者:北京中关村科金技术有限公司
技术研发日:2023.07.11
技术公布日:2023/8/14
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐