回复文本生成方法、装置、设备和可读存储介质与流程
未命名
09-17
阅读:114
评论:0
1.本发明涉及计算机技术领域,特别是指一种回复文本生成方法、装置、设备和可读存储介质。
背景技术:
2.目前智能自动回复已经应用到各个行业,如购物网站的机器人客服、银行应用(application,app)的机器人客服和社交app的公众号服务等。
3.通常现有技术多为通过关键字进行检索对比,在答案库中匹配合适的回复,发送给用户。现有技术针对回复文本生成的研究主要是在于如何提升检索的准确率,比如现有的一种人工智能对话系统,获取语音输入后将语音输入识别转化为文本输入,对文本输入执行意图理解,根据意图理解的结果选择将文本输入送入开域对话及问答流程,任务式对话流程;其中,开域对话及问答流程是,对文本输入计算第一句子向量,根据第一句子向量与答案库中的问题的句子向量对比结果,找出与第一句子向量相似度最高的答案库中的问题;返回该问题的答案。
4.但是上述现有的回复文本生成方法根据意图理解的结果选择将文本输入送入开域对话及自定义问答流程和任务式对话流程,具有文本输入处理的信息单一,回复结果单一的问题。
技术实现要素:
5.本发明的目的是提供一种回复文本生成方法、装置、设备和可读存储介质,用以解决现有的回复文本生成方法的文本输入处理的信息单一,回复结果单一的问题。
6.为解决上述技术问题,本发明实施例提供如下技术方案:本发明实施例提供了一种回复文本生成方法,所述方法包括:根据输入文本中的关键词确定所述输入文本的文本类型;所述文本类型为含有目标类型关键词的文本或不含有目标类型关键词的文本;目标类型关键词包括以下至少一项:敏感词;操作手册专业词;营销活动词;根据所述输入文本的文本类型,生成所述输入文本的回复文本。
7.可选地,在所述文本类型为含有目标类型关键词的文本的情况下,根据所述输入文本的文本类型,生成所述输入文本的回复文本,包括以下至少一项:若所述目标类型关键词包括敏感词,将预设回复文本作为所述输入文本的回复文本;若所述目标类型关键词包括操作手册专业词,根据所述输入文本对应的输入用户的用户类型、所述输入文本中的操作手册专业词、所述输入文本中的问题词汇和预先创建的目标关系,得到所述输入文本的回复文本;其中,所述目标关系用于指示操作手册关键词、问题词汇与回复文本之间的对应关系;不同的用户类型的输入用户对应不同的目标关系;
若所述目标类型关键词包括营销活动词,根据所述输入文本中的营销活动词、所述输入文本对应的输入用户的用户信息和预先创建的营销活动列表信息,得到所述输入文本的回复文本;其中,所述输入文本对应的输入用户的用户信息包括所述输入文本对应的输入用户的用户类型和/或所述输入文本对应的输入用户的注册位置信息;所述营销活动列表信息包括以下至少一项:营销活动名称;营销活动适用用户的用户类型;营销活动位置;活动起始时间;活动结束时间;活动规则。
8.可选地,所述输入用户的用户类型包括第一类型和第二类型,所述第一类型的输入用户的注册时长小于预设时长,所述第二类型的输入用户的注册时长大于或等于预设时长;所述目标关系包括第一目标关系和第二目标关系;所述第一类型的输入用户对应所述第一目标关系,所述第二类型的输入用户对应所述第二目标关系;所述第二目标关系中的回复文本是对所述第一目标关系中的回复文本进行精简处理得到的。
9.可选地,根据所述输入文本对应的输入用户的用户类型、所述输入文本中的操作手册专业词、所述输入文本中的问题词汇和预先创建的目标关系,得到所述输入文本的回复文本,包括:在所述输入用户的用户类型为所述第一类型的情况下,获取所述输入文本对应的语气助词;根据所述语气助词、所述输入文本中的操作手册专业词、所述输入文本中的问题词汇、所述第一目标关系,得到所述输入文本的回复文本。
10.可选地,获取所述输入文本对应的语气助词,包括以下至少一项:对所述输入文本进行情感分类,得到所述输入文本的情感分类结果,并根据所述情感分类结果和预先创建的情感语气助词库,得到所述输入文本对应的语气助词;根据所述输入文本对应的输入用户的注册位置信息和预先创建的位置语气助词库,得到所述输入文本对应的语气助词。
11.可选地,所述方法还包括:对预设的操作手册中的问题语句进行关键词提取,得到操作手册专业词和问题词汇;根据所述操作手册专业词、所述问题词汇和所述问题语句对应的回复文本,得到所述第一目标关系;对所述问题语句对应的回复文本进行精简处理,得到所述第二目标关系中的回复文本;根据所述操作手册专业词、所述问题词汇和所述第二目标关系中的回复文本,得到所述第二目标关系。
12.可选地,在所述文本类型为不含有目标类型关键词的文本的情况下,根据所述输入文本的文本类型,生成所述输入文本的回复文本,包括:对所述输入文本进行情感分类,得到所述输入文本的情感分类结果;利用训练好的长短期记忆网络lstm模型和所述输入文本,得到所述输入文本的至
少一个模型回复文本;在所述模型回复文本中确定目标回复文本;其中,所述目标回复文本为所述至少一个模型回复文本中情感分类结果与所述输入文本的情感分类结果的相似度最高的模型回复文本;根据所述输入文本对应的输入用户的注册位置信息和预先创建的位置语气助词库,得到所述输入文本对应的语气助词;根据所述目标回复文本和所述语气助词,得到所述输入文本的回复文本。
13.本发明实施例还提供一种回复文本生成装置,所述装置包括:确定模块,用于根据输入文本中的关键词确定所述输入文本的文本类型;所述文本类型为含有目标类型关键词的文本或不含有目标类型关键词的文本;目标类型关键词包括以下至少一项:敏感词;操作手册专业词;营销活动词;生成模块,用于根据所述输入文本的文本类型,生成所述输入文本的回复文本。
14.本发明实施例还提供一种回复文本生成设备,包括:收发器、处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令;所述处理器执行所述程序或指令时实现如上中任一项所述的回复文本生成方法中的步骤。
15.本发明实施例还提供一种可读存储介质,其上存储有程序或指令,所述程序或指令被处理器执行时实现如上中任一项所述的回复文本生成方法中的步骤。
16.本发明的上述技术方案的有益效果如下:本发明方案提供的回复文本生成方法,根据输入文本中的关键词确定输入文本的类型,其中,文本类型为含有目标类型关键词的文本或不含有目标类型关键词的文本,目标类型关键词包括以下至少一项:敏感词;操作手册专业词;营销活动词,可以丰富文本输入的处理信息,并根据输入文本的文本类型,生成所述输入文本的回复文本,进而丰富回复结果。
附图说明
17.图1为本发明实施例提供的回复文本生成方法的流程图;图2为本发明实施例提供的第一回复匹配库的创建流程示意图;图3为本发明实施例提供的回复文本生成方法的整体流程图;图4为本发明实施例提供的回复文本生成装置的结构示意图;图5为本发明实施例提供的回复文本生成设备的结构示意图。
具体实施方式
18.为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。
19.应理解,说明书通篇中提到的“一个实施例”或“一实施例”意味着与实施例有关的特定特征、结构或特性包括在本发明的至少一个实施例中。因此,在整个说明书各处出现的“在一个实施例中”、“在一实施例中”或“在一可选实施例中”未必一定指相同的实施例。此外,这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施例中。
20.在本发明的各种实施例中,应理解,下述各过程的序号的大小并不意味着执行顺
序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
21.另外,本文中术语“系统”和“网络”在本文中常可互换使用。
22.在本技术所提供的实施例中,应理解,“与a相应的b”表示b与a相关联,根据a可以确定b。但还应理解,根据a确定b并不意味着仅仅根据a确定b,还可以根据a和/或其它信息确定b。
23.为解决现有的回复文本生成方法的文本输入处理的信息单一,回复结果单一的问题,本发明实施例提供一种回复文本生成方法、装置、设备和可读存储介质。
24.如图1所示,本发明实施例提供一种回复文本生成方法,所述方法包括:步骤101:根据输入文本中的关键词确定所述输入文本的文本类型;所述文本类型为含有目标类型关键词的文本或不含有目标类型关键词的文本;目标类型关键词包括以下至少一项:敏感词;操作手册专业词;营销活动词。
25.在本步骤中,可以使用textrank算法对输入文本进行关键词提取,得到输入文本中的关键词,同时还可以获取输入文本对应的输入用户的用户信息,比如输入用户的用户类型(包括输入用户的账号创建时间等),输入用户的注册位置信息,即输入用户所处的地理位置(比如省份等)。
26.本步骤根据输入文本中的关键词对输入文本进行分类,得到四种文本类型:含有敏感词的文本、含有操作手册专业词的文本、含有营销活动词(活动优惠营销词)的文本和其他文本(即不含有目标类型关键词的文本)。
27.本步骤,可以丰富对文本输入的处理信息。
28.步骤102:根据所述输入文本的文本类型,生成所述输入文本的回复文本。
29.在本步骤中,针对不同的输入文本的文本类型,生成不同的回复文本,可以丰富回复结果。
30.在本发明一可选实施例中,在所述文本类型为含有目标类型关键词的文本的情况下,步骤102,包括以下至少一项实现方式:实现方式一:若所述目标类型关键词包括敏感词,将预设回复文本作为所述输入文本的回复文本。
31.需要说明的是,在本实现方式中,可以针对不同类型的敏感词设计不同的预设回复文本,也可以针对不同类型的敏感词设计相同的预设回复文本,示例性地,在本实现方式中,针对包含敏感词的输入文本直接以相同的预设回复文本作为安全回复进行自动回复,比如预设回复文本为“不好意思,我不明白您的意思”。
32.其中,输入文本中是否含有敏感词可以直接将输入文本的关键词与预设的敏感词库进行匹配,若匹配到,则认为输入文本中含有敏感词,按照上述实现方式一进行回复。
33.实现方式二:若所述目标类型关键词包括操作手册专业词,根据所述输入文本对应的输入用户的用户类型、所述输入文本中的操作手册专业词、所述输入文本中的问题词汇和预先创建的目标关系,得到所述输入文本的回复文本;其中,所述目标关系用于指示操作手册关键词、问题词汇与回复文本之间的对应关系;不同的用户类型的输入用户对应不同的目标关系。
34.在本实现方式中,将输入文本的关键词输入预设的标准操作手册关键词库进行匹
配,若匹配到,则认为输入文本中含有操作手册专业词。
35.在输入文本中含有操作手册专业词的情况下,确定输入文本对应的输入用户的用户类型,根据不同的用户类型,确定不同的目标关系,并根据输入文本中的操作手册专业词、输入文本中的问题词汇和根据用户类型确定的目标关系,得到输入文本的回复文本。
36.实现方式三:若所述目标类型关键词包括营销活动词,根据所述输入文本中的营销活动词、所述输入文本对应的输入用户的用户信息和预先创建的营销活动列表信息,得到所述输入文本的回复文本;其中,所述输入文本对应的输入用户的用户信息包括所述输入文本对应的输入用户的用户类型和/或所述输入文本对应的输入用户的注册位置信息;所述营销活动列表信息包括以下至少一项:营销活动名称;营销活动适用用户的用户类型;营销活动位置;活动起始时间;活动结束时间;活动规则。
37.在本实现方式中,所述营销活动列表信息可以以营销活动列表库的形式实现,营销活动列表库的库元素组成如下:营销活动名称、营销活动适用用户的用户类型、营销活动位置(比如省份、城市等)、活动起始时间、活动结束时间和活动规则。
38.其中,营销活动列表库的库元素根据活动起始时间和活动结束时间等活动时效性进行更新。
39.输入文本对应的输入用户的用户信息包括输入文本对应的输入用户的用户类型和输入文本对应的输入用户的注册位置信息。
40.将输入用户的营销活动词与营销活动名称进行匹配,将输入文本对应的输入用户的用户类型与营销活动适用用户的用户类型进行匹配,以及将输入文本对应的输入用户的注册位置信息与营销活动位置进行匹配,将匹配到的所有营销活动对应的营销活动名称、营销活动适用用户的用户类型、营销活动位置、活动起始时间、活动结束时间和活动规则等信息按照顺序组合,作为营销活动的回复文本。
41.进一步地,根据所述输入文本中的营销活动词、所述输入文本对应的输入用户的用户信息和预先创建的营销活动列表信息,得到所述输入文本的回复文本,包括:根据所述输入文本中的营销活动词、所述输入文本对应的输入用户的用户信息和预先创建的营销活动列表信息,得到营销活动的回复文本,具体流程如上所述;在预先创建的情感语气助词库中选取高兴或积极的语气助词,根据语气助词和营销活动的回复文本,生成输入文本的回复文本,比如将上述预期助词添加到营销活动的回复文本的末尾,得到输入文本的回复文本,并作为营销活动的介绍返回给输入用户。
42.需要说明的是,在输入文本包括目标类型关键词的情况下,只要是判断目标类型关键词包括敏感词(无论其他的关键词是包括操作手册专业词,还是包括营销活动词或是包括操作手册专业词和营销活动词),则按照上述实现方式一得到回复文本,在不包括敏感词的情况下,若关键词是包括操作手册专业词(无论关键是是否还包括营销活动词),则按照上述实现方式二得到回复文本,否则,在目标类型关键词包括营销活动词的情况下,则按照上述实现方式三得到回复文本。
43.可选地,所述输入用户的用户类型包括第一类型和第二类型,所述第一类型的输入用户的注册时长小于预设时长,所述第二类型的输入用户的注册时长大于或等于预设时长;
所述目标关系包括第一目标关系和第二目标关系;所述第一类型的输入用户对应所述第一目标关系,所述第二类型的输入用户对应所述第二目标关系;所述第二目标关系中的回复文本是对所述第一目标关系中的回复文本进行精简处理得到的。
44.即在本实施例中,将输入用户分为新用户和老用户两种类型,可选地,预设时长为一年,根据输入用户的注册时长(即账号使用年限)判断,将注册时长小于一年的输入用户判定为新用户,也就是第一类型的输入用户,将注册时长大于或等于一年的输入用户判定为老用户,也就是第二类型的输入用户。
45.具体地,在本实施例中,目标关系以用户回复匹配库的形式存在,对应的,第一目标关系以新用户回复匹配库(第一回复匹配库)的形式存在,第二目标关系以老用户回复匹配库(第二回复匹配库)的形式存在,具体地,第一回复匹配库中包括操作手册专业词、问题词汇以及操作手册专业词和问题词汇对应的回复文本,还包括操作手册专业词、问题词汇和对应的回复文本之间的对应关系,第二回复匹配库中包括操作手册专业词、问题词汇以及对操作手册专业词和问题词汇对应的回复文本进行精简处理后的回复文本,还包括操作手册专业词、问题词汇和对应的精简处理后的回复文本之间的对应关系。
46.即根据不同输入用户的用户类型,选取对应的目标关系进行匹配,从而使得回复内容更加人性化。
47.下面具体说明目标关系(即回复匹配库)的创建过程:即在本发明一可选实施例中,所述方法还包括:对预设的操作手册中的问题语句进行关键词提取,得到操作手册专业词和问题词汇,即遍历预设的操作手册中的问题语句,使用textrank算法对问题语句进行关键词提取,得到操作手册专业词和问题词汇;根据所述操作手册专业词、所述问题词汇和所述问题语句对应的回复文本(也可以称为手册答案),得到所述第一目标关系,将操作手册专业词、问题词汇以及预设的操作手册中问题语句对应的回复文本之间的对应关系构成第一目标关系(即第一回复匹配库);对所述问题语句对应的回复文本进行精简处理,得到所述第二目标关系中的回复文本(也可以称为简洁答案),根据所述操作手册专业词、所述问题词汇和所述第二目标关系中的回复文本,得到所述第二目标关系,即对预设的操作手册中问题语句对应的回复文本进行精简处理,得到第二目标关系中的回复文本,将操作手册专业词、问题词汇以及第二目标关系中的回复文本构成第二目标关系(即第二回复匹配库),即上述的简洁答案是对手册答案进行润色精简处理得到的。
48.其中,预设的操作手册中的问题语句进行关键词提取后得到的操作手册专业词即构成了上述的标准操作手册关键词库。
49.下面结合图2,说明第一回复匹配库的创建过程如下:针对预设的操作手册,遍历操作手册中的每个问题语句,对问题语句利用textrank算法进行关键词提取,得到操作手册专业词和问题词汇,将操作手册专业词、问题词汇和操作手册中问题语句对应的手册答案组成第一回复匹配库的库元素,将操作手册专业词构成标准操作手册关键词库。
50.第二回复匹配库的创建过程与上述第一回复匹配库的创建过程相似,但是第二回复匹配库的库元素为操作手册专业词、问题词汇和简洁答案,其中,简洁答案通过对手册答案进行润色精简获取。
51.还需要说明的是,上述实现方式二具体包括:根据输入文本对应的输入用户的用户类型,确定目标关系,比如,在输入用户的用户类型为第一类型的情况下,确定目标关系为第一目标关系,在输入类型为第二类型的情况下,确定目标关系为第二目标关系,将输入文本中的操作手册专业词与确定的目标关系中的操作手册专业词进行匹配,若匹配到目标关系中唯一的操作手册专业词,则将根据该唯一的操作手册专业词和输入文本的问题词汇以及该唯一的操作手册关键词、问题词汇与回复文本之间的对应关系,确定输入文本的回复文本。若匹配到目标关系中的操作手册专业词不唯一,则利用n-gram模型计算相似度,取相似度最高的操作手册专业词和问题词汇对应的回复文本作为输入文本的回复文本。
52.上述提到的textrank算法,使用无监督关键词提取算法textrank。
53.上述提到的利用n-gram模型计算相似度中,基于n-gram模型模糊定义的句子相似度是一种模糊匹配方式,通过两个长的相似的句子间的差异性来衡量相似度。
54.在本发明一可选实施例中,根据所述输入文本对应的输入用户的用户类型、所述输入文本中的操作手册专业词、所述输入文本中的问题词汇和预先创建的目标关系,得到所述输入文本的回复文本,包括:在所述输入用户的用户类型为所述第一类型的情况下,获取所述输入文本对应的语气助词;根据所述语气助词、所述输入文本中的操作手册专业词、所述输入文本中的问题词汇、所述第一目标关系,得到所述输入文本的回复文本。
55.具体地,在本可选实施例中,在输入用户的用户类型为新用户的情况下,获取输入文本对应的合适的语气助词,并给第一目标关系中的回复文本添加语气助词,根据第一目标关系中的回复文本和添加的语气助词,得到输入文本的回复文本。
56.可选地,获取所述输入文本对应的语气助词,包括以下至少一项:对所述输入文本进行情感分类,得到所述输入文本的情感分类结果,并根据所述情感分类结果和预先创建的情感语气助词库,得到所述输入文本对应的语气助词,具体地,对输入文本进行情感分类,得到恐惧,愤怒,悲伤,高兴,厌恶五大类情感分类结果,针对每一情感分类结果创建情感语气助词库,例如高兴的语气助词库里有:啊,呀,等。恐惧、愤怒、悲伤、厌恶几个语气助词库也根据此方法创建,根据输入文本的情感分类结果和对应的语气助词库中,得到输入文本对应的语气助词,语气助词的强烈程度可以根据情感分类结果与情感语气助词库的匹配程度确定,比如匹配程度越高,语气助词越强烈;根据所述输入文本对应的输入用户的注册位置信息和预先创建的位置语气助词库,得到所述输入文本对应的语气助词,具体地,根据位置信息创建位置语气助词库,比如分别创建南方语气助词库和北方语气助词库,南方语气助词库中包括南方的哇等语气助词,北方语气助词库中包括北方的好嘞等语气助词,进一步地,还可以对位置区域进行更详细的划分,比如划分为北部(西北省份,华北省份,东北省份)、中部(西南省份,华中省份,华东省份)和南部(华南省份)语气助词库,根据输入用户的注册位置信息和上述创建的位置语气助词库得到输入文本对应的语气助词。
57.按照上述方式获取输入文本对应的语气助词后,在第一目标关系中的回复文本中添加语气助词,得到输入文本的回复文本。
58.本发明实施例中,由于采用了区分新老用户类型,分别对应匹配不同的回复匹配库,并针对在标准操作手册关键词库中匹配的不同的操作手册专业词,根据n-gram相似度给予了不同的回复内容,并且根据情感识别的结果,挑选对应的语气助词,可以使得回复的内容更为人性化,比如同一个问题,新用户的回复会比较标准完整,而老用户的回复则是言简意赅的,这样新老用户都有更好的用户体验。增加回复结果的温度,提升智能化。
59.在本发明一可选实施例中,在所述文本类型为不含有目标类型关键词的文本的情况下,根据所述输入文本的文本类型,生成所述输入文本的回复文本,包括:对所述输入文本进行情感分类,得到所述输入文本的情感分类结果,可选地,利用训练好的长短期记忆网络(long short term memory,lstm)模型对输入文本进行情感分类,得到输入文本的情感分类结果,该输入文本的情感分类结果为恐惧,愤怒,悲伤,高兴,厌恶五大类情感分类结果中的一项;利用训练好的长短期记忆网络lstm模型和所述输入文本,得到所述输入文本的至少一个模型回复文本,即利用训练好的lstm模型获取输入文本的候选回复集,该候选回复集包括至少一个模型回复文本;在所述模型回复文本中确定目标回复文本,其中,所述目标回复文本为所述至少一个模型回复文本中情感分类结果与所述输入文本的情感分类结果的相似度最高的模型回复文本,具体地,将候选回复集中的每个模型回复文本进行情感分类,得到每个模型回复文本的情感分类结果,将选回复集中,模型回复文本的情感分类结果与输入文本的情感分类结果的相似度最高的模型回复文本作为目标回复文本;根据所述输入文本对应的输入用户的注册位置信息和预先创建的位置语气助词库,得到所述输入文本对应的语气助词,其中,位置语气助词库是根据位置信息创建的,根据输入用户的注册位置信息在位置语气助词库选择合适的语气助词,比如北方省份的注册位置信息就选择具有北方特色的语气助词,南方省份的注册位置信息就选择柔和一点的语气助词,中部省份的注册位置信息则选择中庸一点的语气助词;根据所述目标回复文本和所述语气助词,得到所述输入文本的回复文本,具体地,将语气助词添加到上述的回复文本上,这样具有特色的回复,更能提升用户的好感度。
60.本发明实施例,由于采用了区域位置判断结合情感分类的方式,根据区域位置来选择对应情感类别语气助词库中的语气助词添加到选定的回复上,可以使得回复更具特色,进而产生有温度的用户体验的技术效果。
61.需要说明的是,上述对输入文本进行情感分类的模型和模型回复文本的生成模型均是lstm模型,但是训练目标和训练集不同,得到lstm模型是两个不同的输出模型。其中,模型回复文本的生成模型的训练集是中文维基语料库,训练目标是回复消息的语言模型,会获得一组候选的回复集,对输入文本进行情感分类的模型的训练集为中国计算机学会(china computer federation,ccf)自然语言处理与中文计算会议中的情感分析测评数据训练目标是情感分类结果。
62.下面结合图3,具体说明本发明实施例提供的回复文本生成方法的整体流程:获取输入文本,对输入文本进行文本分类,即根据输入文本中的关键词确定输入
文本的文本类型,具体包括含有敏感词的输入文本、含有操作手册专业词的输入文本、含有营销活动词的输入文本和其他(即不含有上述关键词的输入文本),针对含有敏感词的输入文本,以预设回复文本作为该类型的输入文本的安全回复(即作为回复文本);针对含有操作手册专业词的输入文本,对输入文本的输入用户进行用户分类,确定输入用户是新用户还是老用户,在输入用户是老用户的情况下,根据输入文本中的操作手册专业词、输入文本中的问题词汇和上述第二目标关系,得到回复文本,在输入用户是老用户的情况下,根据输入文本中的操作手册专业词、输入文本中的问题词汇和上述第一目标关系,得到回复文本,并在该回复文本的基础上添加语气助词,得到最终的回复文本,其中,第一目标关系是对预设的操作手册中的问题语句进行关键词提取,得到操作手册专业词和问题词汇,并根据操作手册专业词、问题词汇和问题语句对应的回复文本得到的,所述第二目标关系是对问题语句对应的回复文本进行精简处理,得到第二目标关系中的回复文本,并根据操作手册专业词、问题词汇和第二目标关系中的回复文本得到的;针对含有营销活动词的输入文本,根据输入文本对应的输入用户的用户信息进行用户信息匹配,并根据营销活动词、输入用户的用户信息和预先创建的营销活动列表信息,得到回复文本,给回复文本添加积极、高兴的语气助词,得到最终的回复文本;针对其他输入文本,对输入文本进行情感分类(情感识别),得到输入文本的情感分类结果,利用训练好的lstm模型和输入文本,得到输入文本的至少一个模型回复文本,对至少一个模型回复文本进行情感分类(情感识别),确定至少一个模型回复文本中情感分类结果与输入文本的情感分类结果的相似度最高的模型回复文本为目标回复文本,对输入文本的输入用户进行地理区域分类,即确定根据输入文本对应的输入用户的注册位置信息,根据输入文本对应的输入用户的注册位置信息和预先创建的位置语气助词库,得到输入文本对应的语气助词,给目标回复文本添加语气助词得到回复文本。
63.通过上述流程得到输入文本的智能回复。
64.本发明实施例,提高回复的人性化和准确度,首先对输入文本进行分类的步骤,可以使含有敏感词文本,和含有操作手册关键词文本两类的回复更加准确,对于含有活动营销优惠等关键词文本,根据用户信息的进行精准匹配,加上高兴语气助词,使回复既精准又生动,其次分别在对含有操作手册关键词文本和其他文本处理时都加入了情感因素和地理因素,帮助程序更好的进行语义理解和判断。
65.本实施例充分运用了情感因素,地域因素,用户类型因素等,让回复更加友好,提升用户体验。
66.如图4所示,本发明实施例提供一种回复文本生成装置,所述装置包括:确定模块401,用于根据输入文本中的关键词确定所述输入文本的文本类型;所述文本类型为含有目标类型关键词的文本或不含有目标类型关键词的文本;目标类型关键词包括以下至少一项:敏感词;操作手册专业词;营销活动词;生成模块402,用于根据所述输入文本的文本类型,生成所述输入文本的回复文本。
67.可选地,所述生成模块402包括:第一生成单元;在所述文本类型为含有目标类型关键词的文本的情况下,所述第一生成单元,用于以下至少一项:
若所述目标类型关键词包括敏感词,将预设回复文本作为所述输入文本的回复文本;若所述目标类型关键词包括操作手册专业词,根据所述输入文本对应的输入用户的用户类型、所述输入文本中的操作手册专业词、所述输入文本中的问题词汇和预先创建的目标关系,得到所述输入文本的回复文本;其中,所述目标关系用于指示操作手册关键词、问题词汇与回复文本之间的对应关系;不同的用户类型的输入用户对应不同的目标关系;若所述目标类型关键词包括营销活动词,根据所述输入文本中的营销活动词、所述输入文本对应的输入用户的用户信息和预先创建的营销活动列表信息,得到所述输入文本的回复文本;其中,所述输入文本对应的输入用户的用户信息包括所述输入文本对应的输入用户的用户类型和/或所述输入文本对应的输入用户的注册位置信息;所述营销活动列表信息包括以下至少一项:营销活动名称;营销活动适用用户的用户类型;营销活动位置;活动起始时间;活动结束时间;活动规则。
68.可选地,所述输入用户的用户类型包括第一类型和第二类型,所述第一类型的输入用户的注册时长小于预设时长,所述第二类型的输入用户的注册时长大于或等于预设时长;所述目标关系包括第一目标关系和第二目标关系;所述第一类型的输入用户对应所述第一目标关系,所述第二类型的输入用户对应所述第二目标关系;所述第二目标关系中的回复文本是对所述第一目标关系中的回复文本进行精简处理得到的。
69.可选地,所述第一生成单元具体用于:在所述输入用户的用户类型为所述第一类型的情况下,获取所述输入文本对应的语气助词;根据所述语气助词、所述输入文本中的操作手册专业词、所述输入文本中的问题词汇、所述第一目标关系,得到所述输入文本的回复文本。
70.可选地,所述第一生成单元具体用于以下至少一项:对所述输入文本进行情感分类,得到所述输入文本的情感分类结果,并根据所述情感分类结果和预先创建的情感语气助词库,得到所述输入文本对应的语气助词;根据所述输入文本对应的输入用户的注册位置信息和预先创建的位置语气助词库,得到所述输入文本对应的语气助词。
71.可选地,所述生成模块402还包括:第一处理单元,用于对预设的操作手册中的问题语句进行关键词提取,得到操作手册专业词和问题词汇;第二处理单元,用于根据所述操作手册专业词、所述问题词汇和所述问题语句对应的回复文本,得到所述第一目标关系;第三处理单元,用于对所述问题语句对应的回复文本进行精简处理,得到所述第二目标关系中的回复文本;根据所述操作手册专业词、所述问题词汇和所述第二目标关系中的回复文本,得
到所述第二目标关系。
72.可选地,所述生成模块402包括:第二处理单元;在所述文本类型为不含有目标类型关键词的文本的情况下,所述第二处理单元用于:对所述输入文本进行情感分类,得到所述输入文本的情感分类结果;利用训练好的长短期记忆网络lstm模型和所述输入文本,得到所述输入文本的至少一个模型回复文本;在所述模型回复文本中确定目标回复文本;其中,所述目标回复文本为所述至少一个模型回复文本中情感分类结果与所述输入文本的情感分类结果的相似度最高的模型回复文本;根据所述输入文本对应的输入用户的注册位置信息和预先创建的位置语气助词库,得到所述输入文本对应的语气助词;根据所述目标回复文本和所述语气助词,得到所述输入文本的回复文本。
73.需要说明的是,本发明实施例提供的回复文本生成装置,是能够执行上述的回复文本生成方法的装置,则上述的回复文本生成方法的所有实施例均适用于该装置,且能够达到相同或者相似的技术效果。
74.如图5所示,本发明实施例还提供一种回复文本生成设备,包括:处理器501;以及通过总线接口502与所述处理器501相连接的存储器503,所述存储器503用于存储所述处理器501在执行操作时所使用的程序和数据,所述处理器501调用并执行所述存储器503中所存储的程序和数据。
75.其中,所述收发机504与所述总线接口502连接,用于在所述处理器501的控制下接收和发送数据,具体地,所述处理器501用于读取所述存储器503中的程序,所述处理器501执行下列过程:根据输入文本中的关键词确定所述输入文本的文本类型;所述文本类型为含有目标类型关键词的文本或不含有目标类型关键词的文本;目标类型关键词包括以下至少一项:敏感词;操作手册专业词;营销活动词;根据所述输入文本的文本类型,生成所述输入文本的回复文本。
76.可选地,在所述文本类型为含有目标类型关键词的文本的情况下,所述处理器501用于以下至少一项:若所述目标类型关键词包括敏感词,将预设回复文本作为所述输入文本的回复文本;若所述目标类型关键词包括操作手册专业词,根据所述输入文本对应的输入用户的用户类型、所述输入文本中的操作手册专业词、所述输入文本中的问题词汇和预先创建的目标关系,得到所述输入文本的回复文本;其中,所述目标关系用于指示操作手册关键词、问题词汇与回复文本之间的对应关系;不同的用户类型的输入用户对应不同的目标关系;若所述目标类型关键词包括营销活动词,根据所述输入文本中的营销活动词、所述输入文本对应的输入用户的用户信息和预先创建的营销活动列表信息,得到所述输入文本的回复文本;其中,所述输入文本对应的输入用户的用户信息包括所述输入文本对应的
输入用户的用户类型和/或所述输入文本对应的输入用户的注册位置信息;所述营销活动列表信息包括以下至少一项:营销活动名称;营销活动适用用户的用户类型;营销活动位置;活动起始时间;活动结束时间;活动规则。
77.可选地,所述输入用户的用户类型包括第一类型和第二类型,所述第一类型的输入用户的注册时长小于预设时长,所述第二类型的输入用户的注册时长大于或等于预设时长;所述目标关系包括第一目标关系和第二目标关系;所述第一类型的输入用户对应所述第一目标关系,所述第二类型的输入用户对应所述第二目标关系;所述第二目标关系中的回复文本是对所述第一目标关系中的回复文本进行精简处理得到的。
78.可选地,所述处理器501具体用于:在所述输入用户的用户类型为所述第一类型的情况下,获取所述输入文本对应的语气助词;根据所述语气助词、所述输入文本中的操作手册专业词、所述输入文本中的问题词汇、所述第一目标关系,得到所述输入文本的回复文本。
79.可选地,所述处理器501具体用于以下至少一项:对所述输入文本进行情感分类,得到所述输入文本的情感分类结果,并根据所述情感分类结果和预先创建的情感语气助词库,得到所述输入文本对应的语气助词;根据所述输入文本对应的输入用户的注册位置信息和预先创建的位置语气助词库,得到所述输入文本对应的语气助词。
80.可选地,所述处理器501还用于:对预设的操作手册中的问题语句进行关键词提取,得到操作手册专业词和问题词汇;根据所述操作手册专业词、所述问题词汇和所述问题语句对应的回复文本,得到所述第一目标关系;对所述问题语句对应的回复文本进行精简处理,得到所述第二目标关系中的回复文本;根据所述操作手册专业词、所述问题词汇和所述第二目标关系中的回复文本,得到所述第二目标关系。
81.可选地,在所述文本类型为不含有目标类型关键词的文本的情况下,所述处理器501还用于:对所述输入文本进行情感分类,得到所述输入文本的情感分类结果;利用训练好的长短期记忆网络lstm模型和所述输入文本,得到所述输入文本的至少一个模型回复文本;在所述模型回复文本中确定目标回复文本;其中,所述目标回复文本为所述至少一个模型回复文本中情感分类结果与所述输入文本的情感分类结果的相似度最高的模型回复文本;根据所述输入文本对应的输入用户的注册位置信息和预先创建的位置语气助词
库,得到所述输入文本对应的语气助词;根据所述目标回复文本和所述语气助词,得到所述输入文本的回复文本。
82.其中,在图5中,总线架构可以包括任意数量的互联的总线和桥,具体由处理器501代表的一个或多个处理器和存储器503代表的存储器的各种电路链接在一起。总线架构还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路链接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口提供用户接口505。收发机504可以是多个元件,即包括发送机和接收机,提供用于在传输介质上与各种其他装置通信的单元。处理器501负责管理总线架构和通常的处理,存储器503可以存储处理器501在执行操作时所使用的数据。
83.另外,本发明具体实施例还提供一种计算机可读存储介质,其上存储有计算机程序,其中,该程序被处理器执行时实现如上中任一项所述的回复文本生成方法中的步骤。
84.在本技术所提供的几个实施例中,应该理解到,所揭露方法和装置,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
85.另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理包括,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
86.上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括用若干指令使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述收发方法的部分步骤。而前述的存储介质包括:u 盘、移动硬盘、只读存储器(read-only memory,简称rom)、随机存取存储器(random access memory,简称ram)、磁碟或者光盘等各种可以存储程序代码的介质。
87.以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
技术特征:
1.一种回复文本生成方法,其特征在于,所述方法包括:根据输入文本中的关键词确定所述输入文本的文本类型;所述文本类型为含有目标类型关键词的文本或不含有目标类型关键词的文本;目标类型关键词包括以下至少一项:敏感词;操作手册专业词;营销活动词;根据所述输入文本的文本类型,生成所述输入文本的回复文本。2.根据权利要求1所述的回复文本生成方法,其特征在于,在所述文本类型为含有目标类型关键词的文本的情况下,根据所述输入文本的文本类型,生成所述输入文本的回复文本,包括以下至少一项:若所述目标类型关键词包括敏感词,将预设回复文本作为所述输入文本的回复文本;若所述目标类型关键词包括操作手册专业词,根据所述输入文本对应的输入用户的用户类型、所述输入文本中的操作手册专业词、所述输入文本中的问题词汇和预先创建的目标关系,得到所述输入文本的回复文本;其中,所述目标关系用于指示操作手册关键词、问题词汇与回复文本之间的对应关系;不同的用户类型的输入用户对应不同的目标关系;若所述目标类型关键词包括营销活动词,根据所述输入文本中的营销活动词、所述输入文本对应的输入用户的用户信息和预先创建的营销活动列表信息,得到所述输入文本的回复文本;其中,所述输入文本对应的输入用户的用户信息包括所述输入文本对应的输入用户的用户类型和/或所述输入文本对应的输入用户的注册位置信息;所述营销活动列表信息包括以下至少一项:营销活动名称;营销活动适用用户的用户类型;营销活动位置;活动起始时间;活动结束时间;活动规则。3.根据权利要求2所述的回复文本生成方法,其特征在于,所述输入用户的用户类型包括第一类型和第二类型,所述第一类型的输入用户的注册时长小于预设时长,所述第二类型的输入用户的注册时长大于或等于预设时长;所述目标关系包括第一目标关系和第二目标关系;所述第一类型的输入用户对应所述第一目标关系,所述第二类型的输入用户对应所述第二目标关系;所述第二目标关系中的回复文本是对所述第一目标关系中的回复文本进行精简处理得到的。4.根据权利要求3所述的回复文本生成方法,其特征在于,根据所述输入文本对应的输入用户的用户类型、所述输入文本中的操作手册专业词、所述输入文本中的问题词汇和预先创建的目标关系,得到所述输入文本的回复文本,包括:在所述输入用户的用户类型为所述第一类型的情况下,获取所述输入文本对应的语气助词;根据所述语气助词、所述输入文本中的操作手册专业词、所述输入文本中的问题词汇、所述第一目标关系,得到所述输入文本的回复文本。5.根据权利要求4所述的回复文本生成方法,其特征在于,获取所述输入文本对应的语气助词,包括以下至少一项:对所述输入文本进行情感分类,得到所述输入文本的情感分类结果,并根据所述情感分类结果和预先创建的情感语气助词库,得到所述输入文本对应的语气助词;根据所述输入文本对应的输入用户的注册位置信息和预先创建的位置语气助词库,得
到所述输入文本对应的语气助词。6.根据权利要求3所述的回复文本生成方法,其特征在于,所述方法还包括:对预设的操作手册中的问题语句进行关键词提取,得到操作手册专业词和问题词汇;根据所述操作手册专业词、所述问题词汇和所述问题语句对应的回复文本,得到所述第一目标关系;对所述问题语句对应的回复文本进行精简处理,得到所述第二目标关系中的回复文本;根据所述操作手册专业词、所述问题词汇和所述第二目标关系中的回复文本,得到所述第二目标关系。7.根据权利要求1所述的回复文本生成方法,其特征在于,在所述文本类型为不含有目标类型关键词的文本的情况下,根据所述输入文本的文本类型,生成所述输入文本的回复文本,包括:对所述输入文本进行情感分类,得到所述输入文本的情感分类结果;利用训练好的长短期记忆网络lstm模型和所述输入文本,得到所述输入文本的至少一个模型回复文本;在所述模型回复文本中确定目标回复文本;其中,所述目标回复文本为所述至少一个模型回复文本中情感分类结果与所述输入文本的情感分类结果的相似度最高的模型回复文本;根据所述输入文本对应的输入用户的注册位置信息和预先创建的位置语气助词库,得到所述输入文本对应的语气助词;根据所述目标回复文本和所述语气助词,得到所述输入文本的回复文本。8.一种回复文本生成装置,其特征在于,所述装置包括:确定模块,用于根据输入文本中的关键词确定所述输入文本的文本类型;所述文本类型为含有目标类型关键词的文本或不含有目标类型关键词的文本;目标类型关键词包括以下至少一项:敏感词;操作手册专业词;营销活动词;生成模块,用于根据所述输入文本的文本类型,生成所述输入文本的回复文本。9.一种回复文本生成设备,包括:收发器、处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令;其特征在于,所述处理器执行所述程序或指令时实现如权利要求1至7中任一项所述的回复文本生成方法中的步骤。10.一种可读存储介质,其上存储有程序或指令,其特征在于,所述程序或指令被处理器执行时实现如权利要求1至7中任一项所述的回复文本生成方法中的步骤。
技术总结
本发明提供了一种回复文本生成方法、装置、设备和可读存储介质,涉及计算机技术领域,所述回复文本生成方法,包括:根据输入文本中的关键词确定所述输入文本的文本类型;所述文本类型为含有目标类型关键词的文本或不含有目标类型关键词的文本;目标类型关键词包括以下至少一项:敏感词;操作手册专业词;营销活动词;根据所述输入文本的文本类型,生成所述输入文本的回复文本。本发明方案,可以丰富文本输入的处理信息,以及丰富回复结果。以及丰富回复结果。以及丰富回复结果。
技术研发人员:姜雪婷
受保护的技术使用者:中国移动通信集团有限公司
技术研发日:2023.08.15
技术公布日:2023/9/14
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
