一种基于情绪策略匹配的情感支持人机对话方法及系统

未命名 07-15 阅读：163 评论：0

1.本发明涉及自然语言处理和深度学习技术领域，尤其涉及一种基于情绪策略匹配的情感支持人机对话方法及系统。

背景技术：

2.本部分的陈述仅仅是提供了与本公开相关的背景技术信息，不必然构成在先技术。
3.自疫情在全球爆发之后，各国经济均受到严重创伤，许多企业被迫停工甚至面临破产，突如其来的变化使越来越多的人面临着情绪方面的困扰，亟需情感方面的支持。然而，专业的精神卫生服务却十分稀缺。为了解决供需不平衡的问题，搭建情感支持对话机器人成为日益受关注的研究方向。
4.所谓情感支持是指感知他人的感受，在自己的位置上思考并做出正确的反应，情感支持对话机器人也被称为情绪感知对话系统，其要求机器理解人类用户的情绪困扰，并通过提供共情回复和疏导建议给予人类用户情感陪伴。情感支持对话机器人具有广泛的应用场景，其赋予机器同理心能力，具体应用包括自动心理治疗师、智能客户服务、移情对话代理等。
5.早期情绪感知对话系统的工作目标是情绪聊天，其依赖于用户的情绪信号。随着机器学习的进一步发展，研究人员将注意力转向激发用户的特定情绪，最近的研究开始整合额外的信息来进行更深入的情感理解和移情反应。然而，现有的情绪聊天工作仅对人机对话的上下文进行粗粒度和静态处理，而情绪是复杂的，用户的情绪强度会在对话的发展过程中发生变化，因此，有必要挖掘对话用户动态的精神状态，保障人机对话的过程中机器始终满足用户当前的情绪需求；其次，大多数移情聊天机器人通常仅根据预测的粗粒度情感类别做出情感反应，而不考虑如何解决人机对话用户的情感问题，即缺乏情感支持对话，无法帮助用户克服其所面临的情绪困扰与挑战。

技术实现要素：

6.为解决上述现有技术的不足，本发明提供了一种基于情绪策略匹配的情感支持人机对话方法及系统，通过预定义的情景信息训练情感分类网络，利用该情感分类网络捕捉人机对话过程中用户的动态情绪，通过情绪策略匹配网络根据用户的动态情绪生成与当前语境相关程度最高的策略目标回复，再通过对话生成网络进行对话回复，该生成的回复能够理解用户当前的诉求，并对用户的不良情绪给予引导，实现对用户的情感支持。
7.第一方面，本公开提供了一种基于情绪策略匹配的情感支持人机对话方法。
8.一种基于情绪策略匹配的情感支持人机对话方法，包括：
9.获取人机对话过程中的对话上下文信息和对话语境情景信息，利用情感分类网络动态捕捉用户当前情绪状态；
10.根据用户当前情绪状态、历史对话上下文信息和候选策略目标回复，利用情绪策
略匹配网络匹配输出与当前语境最相关的策略目标回复；
11.基于输出的策略目标回复，通过对话生成网络生成个性化回复，进行人机对话回复。
12.进一步的技术方案，所述情感分类网络以预训练模型gpt作为情感分类的基础模型，利用人机对话过程中的对话上下文信息、对话语境情景信息以及标注的情绪标签训练该预训练模型gpt，通过训练完成的情感分类网络捕捉与对话相关的用户当前情绪状态信息，计算过程为：
13.e＝gpt(s，c)
14.其中，s＝{s1，s2...sk}表示对话语境情景信息，c＝{c1，c2...cn}表示对话上下文信息，e表示情绪标签。
15.进一步的技术方案，所述情绪策略匹配网络包括表示层、匹配层和聚合层，所述表示层用于提取历史响应和候选策略目标回复的多粒度语义表示，所述匹配层用于在每个语义层次上进行匹配，所述聚合层用于动态融合候选响应与所有历史响应之间的匹配信号。
16.进一步的技术方案，所述表示层中，通过候选策略目标回复r获得多粒度上下文表示e＝{e0，...，en}和交叉注意表示包括：
17.通过查找单词嵌入表初始化单词表示，将单词表示嵌入到注意模块中，获得深度上下文表示e
l
：
18.e
l
＝fatt(e
l-1
，e
l-1
，e
l-1
)，1≤l≤n
19.其中，e
l
是第l个注意模块输出的上下文表示；
20.将响应的上下文表示e
l
及其对应的情绪状态信息q嵌入到注意模块中，获得交叉注意表示为：
[0021][0022]
进一步的技术方案，所述匹配层中，根据候选响应r和第j个对话历史hj，计算得到上下文表示的匹配矩阵ms。
[0023]
进一步的技术方案，所述聚合层中，通过cnn神经网络从匹配矩阵中提取匹配特征，再将提取的特征线性映射到低维度，输出提取的低维度特征。
[0024]
进一步的技术方案，所述对话生成网络采用预训练的语言模型dialogpt作为初始化模型，采用最大似然估计预测回复序列中的下个单词，其损失函数为：
[0025][0026]
其中，p
θ
为对话生成网络的参数，表示第n轮中的第t个词的向量表示，wa为用户a的角色情感信息，表示用户a的角色情感信息中与当前语境相关程度最高的情感信息，表示用户a的对话历史信息，表示第n轮对话中第t个词之前词的向量表示。
[0027]
第二方面，本公开提供了一种基于情绪策略匹配的情感支持人机对话系统，包括：
[0028]
用户情绪捕捉模块，用于获取人机对话过程中的对话上下文信息和对话语境情景信息，利用情感分类网络动态捕捉用户当前情绪状态；
[0029]
策略目标回复匹配模块，用于根据用户当前情绪状态、历史对话上下文信息和候选策略目标回复，利用情绪策略匹配网络匹配输出与当前语境最相关的策略目标回复；
[0030]
回复生成模块，用于基于输出的策略目标回复，通过对话生成网络生成个性化回复，进行人机对话回复。
[0031]
第三方面，本公开还提供了一种电子设备，包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令，所述计算机指令被处理器运行时，完成第一方面所述方法的步骤。
[0032]
第四方面，本公开还提供了一种计算机可读存储介质，用于存储计算机指令，所述计算机指令被处理器执行时，完成第一方面所述方法的步骤。
[0033]
以上一个或多个技术方案存在以下有益效果：
[0034]
1、本发明提供了一种基于情绪策略匹配的情感支持人机对话方法及系统，将用户的对话上下文信息和对话语境情景信息输入到情感分类网络中动态捕捉到用户当前细粒度的情感隐藏状态，再将情感隐藏状态、对话上下文信息和带有情绪标签的目标回复输入至情绪策略匹配网络中，匹配得到最相关的对话信息，并将该信息融入到对话生成中，使得后续生成的回复能够对用户的需求进行情感支持。
[0035]
2、本发明通过将情绪策略匹配网络中预测获取的与当前对话相关程度最高的信息融入到对话生成部分，使其生成的回复能理解用户的诉求，并对用户的不良情绪给与引导。
附图说明
[0036]
构成本发明的一部分的说明书附图用来提供对本发明的进一步理解，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。
[0037]
图1为本发明实施例所述基于情绪策略匹配的情感支持人机对话方法的整体流程图；
[0038]
图2为本发明实施例所述基于情绪策略匹配的情感支持人机对话方法的流程框图。
具体实施方式
[0039]
应该指出，以下详细说明都是示例性的，旨在对本发明提供进一步的说明。除非另有指明，本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
[0040]
需要注意的是，这里所使用的术语仅是为了描述具体实施方式，而非意图限制根据本发明的示例性实施方式。如在这里所使用的，除非上下文另外明确指出，否则单数形式也意图包括复数形式，此外，还应当理解的是，当在本说明书中使用术语“包含”和/或“包括”时，其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
[0041]
实施例一
[0042]
为了使人机对话过程中机器回复能够始终满足用户当前的情绪需求，并且机器回复能够解决人机对话用户的情感问题，对用户进行情感支持，本实施例提供了一种基于情绪策略匹配的情感支持人机对话方法，如图1所示，具体包括以下步骤：
[0043]
步骤s1、获取人机对话过程中的对话上下文信息和对话语境情景信息，利用情感分类网络动态捕捉用户当前情绪状态；
[0044]
步骤s2、根据用户当前情绪状态、历史对话上下文信息和候选策略目标回复，利用情绪策略匹配网络匹配输出与当前语境最相关的策略目标回复；
[0045]
步骤s3、基于输出的策略目标回复，通过对话生成网络生成个性化回复，进行人机对话回复。
[0046]
在本实施例中，根据人机对话过程中的对话上下文信息和对话语境情景信息，利用情感支持模型输出与当前语境最相关的个性化策略目标回复，在满足对话用户当前情绪需求的同时，能够对对话用户进行情感支持。其中，如图2所示，该情感支持模型具体包括情感分类网络、情绪策略匹配网络和对话生成网络。
[0047]
(一)情感分类网络
[0048]
为了在对话生成的过程中更好地动态捕捉用户的情绪特征，进一步了解用户的心理状态，在对话开始之前先将角色信息输入到情感分类网络进行记忆，为了尽量减少记忆角色信息过程中的误差，记忆的过程采用多跳注意力的思想，多次计算角色信息的注意力。在本实施例中，采用两个变量来描述角色信息的记忆过程，即对话上下文信息c＝{c1，c2…cn
}、对话语境情景信息s＝{s1，s2...sk}和情绪标签e。为了能动态捕捉到用户细粒度的情感状态，训练一个情感分类网略，其计算过程为：
[0049]
e＝gpt(s，c)
[0050]
即以预训练模型gpt作为情感分类的基础模型，利用人机对话过程中的对话上下文信息和对话语境情景信息以及标注的情绪标签训练该预训练模型gpt，通过该训练完成的情感分类网络捕捉与对话相关的用户当前情绪状态信息q(即情绪标签e)，以此更好地理解用户的当前情况。gpt预训练模型使用transformer作为特征抽取器，并使用单向的语言模型。gpt模型所使用的transformer的特征抽取能力远远强于lstm，因此能够实现更好地效果。
[0051]
(二)情绪策略匹配网络
[0052]
为了使人机对话的过程中机器能够依据用户当前的情绪状态和对话历史使用最合适的策略连贯地输出回复，本实施例中搭建了一个情绪策略匹配网络，通过用户在对话过程中自行选择最适当的情感支持策略，结合对话上下文信息，进行策略匹配学习，学习后的情绪策略匹配网络能够根据人机对话历史上下文信息匹配最优情绪策略，即输出与当前语境最相关的策略目标回复。
[0053]
优选的，用户在对话过程中可自行选择多个情感支持策略，情绪策略匹配网络结合历史对话上下文信息学习上述策略匹配过程，学习输出与当前语境最相关的多个情绪策略，即输出多个策略目标回复。
[0054]
在本实施例中，包括7种不同的情感支持策略，并定义了每一情感支持策略的具体内容，其分别为：
[0055]
(1)提问；指通过疑问的方式询问用户的感受或是遇到的困难。
[0056]
(2)重述/转述；对用户讲述内容简化，进行更简洁的重述，能够帮助用户更清楚地看到自身的情况。
[0057]
(3)感受的回复；清晰地表达和描述用户的感受。
[0058]
(4)自我披露；用相似的经历或与用户分享的情感来表达同理心。
[0059]
(5)确认和保证；肯定用户的优势、动力和能力，并提供安慰和鼓励。
[0060]
(6)提供建议；提供关于如何改变的建议，注意不越界，告诉用户在这一情况下通常该怎么做。
[0061]
(7)信息；为用户提供有用的信息，例如提供数据、事实、意见、资源或回答问题。
[0062]
(8)其他；沟通使用其他不属于上述类别的情感支持策略。
[0063]
为了使人机对话过程中能够依据用户的情绪状态和对话历史使用正确的情感支持策略连贯地输出回复，本实施例提供了一个情绪策略匹配网络，能够依据用户的情感建模用户喜欢的说话风格，并提供情感帮助。
[0064]
具体的，给定对话历史h＝{(pj,rj)}、用户当前情绪状态信息q和候选策略目标回复r，情绪策略匹配网络的目的是得到一个风格匹配特征向量gs＝(q，r，h)，该特征向量度量候选策略目标回复r之间的风格一致性。情绪策略匹配网络包括表示层、匹配层和聚合层，通过这三层实现目标，其中：(1)表示层，用于提取n层历史响应rj和候选策略目标回复r的多粒度语义表示；(2)匹配层，用于在每个语义层次上进行匹配；(3)聚合层，用于动态融合候选响应与所有历史响应之间的匹配信号，获得gs＝(q，r，h)。
[0065]
(1)表示层的目的是通过候选策略目标回复r获得多粒度上下文表示e＝{e0，...，en}和交叉注意表示以第j个响应为例，上下文表示将rj的上下文语义模式从浅到深建模。具体来说，首先通过查找单词嵌入表(如word2vec)来初始化单词表示，然后通过将单词嵌入到注意模块中来获得深度上下文表示e
l
：
[0066]el
＝fatt(e
l-1
，e
l-1
，e
l-1
)，1≤l≤n
[0067]
其中，e
l
是第l个注意模块输出的上下文表示。
[0068]
通过n个注意模块得到描述不同粒度下单词共现模式的n+1表示。此外，考虑到回应风格也是基于用户当前的心理状态的，如对于用户高兴或者悲伤的回复应该是不同的，因此，将响应的上下文表示e
l
关注对应的情绪状态信息q，即将响应的上下文表示及其对应的情绪状态信息q嵌入到注意模块中，以获得交叉注意的特征向量
[0069][0070]
(2)匹配层的目的是获得一个样式匹配矩阵ms，该矩阵在多个粒度下测量候选响应与每个对话历史上下文的样式匹配度。具体来说，给定一个候选响应r和第j个对话历史hj，计算上下文表示的匹配矩阵ms：
[0071][0072][0073]
其中，d表示嵌入的维度。
[0074]
(3)聚合层的目的是通过cnn神经网络从匹配矩阵ms中提取匹配特征，并将提取的特征线性映射到一个较低的维度：
[0075]vs
＝f
cnn
(ms)
[0076]
通过上述情绪策略匹配网络的表示层、匹配层和聚合层，输出提取的低维度特征vs
，将该低维度特征vs输入对话生成网络的预训练模型，得到最终的文字回复。
[0077]
(三)对话生成网络
[0078]
在对话生成部分，将对话生成任务看成序列预测任务，采用预训练的语言模型dialogpt作为初始化模型，与gpt预训练模型一样，dialogpt被表述为一个自回归(ar)语言模型，并使用多层转换器作为模型体系结构。然而，与gpt预训练模型不同的是，dialogpt是在从数据集reddit中提取的大规模对话会话上进行训练的，采用最大似然估计预测回复序列中的下个单词，其损失函数为：
[0079][0080]
其中，p
θ
为对话生成网络的参数，表示第n轮中的第t个词的向量表示，wa为用户a的角色情感信息，表示用户a的角色情感信息中与当前语境相关程度最高的情感信息，表示对话者a的对话历史信息，表示第n轮对话中第t个词之前词的向量表示。
[0081]
基于上述损失函数，对对话生成网络的初始化模型进行迭代训练，直至训练完成。将通过上述情绪策略匹配网络输出的低维度特征vs输入该训练完成的对话生成网络，输出生成的文字回复。
[0082]
通过上述方案，将用户的对话上下文信息和对话语境情景信息输入到情感分类网络中动态捕捉到用户当前细粒度的情感隐藏状态，再将情感隐藏状态、对话上下文信息和带有情绪标签的目标回复输入至情绪策略匹配网络中，匹配得到最相关的对话信息，并将该信息融入到对话生成中，使得后续生成的回复能够对用户的需求进行情感支持。
[0083]
实施例二
[0084]
本实施例提供了一种基于情绪策略匹配的情感支持人机对话系统，包括：
[0085]
用户情绪捕捉模块，用于获取人机对话过程中的对话上下文信息和对话语境情景信息，利用情感分类网络动态捕捉用户当前情绪状态；
[0086]
策略目标回复匹配模块，用于根据用户当前情绪状态、历史对话上下文信息和候选策略目标回复，利用情绪策略匹配网络匹配输出与当前语境最相关的策略目标回复；
[0087]
回复生成模块，用于基于输出的策略目标回复，通过对话生成网络生成个性化回复，进行人机对话回复。
[0088]
实施例三
[0089]
本实施例提供了一种电子设备，包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令，所述计算机指令被处理器运行时，完成如上所述的基于情绪策略匹配的情感支持人机对话方法中的步骤。
[0090]
实施例四
[0091]
本实施例还提供了一种计算机可读存储介质，用于存储计算机指令，所述计算机指令被处理器执行时，完成如上所述的基于情绪策略匹配的情感支持人机对话方法中的步骤。
[0092]
以上实施例二至四中涉及的各步骤与方法实施例一相对应，具体实施方式可参见实施例一的相关说明部分。术语“计算机可读存储介质”应该理解为包括一个或多个指令集
的单个介质或多个介质；还应当被理解为包括任何介质，所述任何介质能够存储、编码或承载用于由处理器执行的指令集并使处理器执行本发明中的任一方法。
[0093]
本领域技术人员应该明白，上述本发明的各模块或各步骤可以用通用的计算机装置来实现，可选地，它们可以用计算装置可执行的程序代码来实现，从而，可以将它们存储在存储装置中由计算装置来执行，或者将它们分别制作成各个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。本发明不限制于任何特定的硬件和软件的结合。
[0094]
以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。
[0095]
上述虽然结合附图对本发明的具体实施方式进行了描述，但并非对本发明保护范围的限制，所属领域技术人员应该明白，在本发明的技术方案的基础上，本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。

技术特征：
1.一种基于情绪策略匹配的情感支持人机对话方法，其特征是，包括：获取人机对话过程中的对话上下文信息和对话语境情景信息，利用情感分类网络动态捕捉用户当前情绪状态；根据用户当前情绪状态、历史对话上下文信息和候选策略目标回复，利用情绪策略匹配网络匹配输出与当前语境最相关的策略目标回复；基于输出的策略目标回复，通过对话生成网络生成个性化回复，进行人机对话回复。2.如权利要求1所述的基于情绪策略匹配的情感支持人机对话方法，其特征是，所述情感分类网络以预训练模型gpt作为情感分类的基础模型，利用人机对话过程中的对话上下文信息、对话语境情景信息以及标注的情绪标签训练该预训练模型gpt，通过训练完成的情感分类网络捕捉与对话相关的用户当前情绪状态信息，计算过程为：e＝gpt(s，c)其中，s＝{s1，s2...s
k
}表示对话语境情景信息，c＝{c1，c2...c
n
}表示对话上下文信息，e表示情绪标签。3.如权利要求1所述的基于情绪策略匹配的情感支持人机对话方法，其特征是，所述情绪策略匹配网络包括表示层、匹配层和聚合层，所述表示层用于提取历史响应和候选策略目标回复的多粒度语义表示，所述匹配层用于在每个语义层次上进行匹配，所述聚合层用于动态融合候选响应与所有历史响应之间的匹配信号。4.如权利要求3所述的基于情绪策略匹配的情感支持人机对话方法，其特征是，所述表示层中，通过候选策略目标回复r获得多粒度上下文表示e＝{e0，...，e
n
}和交叉注意表示包括：通过查找单词嵌入表初始化单词表示，将单词表示嵌入到注意模块中，获得深度上下文表示e
l
，为：e
l
＝fatt(e
l-1
，e
l-1
，e
l-1
)，1≤l≤n其中，e
l
是第l个注意模块输出的上下文表示；将响应的上下文表示e
l
及其对应的情绪状态信息q嵌入到注意模块中，获得交叉注意表示为：5.如权利要求3所述的基于情绪策略匹配的情感支持人机对话方法，其特征是，所述匹配层中，根据候选响应r和第j个对话历史h
j
，计算得到上下文表示的匹配矩阵m
s
。6.如权利要求3所述的基于情绪策略匹配的情感支持人机对话方法，其特征是，所述聚合层中，通过cnn神经网络从匹配矩阵中提取匹配特征，再将提取的特征线性映射到低维度，输出提取的低维度特征。7.如权利要求1所述的基于情绪策略匹配的情感支持人机对话方法，其特征是，所述对话生成网络采用预训练的语言模型dialogpt作为初始化模型，采用最大似然估计预测回复序列中的下个单词，其损失函数为：
其中，p
θ
为对话生成网络的参数，表示第n轮中的第t个词的向量表示，w
a
为用户a的角色情感信息，表示用户a的角色情感信息中与当前语境相关程度最高的情感信息，表示用户a的对话历史信息，表示第n轮对话中第t个词之前词的向量表示。8.一种基于情绪策略匹配的情感支持人机对话系统，其特征是，包括：用户情绪捕捉模块，用于获取人机对话过程中的对话上下文信息和对话语境情景信息，利用情感分类网络动态捕捉用户当前情绪状态；策略目标回复匹配模块，用于根据用户当前情绪状态、历史对话上下文信息和候选策略目标回复，利用情绪策略匹配网络匹配输出与当前语境最相关的策略目标回复；回复生成模块，用于基于输出的策略目标回复，通过对话生成网络生成个性化回复，进行人机对话回复。9.一种电子设备，其特征是，包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令，所述计算机指令被处理器运行时，完成如权利要求1-7中任一项所述的一种基于情绪策略匹配的情感支持人机对话方法的步骤。10.一种计算机可读存储介质，其特征是，用于存储计算机指令，所述计算机指令被处理器执行时，完成如权利要求1-7中任一项所述的一种基于情绪策略匹配的情感支持人机对话方法的步骤。

技术总结
本发明公开了一种基于情绪策略匹配的情感支持人机对话方法及系统，该方法包括：获取人机对话过程中的对话上下文信息和对话语境情景信息，利用情感分类网络动态捕捉用户当前情绪状态；根据用户当前情绪状态、历史对话上下文信息和候选策略目标回复，利用情绪策略匹配网络匹配输出与当前语境最相关的策略目标回复；基于输出的策略目标回复，通过对话生成网络生成个性化回复，进行人机对话回复。本发明通过将情绪策略匹配网络中预测获取的与当前对话相关程度最高的信息融入到对话生成部分，使得生成的回复能够实现对用户需求的情感支持。支持。支持。

技术研发人员：朱振方李嘉欣王斌王光进刘培玉
受保护的技术使用者：山东师范大学
技术研发日：2023.04.04
技术公布日：2023/7/12

版权声明

本文仅代表作者观点，不代表航空之家立场。
本文系作者授权航家号发表，未经原创作者书面授权，任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时，须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的，航空之家将依法追究其法律责任。（航空之家官方QQ：2926969996）

飞行汽车 https://www.autovtol.com/

上一篇：斜撑结构及斜撑结构支撑方法与流程 下一篇：一种基于透视变换和深度学习的被盗树木匹配方法和系统

一种基于情绪策略匹配的情感支持人机对话方法及系统

版权声明

航空之家

相关推荐

文章排行

最近发表

标签列表

一种基于情绪策略匹配的情感支持人机对话方法及系统

版权声明

相关文章

航空之家

相关推荐

文章排行

最近发表

标签列表