用于在人机对话中识别用户情绪的方法及装置制造方法及图纸

技术编号：33709671 阅读：21 留言：0更新日期：2022-06-06 08:39

本公开的实施例提供一种用于在人机对话中识别用户情绪的方法和装置。该方法包括：获取第一语音数据，其中，第一语音数据为用户在本轮的语音数据；从第一语音数据中提取表征情绪的第一音频特征和表征情绪的第一文本特征；获取第二文本特征和第二音频特征中的至少一个，其中，第二文本特征为用户在前N轮中的各轮中的文本特征的加权和，第二音频特征为用户在前N轮中的各轮中的音频特征的加权和，其中，N为正整数；将第一音频特征、第一文本特征、以及第二文本特征和第二音频特征中的至少一个拼接成拼接特征；以及通过经训练的多模态模型基于拼接特征来识别用户在本轮的第一情绪。于拼接特征来识别用户在本轮的第一情绪。于拼接特征来识别用户在本轮的第一情绪。

全部详细技术资料下载

【技术实现步骤摘要】
用于在人机对话中识别用户情绪的方法及装置

[0001]本公开的实施例涉及计算机
，具体地，涉及用于在人机对话中识别用户情绪的方法及装置。

技术介绍

[0002]在心理学上，可以将人的情绪分为喜悦、愤怒、悲伤、恐惧、厌恶、惊奇、羡慕等七大类型。当用户和机器人在做人机交互的时候，机器人可针对用户当前输入的文本数据，识别用户当前的情绪，以给出适合的互动内容。这样可以提高用户在人机交互过程中的体验。

技术实现思路

[0003]本文中描述的实施例提供了一种用于在人机对话中识别用户情绪的方法、装置以及存储有计算机程序的计算机可读存储介质。
[0004]根据本公开的第一方面，提供了一种用于在人机对话中识别用户情绪的方法。该方法包括：获取第一语音数据，其中，第一语音数据为用户在本轮的语音数据；从第一语音数据中提取表征情绪的第一音频特征和表征情绪的第一文本特征；获取第二文本特征和第二音频特征中的至少一个，其中，第二文本特征为用户在前N轮中的各轮中表征情绪的文本特征的加权和，第二音频特征为用户在前N轮中的各轮中表征情绪的音频特征的加权和，其中，N为正整数；将第一音频特征、第一文本特征、以及第二文本特征和第二音频特征中的至少一个拼接成拼接特征；以及通过经训练的多模态模型基于拼接特征来识别用户在本轮的第一情绪。
[0005]在本公开的一些实施例中，在第二文本特征中各个文本特征的权重按照时间顺序依次递增。
[0006]在本公开的一些实施例中，在第二音频特征中各个音频特征的权重按照时间顺序依次递增。...

【技术保护点】

【技术特征摘要】
1.一种用于在人机对话中识别用户情绪的方法，包括：获取第一语音数据，其中，所述第一语音数据为用户在本轮的语音数据；从所述第一语音数据中提取表征情绪的第一音频特征和表征情绪的第一文本特征；获取第二文本特征和第二音频特征中的至少一个，其中，所述第二文本特征为所述用户在前N轮中的各轮中表征情绪的文本特征的加权和，所述第二音频特征为所述用户在所述前N轮中的各轮中表征情绪的音频特征的加权和，其中，N为正整数；将所述第一音频特征、所述第一文本特征、以及所述第二文本特征和所述第二音频特征中的所述至少一个拼接成拼接特征；以及通过经训练的多模态模型基于所述拼接特征来识别所述用户在本轮的第一情绪。2.根据权利要求1所述的方法，其中，在所述第二文本特征中各个文本特征的权重按照时间顺序依次递增，和/或，在所述第二音频特征中各个音频特征的权重按照时间顺序依次递增。3.根据权利要求1所述的方法，还包括：获取第一视频数据，其中，所述第一视频数据包括所述用户在本轮的面部图像数据；从所述第一视频数据中提取表征情绪的第一图像特征；以及将所述第一图像特征拼接到所述拼接特征中。4.根据权利要求3所述的方法，还包括：获取第二图像特征，其中，所述第二图像特征为所述用户在所述前N轮中的各轮中表征情绪的图像特征的加权和；以及将所述第二图像特征拼接到所述拼接特征中。5.根据权利要求1至4中任一项所述的方法，还包括：获取第一生理特征数据，其中，所述第一生理特征数据为所述用户在本轮的生理特征数据；从所述第一生理特征数据中提取表征情绪的第一生理特征；以及将所述第一生理特征...

【专利技术属性】
技术研发人员：徐涛，
申请(专利权)人：浙江连信科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人