语音情绪识别方法和装置制造方法及图纸

技术编号:37871001 阅读:13 留言:0更新日期:2023-06-15 21:00
本公开提供了一种语音情绪识别方法和装置,应用于用户端,所述方法包括:获取当前用户的语音信息;将所述语音信息上传至云端服务器,以令云端服务器对所述语音信息进行识别,确定对应的语音内容和情绪特征,进而确定对应的答复内容和答复情绪特征;接收所述云端服务器返回的答复内容和答复情绪特征;根据所述答复内容和所述答复情绪特征完成针对所述语音信息的答复。以此方式,能够对用户的语音内容和情绪进行识别,进而可以更人性化地与用户进行沟通交流。行沟通交流。行沟通交流。

【技术实现步骤摘要】
语音情绪识别方法和装置


[0001]本公开的实施例一般涉及语音识别
,并且更具体地,涉及一种语音情绪识别方法和装置。

技术介绍

[0002]情感计算是对于情感相关、来源于情感或者影响情感方面的计算,其目的是赋予智能机器感知,理解和表达各种情感状态的能力。情感识别是情感计算的关键内容,目前,情感计算主要以表情、姿态、语音、文本和生理信号为基础进行情感识别,其中语音信号,是情感信息表达的主要载体,且获取方便,越来越受到相关研究人员的重视。
[0003]现有语音情绪识别过程中,是直接基于语音片段进行语音比对,得到情绪预测结果,片段时长与说话人连续说话时长相关,但是,即使在一句话中,语音的情绪也是存在波动的,所以基于语音片段进行的情绪判断存在较大的误差,降低了语音情绪识别的准确性。

技术实现思路

[0004]根据本公开的实施例,提供了一种语音情绪识别方法和装置,来提高语音情绪识别的准确性。
[0005]在本公开的第一方面,提供了语音情绪识别方法,应用于用户端,包括:
[0006]获取当前用户的语音信息;
[0007]将所述语音信息上传至云端服务器,以令云端服务器对所述语音信息进行识别,确定对应的语音内容和情绪特征,进而确定对应的答复内容和答复情绪特征;
[0008]接收所述云端服务器返回的答复内容和答复情绪特征;
[0009]根据所述答复内容和所述答复情绪特征完成针对所述语音信息的答复。
[0010]在一些实施例中,所述云端服务器对所述语音信息进行识别,确定对应的语音内容和情绪特征,包括:
[0011]云端服务器对所述语音信息进行语义识别,确定对应的文字内容;
[0012]提取所述语音信息的语音情绪特征,将所述语音情绪特征输入到的预先训练的语音情绪识别模型,输出对应的语音情绪;
[0013]根据所述文字内容和所述语音情绪确定对应的语音内容和情绪特征。
[0014]在一些实施例中,所述语音情绪识别模型通过以下方式训练得到:
[0015]以预设数量的标注有对应情绪类别的语音信息为训练样本,语音信息为输入,情绪类别为输出,对神经网络模型进行训练;
[0016]响应于输出的情绪类别与标注的情绪类别的相似度小于预设阈值,对神经网络模型的参数进行调整;
[0017]重复上述过程,直到输出的情绪类别与标注的情绪类别的相似度大于预设阈值,完成对神经网络模型的训练,生成语音情绪识别模型。
[0018]在一些实施例中,还包括:
[0019]预先收集用户的语音信息;
[0020]确定所收集的语音信息对应的身份标识信息;
[0021]将收集的语音信息和对应的身份标识信息发送至云端服务器,以令云端服务器根据语音信息和对应的身份标识信息为不同的用户分别训练对应的语音情绪识别模型。
[0022]在一些实施例中,所述根据所述答复内容和所述答复情绪特征完成针对所述语音信息的答复,包括:
[0023]根据所述答复情绪特征确定对应的情绪,根据所述情绪和所述答复内容完成针对所述语音信息的答复。
[0024]在一些实施例中,所述用户端存储有离散情绪,对应唤醒度和愉悦度的数值程度值,以及对应的特征向量;
[0025]所述根据所述答复情绪特征确定对应的情绪,根据所述情绪和所述答复内容完成针对所述语音信息的答复,包括:
[0026]根据所述答复情绪特征与所述特征向量的相似度确定对应的离散情绪,根据所述离散情绪和所述答复内容完成针对所述语音信息的答复。
[0027]在一些实施例中,在所述获取当前用户的语音信息之后,所述方法还包括:
[0028]对所述语音信息进行去噪处理,并按照预设时长对去噪后的语音信息进行切分,生成标准输入语音信息。
[0029]在本公开的第二方面,提供了一种语音情绪识别装置,应用于用户端,包括:
[0030]语音信息获取模块,用于获取当前用户的语音信息;
[0031]语音识别模块,用于将所述语音信息上传至云端服务器,以令云端服务器对所述语音信息进行识别,确定对应的语音内容和情绪特征,进而确定对应的答复内容和答复情绪特征;
[0032]信息接收模块,用于接收所述云端服务器返回的答复内容和答复情绪特征;
[0033]语音答复模块,用于根据所述答复内容和所述答复情绪特征完成针对所述语音信息的答复。
[0034]在本公开的第三方面,提供了一种电子设备,包括存储器和处理器,所述存储器上存储有计算机程序,所述处理器执行所述程序时实现如以上所述的方法。
[0035]在本公开的第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如以上所述的方法。
[0036]通过本公开的语音情绪识别方法,能够对用户的语音内容和情绪进行识别,进而可以更人性化地与用户进行沟通交流。
[0037]
技术实现思路
部分中所描述的内容并非旨在限定本公开的实施例的关键或重要特征,亦非用于限制本公开的范围。本公开的其它特征将通过以下的描述变得容易理解。
附图说明
[0038]结合附图并参考以下详细说明,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。在附图中,相同或相似的附图标记表示相同或相似的元素,其中:
[0039]图1示出了本公开实施例一的语音情绪识别方法的流程图;
[0040]图2示出了本公开实施例二的语音情绪识别装置的结构示意图;
[0041]图3示出了用来实施本公开的实施例的电子设备的示意性框图。
具体实施方式
[0042]为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的全部其他实施例,都属于本公开保护的范围。
[0043]另外,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
[0044]本公开实施例的语音情绪识别方法,可以应用于智能终端。例如可以应用于智能机器人,或者集成在智能电视机等终端设备上。通过智能终端可以实现人性化地与用户交流,能够对用户的语音内容和情绪进行准确识别,从而提高用户体验。
[0045]具体地如图1所示,为本公开实施例一的语音情绪识别方法的流程图。本实施例的语音情绪识别方法,可以包括以下步骤:
[0046]S101:获取当前用户的语音信息。
[0047]在本实施例中,智能终端可以通过语音采集装置获取当前用户的语音信息,例如遥控器或者设置在智能机器人上的语音采集模块。智能终端可以通过唤起模式,例如本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.语音情绪识别方法,应用于用户端,其特征在于,包括:获取当前用户的语音信息;将所述语音信息上传至云端服务器,以令云端服务器对所述语音信息进行识别,确定对应的语音内容和情绪特征,进而确定对应的答复内容和答复情绪特征;接收所述云端服务器返回的答复内容和答复情绪特征;根据所述答复内容和所述答复情绪特征完成针对所述语音信息的答复。2.根据权利要求1所述的方法,其特征在于,所述云端服务器对所述语音信息进行识别,确定对应的语音内容和情绪特征,包括:云端服务器对所述语音信息进行语义识别,确定对应的文字内容;提取所述语音信息的语音情绪特征,将所述语音情绪特征输入到的预先训练的语音情绪识别模型,输出对应的语音情绪;根据所述文字内容和所述语音情绪确定对应的语音内容和情绪特征。3.根据权利要求2所述的方法,其特征在于,所述语音情绪识别模型通过以下方式训练得到:以预设数量的标注有对应情绪类别的语音信息为训练样本,语音信息为输入,情绪类别为输出,对神经网络模型进行训练;响应于输出的情绪类别与标注的情绪类别的相似度小于预设阈值,对神经网络模型的参数进行调整;重复上述过程,直到输出的情绪类别与标注的情绪类别的相似度大于预设阈值,完成对神经网络模型的训练,生成语音情绪识别模型。4.根据权利要求1所述的方法,其特征在于,还包括:预先收集用户的语音信息;确定所收集的语音信息对应的身份标识信息;将收集的语音信息和对应的身份标识信息发送至云端服务器,以令云端服务器根据语音信息和对应的身份标识信息为不同的用户分别训练对应的语音情绪识别模型。5.根据权利要求1所述的方法,其特征在于,所述根据所...

【专利技术属性】
技术研发人员:肖希哲
申请(专利权)人:乐融致新电子科技天津有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1