基于多特征的语音情感识别方法、装置、设备及存储介质制造方法及图纸

技术编号：37242977 阅读：28 留言：0更新日期：2023-04-20 23:23

本申请实施例提供一种基于多特征的语音情感识别方法、装置、设备及存储介质，所述方法包括：获取携带情感信息的待识别语音；提取所述待识别语音中用于表征所述情感信息的情感特征；所述情感特征包括音质特征、韵律特征以及语音特征中的一种或多种；将所述情感特征输入已训练的语音识别模型，并获取所述语音识别模型输出的情感识别结果。如此，模型可以输出对待识别语音的情感识别结果，从而分析出用户说话时所表现出的情感，提高应用语音识别技术的智能化。的智能化。的智能化。

全部详细技术资料下载

【技术实现步骤摘要】
基于多特征的语音情感识别方法、装置、设备及存储介质

[0001]本申请涉及语音处理
，具体而言，涉及一种基于多特征的语音情感识别方法、装置、设备及存储介质。

技术介绍

[0002]自动语音识别技术(Automatic Speech Recognition，ASR)是一种将人的语音转换为文本的技术。随着计算机处理能力的提高，语音识别技术得到了飞速发展，被广泛应用于智能音响、语音命令、人机对话等领域中，日益提升人类的生活方式。在相关技术中，语音识别往往止步于将用户的语音转换为文本，而缺少对用户说话所表现出的情感进行分析，限制了语音识别进一步地智能化。

技术实现思路

[0003]本申请实施例的目的在于提供一种基于多特征的语音情感识别方法、装置、设备及存储介质，用以实现对语音进行情感识别的技术效果。
[0004]本申请实施例的第一方面提供了一种基于多特征的语音情感识别方法，所述方法包括：
[0005]获取携带情感信息的待识别语音；
[0006]提取所述待识别语音中用于表征所述情感信息的情...

【技术保护点】

【技术特征摘要】
1.一种基于多特征的语音情感识别方法，其特征在于，所述方法包括：获取携带情感信息的待识别语音；提取所述待识别语音中用于表征所述情感信息的情感特征；所述情感特征包括音质特征、韵律特征以及语音特征中的一种或多种；将所述情感特征输入已训练的语音识别模型，并获取所述语音识别模型输出的情感识别结果。2.根据权利要求1所述的方法，其特征在于，所述获取携带情感信息的待识别语音，包括：获取用户的原始语音；所述原始语音携带用户说话时的情感信息；提取所述原始语音中预设时间区域的语音片段作为所述待识别语音。3.根据权利要求1所述的方法，其特征在于，所述语音识别模型为分类模型；所述情感识别结果为情感种类；所述情感种类包括无情感、正面情感和负面情感。4.根据权利要求3所述的方法，其特征在于，所述方法还包括：若输出的情感识别结果为负面情感，执行安抚措施。5.根据权利要求1所述的方法，其特征在于，所述韵律特征包括语音时长、基频、短时能量、以及过零率中的一种或多种；所述音质特征包括共振峰的频率、带宽、频率微扰、以及振幅微扰中的一种或多种。6.一种基于多特征的语音情感识别装置，其特征在于，所述装置包括：获取模块，用于获取携带情感信息的待识别语音；提取模块，用于提取所述待识别语音中用于表征所述情感信息的情感特征；所述情感特征包括音质特征、韵...

【专利技术属性】
技术研发人员：汤志淼，曾文佳，李航，
申请(专利权)人：零犀北京科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人