基于巴氏距离最优小波包分解的语音情感特征提取方法技术

技术编号：9008246 阅读：220 留言：0更新日期：2013-08-08 03:07

本发明专利技术涉及一种基于巴氏距离最优小波包分解的语音情感特征提取方法。所述方法包括面向情感分类问题的巴氏距离准则函数定义方法，最优小波包基构造方法，以及语音情感特征提取方法。该方法定义针对情感分类问题的巴氏距离准则函数用于最优小波包基的构造，在对语音信号进行最优小波包分解的基础上提取语音情感特征。本发明专利技术通过构建针对情感分类问题的小波包基对语音信号进行分析和特征提取，降低了说话人身份、语音内容等无关信息对情感识别准确度的影响，同时具有较低的计算复杂度。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术专利涉及一种语音情感特征提取方法，尤其涉及一种，属于语音情感识别

技术介绍
随着信息技术的快速发展和各种智能终端的兴起，现有的人机交互系统正面临日益严峻的考验。为了克服人机交互的障碍，使人机交互更为方便、自然，机器的情感智能正日益受到各领域研究者的重视。语音作为现今人机交互中极具发展潜力的高效交互媒介，携带着丰富的情感信息。语音情感识别作为情感智能的重要研究课题，在远程教学、辅助测谎、自动远程电话服务中心以及临床医学，智能玩具，智能手机等方面有着广阔的应用前景，吸引了越来越多研究机构与研究学者的广泛关注。为了提高语音情感识别的精度和鲁棒性，提取充分反映说话人情感状态的语音情感特征至关重要。从原始语音数据中提取有效的情感信息，剔除情感无关的说话人身份信息、说话内容信息等冗余信息是提高语音情感识别系统鲁棒性的重点和难点。作为一种新兴的信号时频分析技术，小波包分析因其在数字信号处理中的灵活性和有效性，越来越得到研究者的广泛重视。对于分类问题，建立反映类别可分性的准则函数用于构建最优小波包基，对信号进行相应的最优小波包分解，并保留最具类别区分性的信号...

【技术保护点】
一种基于巴氏距离最优小波包分解的语音情感特征提取方法，其特征在于，包括以下步骤：步骤1：接收情感语音片段输入；步骤2：将情感语音片段数字化以提供数字语音信号X；步骤3：对数字语音信号X进行预处理，得到有效语音帧集合；步骤4：构造巴氏距离最优小波包基；步骤5：利用步骤4构造的巴氏距离最优小波包基对有效语音帧进行小波包分解，得到各有效语音帧的小波包系数；步骤6：利用步骤5得到的有效语音帧小波包系数计算各有效语音帧的情感特征。

【技术特征摘要】

【专利技术属性】
技术研发人员：李悦，章国宝，黄永明，
申请(专利权)人：东南大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人