基于拼音韵母说话内容标准化语音情感特征选择方法技术

技术编号：12489384 阅读：180 留言：0更新日期：2015-12-11 04:01

本发明专利技术公开了一种基于拼音韵母说话内容标准化语音情感特征选择方法，包括语音片段轨迹模型建立，说话内容标准化，语音表达因素与特征表现相关性的量化以及语音情感选择。该方法在建立轨迹模型的基础上量化语音表达因素与特征表现相关性，从而选择语音情感特征。本发明专利技术通过构建针对情感分类问题的语音轨迹模型，量化语音表达中各个因素与特征表现相关性，利用说话内容标准化方法，降低了语音内容等无关信息对于语音特征表现的影响，选择出含有较多情感信息的语音特征，同时具有较低的计算复杂度。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种，尤其涉及一种基于语音轨迹模型的语音情感特征选择方法，属于语音情感识别

技术介绍
随着信息技术的快速发展和各种智能终端的兴起，现有的人机交互系统正面临日益严峻的考验。为了克服人机交互的障碍，使人机交互更为方便、自然，机器的情感智能正日益受到各领域研究者的重视。语音作为现今人机交互中极具发展潜力的高效交互媒介，携带着丰富的情感信息。语音情感识别作为情感智能的重要研究课题，在远程教学、辅助测谎、自动远程电话服务中心以及临床医学，智能玩具，智能手机等方面有着广阔的应用前景，吸引了越来越多研究机构与研究学者的广泛关注。为了提高语音情感识别的精度和鲁棒性，提取充分反映说话人情感状态的语音情感特征至关重要。从原始语音数据中提取有效的情感信息，剔除情感无关的说话内容信息等冗余信息是提高语音情感识别系统鲁棒性的重点和难点。作为一种新兴的语音分析技术，语音片段轨迹模型因其在语音信号处理中的灵活性和有效性，越来越得到研究者的广泛重视。对于分类问题，建立语音片段轨迹模型，量化语音表达因素与特征表现的相关性，进而对语音中说话内容进行标准化，降低了语音内容等无关信息对于语音特征表现的影响，选择出含有较多情感信息的语音特征。这种基于语音表达因素与特征表现的相关性特征提取思想和方法在语音情感识别研究中具有重要的意义。
技术实现思路
技术问题：本专利技术提供一种能够提高语音情感识别的鲁棒性，降低了语音内容等无关信息对于语音特征表现的影响，可以选择出含有较多情感信息语音特征的基于拼音韵母说话内容标准化语音情感特征...

【技术保护点】
一种基于拼音韵母说话内容标准化语音情感特征选择方法，其特征在于，该方法包括以下步骤：步骤1：对情感语音片段数字化后的数字语音信号X进行预处理，得到有效语音帧集合，对所述有效语音帧集合中每个语音片段X′提取一个D维的特征A，得到一个特征矩阵C：C=c1,1...c1,t...c1,Dc2,1...c2,t...c2,D...............cm,1...cm,t...cm,D...............cK,1...cK,t...cK,D=[C1...Ct...CD]---(1)]]>其中，K为有效语音帧帧长，A表示语音片段提取的特征，D表示特征A的维数，cm，t表示特征矩阵中一个元素，Ct表示特征矩阵中一个列向量，其中t为特征矩阵中列标，t＝1，2，...，D，m为特征矩阵中行标，m＝1，2，...，K；步骤2：把所述特征矩阵C转换为一个轨迹模型方程：C＝ZB+E，其中B表示轨迹参数矩阵，E表示残差向量矩阵，Z表示负责将语音片段的时间度量归一化的设计矩阵；然后构建行数为K，列数为轨迹模型展开阶次J加1的设计矩阵Z，其中元素v为设计矩阵行标，j为设计矩阵列标...

【技术特征摘要】

【专利技术属性】
技术研发人员：黄永明，吴奥，章国宝，
申请(专利权)人：东南大学，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人