一种基于声道滤波和声门激励的语音重构方法技术

技术编号：34763333 阅读：12 留言：0更新日期：2022-08-31 19:06

本发明专利技术涉及一种基于声道滤波和声门激励的语音重构方法，属于语言合成技术领域。本发明专利技术首先标记音频话音特征起止点，根据检测音频在频域下短时能量的平坦程度，标记音频中的有话段和无话段位置信息，供提取基音频率使用，再提取音频的基音频率，根据倒谱法将声脉冲倒谱和声道响应倒谱分离，提取出音频每一帧的基音频率，其次根据提取出的基音频率，构建模拟声脉的冲激响应，再在音频进行快速傅里叶变换和取对数谱之后，利用离散余弦变换恢复出倒谱数据，最终提取出能量集中的部分，作为模拟的声道响应，并作为重构语音的滤波器数据，最后利用提取出的声脉冲激响应和声道响应重构出语音。本发明专利技术在保证语音重构准确率的前提下提高了重构效率。高了重构效率。高了重构效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于声道滤波和声门激励的语音重构方法

[0001]本专利技术涉及一种基于声道滤波和声门激励的语音重构方法，属于语言合成

技术介绍

[0002]随着社会的不断进步，语音合成技术在人们的日常生活中应用广泛，其应用价值越来越受到重视。语音合成出的声音能否拟人化、情感化，影响着设备的人机交互体验。
[0003]语音合成技术主要可以分为三类：波形合成法、参数合成法和规则合成法。波形合成法主要是通过将所需合成的语音波形按照不同音素语音波形存储起来，需要时再从素材库中取出所需素材拼接合成后输出；参数合成法主要是提取出语音的参数，由参数变化合成出所需要的语音信号；规则合成法则是在系统中存储语音的声学参数、从音素组成音节、词句，控制音调、韵律、轻重等规则，合成出目标文字后，再利用规则将其转换成连续的声波。
[0004]参数合成法凭借素材语音库需求量小、提取参数方便、系统能适应的韵律特征范围较宽的优点，在近些年来发展迅速。但依然具有提取算法复杂，提取参数过多，合成出的语音情感平淡等缺点。
[0005]人类的语音发声是通过声门不断地张开与闭合，使声门处气流冲击声带产生振动，这些气流通过声道从而产生语音，在说话时声道也是在不断的变换中，因此能够听到不同的语音。本专利技术所提到的发声模型就是基于人的发音器官的特点和语音产生的原理，通过提取语音中说话人不同时刻的基音频率和声道参数特性，模拟发声中的声门激励和声道变化，重构出语音信号。

技术实现思路

[0006]本专利技术要解决的技术问题是提供...

【技术保护点】

【技术特征摘要】
1.一种基于声道滤波和声门激励的语音重构方法，其特征在于：Step1：标记音频话音特征起止点，根据检测音频在频域下短时能量的平坦程度，标记音频中的有话段和无话段位置信息，供提取基音频率使用；Step2：提取音频的基音频率，根据倒谱法将声脉冲倒谱和声道响应倒谱分离，提取出音频每一帧的基音频率；Step3：根据提取出的基音频率，构建模拟声脉的冲激响应；Step4：在音频进行快速傅里叶变换和取对数谱之后，利用离散余弦变换恢复出倒谱数据，最终提取出能量集中的部分，作为模拟的声道响应，并作为重构语音的滤波器数据；Step5：利用提取出的声脉冲激响应和声道响应重构出语音。2.根据权利要求1所述的基于声道滤波和声门激励的语音重构方法，其特征在于，Step1中，标记音频话音特征起止点具体为：通过将音频信号进行分帧和加窗处理后，通过检测音频在频域下短时能量的平坦程度标记处音频中的有话段和无话段位置信息，区分出音频中的有话段和无话段，提取结果以一组二维数组表示一段语音的端点位置信息，从而提取出音频话音的起...

【专利技术属性】
技术研发人员：邵玉斌，段云，龙华，杜庆治，苏树盟，黄张衡，刘晶，
申请(专利权)人：昆明理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人