【技术实现步骤摘要】
本专利技术涉及语音信号处理领域,尤其涉及一种基于LPC及RBF神经网络的声音转换的方法。
技术介绍
对语音信号的处理,主要有三种方案 I、基于矢量量化的码本映射技术实现方案 用矢量量化算法将源说话人和目标说话人的声学特征空间进行划分,用动态时间规整算法将源-目标特征矢量相关联,从而训练出一个源到目标说话人的映射码本。缺陷尽管 计算量较低,但是由于矢量量化作用造成的频谱的不连续性,转换语音质量还很低。2、基于线性多变量回归的局部函数转换技术实现方案 说话人语音频谱空间由矢量量化划分成许多不同的子空间,每一个空间都训练一个局部函数,每个局部函数都表述了某一个声学空间源-目标说话人特征之间的关系,这样码本映射方案中的全局映射就被这些局部函数来近似。缺陷这种局部空间转换的方法可以产生无穷多目标特征量。然而由于选择单个局部转换函数的离散性还存在,不连贯性仍然出现在输出语音中。3、基于高斯混合模型的联合概率分布技术实现方案 通过概率的方法,采用高斯混合模型描述源-目标特征的联合概率分布,寻找转换函数来预测目标语音特征。这种技术比码本映射和局部函数变换有效性、鲁棒性也 ...
【技术保护点】
一种基于LPC及RBF神经网络的声音转换的方法,其特征在于:包括以下步骤:A、对语音进行预处理;?B、对浊音帧进行基频检测;C、对基频检测后的浊音帧进行转换;D、对转换后的基频进行浊音帧参量的提取;E、对提取到的浊音帧参量进行计算,求得一帧浊音帧,然后对该一帧浊音帧进行合成,得到转换后的浊音帧。
【技术特征摘要】
【专利技术属性】
技术研发人员:张钦宇,潘振鹏,林威,王喆,付东松,张勇勇,黄立伟,
申请(专利权)人:哈尔滨工业大学深圳研究生院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。