一种基于数字信号处理的语音变声方法技术

技术编号:3046537 阅读:489 留言:0更新日期:2012-04-11 18:40
一种基于数字信号处理的语音变声方法,包括如下步骤:    (1)选取需要变声的原始语音信号;    (2)当原始语音信号存在周期性时,计算其基频值,并计算与该基频值对应的基音周期的长度;当原始语音中并不存在周期性时,在65Hz到500Hz之间取一频率值,将该频率值对应的周期作为基音周期,将该频率值对应的周期长度作为基音周期长度;    (3)根据步骤(2)中得到的基音周期长度定位整个原始语音信号的每一个基音周期的位置;    (4)在原始语音信号中的基音周期之间删除/插入基音周期,得到缩短/伸长的语音信号;    (5)将步骤(4)中得到的缩短/伸长的语音信号线性伸长/压缩至与原始语音信号一致的长度,得到变声后的语音信号。(*该技术在2023年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及一种语音变声方法,更具体地说,本专利技术涉及。
技术介绍
基频和共振峰是语音中两个非常重要的特征。基频是发浊音时声带振动的频率,基频的高低与说话人的性别直接相关,一般来说男声的基频比较低,女声的基频比较高。此外,年龄对于基频的高低也有一定影响,老年人的基频比年青人的基频低,年青人的基频要比儿童的基频低。所以通过改变基频,就能改变语音的效果,影响人对说话人年龄甚至性别的判断。共振峰是指声门波在声道里的共鸣频率。共振峰与声道的长度有很大的相关性,声道越长共振峰的频率越高,反之亦然。相对来说,男子的声道比女子的声道要长一些,所以男声的共振峰频率比女声的共振峰频率相对也要高一些。因此通过改变共振峰,能够影响人对说话人的判断。对于修改共振峰的频率,大部分方法都是基于参数合成的算法。这些方法普遍存在的问题是运算量比较大,需要人工干预,合成的语音的自然度比较差。对于改变基频,目前已经有了很多方法。应用比较广泛的有PSOLA算法(PitchSynchronous Overlap and Add),混合谐波随机模型法(Hybrid Harmonic/StochasticModel),本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于数字信号处理的语音变声方法,包括如下步骤(1)选取需要变声的原始语音信号;(2)当原始语音信号存在周期性时,计算其基频值,并计算与该基频值对应的基音周期的长度;当原始语音中并不存在周期性时,在65Hz到500Hz之间取一频率值,将该频率值对应的周期作为基音周期,将该频率值对应的周期长度作为基音周期长度;(3)根据步骤(2)中得到的基音周期长度定位整个原始语音信号的每一个基音周期的位置;(4)在原始语音信号中的基音周期之间删除/插入基音周期,得到缩短/伸长的语音信号;(5)将步骤(4)中得到的缩短/伸长的语音信号线性伸长/压缩至与原始语音信号一致的长度,得到变声后的语音信号。2.根据权利要求1所述的语音变声方法,其特征在于,在步骤(4)中是在原始语音信号中的基音周期之间周期性地删除/插入基音周期。3.根据权利要求2所述的语音变声方法,其特征在于,当期望变声后语音的基频是原始语音基频的p倍且p>1时,每隔(p-...

【专利技术属性】
技术研发人员:李明刘建汪俊杰庹凌云颜永红孙宝海
申请(专利权)人:北京中科信利技术有限公司中国科学院声学研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1