一种语音变调方法及装置制造方法及图纸

技术编号:3044171 阅读:170 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种语音变调方法及装置,用以实现语音的自适应变调。本发明专利技术提供的一种语音变调方法包括:对接收到的语音进行基音检测,确定所述语音的基音周期;确定所述语音的基音周期所属的基音周期范围,并根据预先设置的基音周期范围与变调参数的对应关系,获取所述语音的基音周期所属的基音周期范围所对应的变调参数;采用所述变调参数对所述语音进行变调处理。本发明专利技术用于实现语音的自适应变调,避免现有技术需要用户通过手工设置升调或者降调的幅度来固定地改变音调,从而方便用户操作,并且提高变调准确性。

【技术实现步骤摘要】

本专利技术涉及语音处理
,尤其涉及一种语音变调方法及装置
技术介绍
目前,语音通信涉及的范围越来越广,包括电话,手机,网络视频聊天, 语音邮件等。出于军事安全、保护隐私或者是个人娱乐等方面的需要,人们在 语音通信中除了希望通过改变自己的声音特征掩盖自己的身份外,同时也有在 本地通话端改变对方通话端声音特征的需要。现有的语音变调特效, 一般应用在语音信号的发送端,通过指定升调或者 降调的范围,来固定地改变音调,起到男声变女声,或者女声变男声的作用。 一般情况下,女声的音调要高于男声,因此,当用户是位女性时,该用户通过 在语音信号的发送端设定降调的幅度,即可实现将自己的音调调低,从而达到 将自己的声音变成男声后发送给接收端的目的。同理,当用户是位男性时,该 用户通过在语音信号的发送端设定升调的幅度,即可实现将自己的音调调高, 从而达到将自己的声音变成女声后发送给接收端的目的。综上所述,现有语音变调技术是通过用户手工设定升调或者降调的幅度, 来固定地改变音调,即现有技术无法实现语音的自适应变调。
技术实现思路
本专利技术实施例提供了 一种语音变调方法及装置,用以实现语音的自适应变调。本专利技术实施例提供的一种语音变调方法包括 对接收到的语音进行基音检测,确定所述语音的基音周期;确定所述语音的基音周期所属的基音周期范围,并根据预先设置的基音周 期范围与变调参数的对应关系,获取所述语音的基音周期所属的基音周期范围所对应的变调参数;采用所述变调参数对所述语音进行变调处理。 本专利技术实施例提供的另 一种语音变调方法包括 对接收到的语音进行基音检测,确定所述语音的基音频率; 确定所述语音的基音频率所属的基音频率范围,并根据预先设置的基音频率范围与变调参数的对应关系,获取所述语音的基音频率所属的基音频率范围所对应的变调参数;采用所述变调参数对所述语音进行变调处理。 本专利技术实施例提供的一种语音变调装置包括设置单元,用于预先设置并存储基音周期范围与变调参数的对应关系; 基音周期单元,用于对接收到的语音进行基音检测,确定所述语音的基音 周期;变调参数单元,用于确定所述语音的基音周期所属的基音周期范围,并根 据所述对应关系,获取所述语音的基音周期所属的基音周期范围所对应的变调 参数;变调单元,用于采用所述变调参数单元获取的变调参数对所述语音进行变 调处理。本专利技术实施例提供的另 一种语音变调装置包括 设置单元,用于预先设置并存储基音频率范围与变调参数的对应关系; 基音频率单元,用于对接收到的语音进行基音检测,确定所述语音的基音 频率;变调参数单元,用于确定所述语音的基音频率所属的基音频率范围,并根 据所述对应关系,获取所述语音的基音频率所属的基音频率范围所对应的变调 参数;变调单元,用于采用所述变调参数单元获取的变调参数对所述语音进行变 调处理。本专利技术实施例,通过对接收到的语音进行基音检测,确定所述语音的基音周期;通过确定所述语音的基音周期所属的基音周期范围,并根据预先设置的 基音周期范围与变调参数的对应关系,获取所述语音的基音周期所属的基音周 期范围所对应的变调参数;采用该变调参数对所述语音进行变调处理,从而实 现了对语音的自适应变调,避免了现有技术需要用户通过手工设置升调或者降 调的幅度来固定地改变音调,从而方便了用户操作,并且才是高了变调准确性。附图说明图1为本专利技术实施例提供的一种自适应的语音变调方法的总体流程示意图2为本专利技术实施例提供的中心削波函数示意图3为本专利技术实施例提供的AMDF算法中函数^。的波形示意图4为本专利技术实施例提供的变调算法原理示意图5为本专利技术实施例提供的音色调整原理示意图6为本专利技术实施例提供的一种语音变调装置的具体结构示意图。具体实施例方式本专利技术实施例提供了 一种自适应的语音变调方法及装置,用以实现自动将 接收到的语音进行变调,将男声变成女声,或者将女声变成男生,或者无论男 女,都变成男声或者都变成女声,从而方便了用户操作,并且提高了变调准确 性。下面结合附图对本专利技术实施例进行详细说明。参见图l,本专利技术实施例提供了一种自适应的语音变调方法总体包括步骤 S101、对接收到的语音进行基音检测,确定语音的基音周期。S102、确定语音的基音周期所属的基音周期范围,并根据预先设置的基音 周期范围与变调参数的对应关系,获取语音的基音周期所属的基音周期范围所 对应的变调参数。S103 、采用语音的基音周期所属的基音周期范围所对应的变调参数对该语 音进行变调处理。下面关于步骤S101给出具体说明。基音周期是语音信号处理中最重要的参数之一,在语音编解码器、语音识 别等方面具有关键性的应用。基音周期是根据加窗的短时语音帧估计得到的, 基音周期的估计方案有很多,本专利技术实施例基于短时平均幅度差函数(AMDF, Average magnitude difference function)算法,提出了 一种改进的基音周期检测 方案,用以在较短的时间内,更加准确地检测出语音的基音周期。基音周期是一种典型的语音短时特征,因此首先需要对语音进行加窗分帧 处理,研究表明窗长至少应大于两个基音周期,才可能得到较好的基音周期检 测效果,而语音中最大的基音周期约为20毫秒(ms),因此,本专利技术实施例为 了提高检测基音周期的准确性,将窗长选为64ms,即每帧语音信号的长度是 64ms。并且,较佳地,本专利技术实施例中将每帧语音信号分为四个子帧。为了对基音周期进行准确判断,需要选择元音信号帧作为目标检测帧;并 且,为了保持音调的一致性,在说话人刚开口说话时就需要对基音周期进行检 测。为了同时满足这两个条件,本专利技术实施例通过实-睑证明较佳地,当某一 帧语音信号的短时平均幅度为噪声短时平均幅度的5倍时,选取该帧语音信号 为目标检测帧的语音信号,检测目标检测帧的语音信号的基音周期能够得到较 准确的基音周期。首先,噪声短时平均幅度(T)的具体计算方法包括如下三个步骤a、将接收到的第一个子帧的短时平均幅度作为T的参考值(或者称为初 始值)。其中,在窗长选为64ms的情况下,每个子帧具有128个样本点,采样 频率为8千赫兹(即8KHz)。b、 分别计算第一个子帧后的连续3个子帧(即第二个子帧、第三个子帧 和第四个子帧)的短时平均幅度,并且,如果这3个子帧中出现某个子帧的短 时平均幅度过大,例如大于两倍的第一个子帧的短时平均幅度,则舍去不用, 将其余的短时平均幅度取算数平均,将得到的平均值作为噪声短时平均幅度T。c、 判断步骤b中计算得到的噪声短时平均幅度T是否小于预先设定的噪 声短时平均幅度阔值,如果是,则利用该阈值更新噪声短时平均幅度T的值, 否则,保持噪声短时平均幅度T的值不变。较佳地,所述的噪声短时平均幅度阈值可以设为300。在确定了噪声短时平均幅度以后,本专利技术实施例将满足以下两个条件的语音帧作为检测基音周期的目标检测帧条件一该帧语音信号的短时平均幅度是噪声短时平均幅度的5倍。 一般情况下目标;险测帧语音信号的短时平均幅度大约为3分贝(db )。 条件二该帧信号进行中心削波后,至少有三个子帧中保留有信号,也就是说,至少要有一半以上个数的子帧中留有信号,而不会大部分子帧的信号都被削掉。中心削波的目的是为了进一步提高准确性,因为,本专利技术实施例要选择元 音信本文档来自技高网...

【技术保护点】
一种语音变调方法,其特征在于,所述方法包括: 对接收到的语音进行基音检测,确定所述语音的基音周期; 确定所述语音的基音周期所属的基音周期范围,并根据预先设置的基音周期范围与变调参数的对应关系,获取所述语音的基音周期所属的基音周期范围所对应的变调参数; 采用所述变调参数对所述语音进行变调处理。

【技术特征摘要】
1、一种语音变调方法,其特征在于,所述方法包括对接收到的语音进行基音检测,确定所述语音的基音周期;确定所述语音的基音周期所属的基音周期范围,并根据预先设置的基音周期范围与变调参数的对应关系,获取所述语音的基音周期所属的基音周期范围所对应的变调参数;采用所述变调参数对所述语音进行变调处理。2、 根据权利要求1所述的方法,其特征在于,对所述接收到的语音进行 基音检测,确定所述语音的基音周期的步骤包括确定噪声短时平均幅度;当一帧语音的短时平均幅度大于所述噪声短时平均幅度一定倍数时,将该 帧作为目标;险测帧;采用短时平均幅度差函数确定目标检测帧语音的基音周期。3、 根据权利要求2所述的方法,其特征在于,所述当一帧语音的短时平 均幅度大于所述噪声短时平均幅度一定倍数时,进一步对该帧语音进行中心削 波,当该帧语音经过中心削波后至少有半数以上的子帧中保留有信号时,将该 帧作为目标^r测帧。4、 根据权利要求2或3所述的方法,其特征在于,确定所述噪声短时平 均幅度的步骤包括:计算接收到的第一帧信号中的各个子帧信号的平均幅度,并丢弃其中大于 第一个子帧信号的平均幅度预先设定的倍数的平均幅度,将剩余的平均幅度取 平均,并将得到的平均值与预先设置的阔值进行比较,将较大的值作为噪声短 时平均幅度的值。5、 根据权利要求2所述的方法,其特征在于,确定了所述目标检测帧之 后,采用短时平均幅度差函数确定目标检测帧语音的基音周期之前还包括对所述目标检测帧语音进行带通滤波处理,消除电源以及共振峰的干扰。6、 根据权利要求5所述的方法,其特征在于,对所述目标检测帧语音进 行带通滤波处理之后,釆用短时平均幅度差函数确定目标;险测帧语音的基音周 期之前还包括对所述目标检测帧语音进行中心削波处理。7、 根据权利要求2所述的方法,其特征在于,预先根据女性基音周期范 围设置短时平均幅度差函数的第 一变量值范围,以及根据男性基音周期范围设 置短时平均幅度差函数的第二变量值范围;所述采用短时平均幅度差函数确定目标检测帧语音的基音周期的步骤包括分别选取第一变量值范围内短时平均幅度差函数值最小的第一变量值和 第二变量值范围内短时平均幅度差函数值最小的第二变量值;将小于和大于所述第一变量值的一定个数的变量值所对应的短时平均幅 度差函数值取平均,并将得到的平均值减去所述第一变量值所对应的短时平均 幅度差函数值,将得到的差值作为所述第一变量值的清晰度;并且,将小于和大于所述第二变量值的一定个数的变量值所对应的短时平均幅 度差函数值取平均,并将得到的平均值减去所述第二变量值所对应的短时平均 幅度差函数值,将得到的差值作为所述第二变量值的清晰度;通过比较所述第一变量值所对应的短时平均幅度差函数值与所述第二变 量值所对应的短时平均幅度差函数值,以及所述第一变量值的清晰度和所述第 二变量值的清晰度,确定所述目标检测帧语音的基音周期。8、 根据权利要求7所述的方法,其特征在于,通过比较所述第一变量值 所对应的短时平均幅度差函数值与所述第二变量值所对应的短时平均幅度差 函数值,以及所述第一变量值的清晰度和所述第二变量值的清晰度,确定所述 目标检测帧语音的基音周期的步骤包括当所述第一变量值所对应的短时平均幅度差函数值小于所述第二变量值 所对应的短时平均幅度差函数值时,确定所述目标检测帧语音的基音周期为所 述第一变量值;当所述第一变量值所对应的短时平均幅度差函数值大于所述第二变量值 所对应的短时平均幅度差函数值,且所述第一变量值的清晰度小于所述第二变 量值的清晰度时,确定所述目标检测帧语音的基音周期为所述第二变量值;当所述第一变量值所对应的短时平均幅度差函数值大于所述第二变量值 所对应的短时平均幅度差函数值,且所述第一变量值的清晰度大于所述第二变 量值的清晰度时,如果所述第二变量值约等于两倍的所述第一变量值,且所述 第一变量值所对应的短时平均幅度差函数值与所述第二变量值所对应的短时 平均幅度差函数值的差值小于一定值时,确定所述目标检测帧语音的基音周期 为所述第一变量值;否则,确定所述目标检测帧语...

【专利技术属性】
技术研发人员:徐磊张晨
申请(专利权)人:北京中星微电子有限公司
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利