【技术实现步骤摘要】
本专利技术涉及语音处理
,尤其涉及一种语音变调方法及装置。
技术介绍
目前,语音通信涉及的范围越来越广,包括电话,手机,网络视频聊天, 语音邮件等。出于军事安全、保护隐私或者是个人娱乐等方面的需要,人们在 语音通信中除了希望通过改变自己的声音特征掩盖自己的身份外,同时也有在 本地通话端改变对方通话端声音特征的需要。现有的语音变调特效, 一般应用在语音信号的发送端,通过指定升调或者 降调的范围,来固定地改变音调,起到男声变女声,或者女声变男声的作用。 一般情况下,女声的音调要高于男声,因此,当用户是位女性时,该用户通过 在语音信号的发送端设定降调的幅度,即可实现将自己的音调调低,从而达到 将自己的声音变成男声后发送给接收端的目的。同理,当用户是位男性时,该 用户通过在语音信号的发送端设定升调的幅度,即可实现将自己的音调调高, 从而达到将自己的声音变成女声后发送给接收端的目的。综上所述,现有语音变调技术是通过用户手工设定升调或者降调的幅度, 来固定地改变音调,即现有技术无法实现语音的自适应变调。
技术实现思路
本专利技术实施例提供了 一种语音变调方法及装置,用以实现语音的自适应变调。本专利技术实施例提供的一种语音变调方法包括 对接收到的语音进行基音检测,确定所述语音的基音周期;确定所述语音的基音周期所属的基音周期范围,并根据预先设置的基音周 期范围与变调参数的对应关系,获取所述语音的基音周期所属的基音周期范围所对应的变调参数;采用所述变调参数对所述语音进行变调处理。 本专利技术实施例提供的另 一种语音变调方法包括 对接收到的语音进行基音检测,确定所述语音 ...
【技术保护点】
一种语音变调方法,其特征在于,所述方法包括: 对接收到的语音进行基音检测,确定所述语音的基音周期; 确定所述语音的基音周期所属的基音周期范围,并根据预先设置的基音周期范围与变调参数的对应关系,获取所述语音的基音周期所属的基音周期范围所对应的变调参数; 采用所述变调参数对所述语音进行变调处理。
【技术特征摘要】
1、一种语音变调方法,其特征在于,所述方法包括对接收到的语音进行基音检测,确定所述语音的基音周期;确定所述语音的基音周期所属的基音周期范围,并根据预先设置的基音周期范围与变调参数的对应关系,获取所述语音的基音周期所属的基音周期范围所对应的变调参数;采用所述变调参数对所述语音进行变调处理。2、 根据权利要求1所述的方法,其特征在于,对所述接收到的语音进行 基音检测,确定所述语音的基音周期的步骤包括确定噪声短时平均幅度;当一帧语音的短时平均幅度大于所述噪声短时平均幅度一定倍数时,将该 帧作为目标;险测帧;采用短时平均幅度差函数确定目标检测帧语音的基音周期。3、 根据权利要求2所述的方法,其特征在于,所述当一帧语音的短时平 均幅度大于所述噪声短时平均幅度一定倍数时,进一步对该帧语音进行中心削 波,当该帧语音经过中心削波后至少有半数以上的子帧中保留有信号时,将该 帧作为目标^r测帧。4、 根据权利要求2或3所述的方法,其特征在于,确定所述噪声短时平 均幅度的步骤包括:计算接收到的第一帧信号中的各个子帧信号的平均幅度,并丢弃其中大于 第一个子帧信号的平均幅度预先设定的倍数的平均幅度,将剩余的平均幅度取 平均,并将得到的平均值与预先设置的阔值进行比较,将较大的值作为噪声短 时平均幅度的值。5、 根据权利要求2所述的方法,其特征在于,确定了所述目标检测帧之 后,采用短时平均幅度差函数确定目标检测帧语音的基音周期之前还包括对所述目标检测帧语音进行带通滤波处理,消除电源以及共振峰的干扰。6、 根据权利要求5所述的方法,其特征在于,对所述目标检测帧语音进 行带通滤波处理之后,釆用短时平均幅度差函数确定目标;险测帧语音的基音周 期之前还包括对所述目标检测帧语音进行中心削波处理。7、 根据权利要求2所述的方法,其特征在于,预先根据女性基音周期范 围设置短时平均幅度差函数的第 一变量值范围,以及根据男性基音周期范围设 置短时平均幅度差函数的第二变量值范围;所述采用短时平均幅度差函数确定目标检测帧语音的基音周期的步骤包括分别选取第一变量值范围内短时平均幅度差函数值最小的第一变量值和 第二变量值范围内短时平均幅度差函数值最小的第二变量值;将小于和大于所述第一变量值的一定个数的变量值所对应的短时平均幅 度差函数值取平均,并将得到的平均值减去所述第一变量值所对应的短时平均 幅度差函数值,将得到的差值作为所述第一变量值的清晰度;并且,将小于和大于所述第二变量值的一定个数的变量值所对应的短时平均幅 度差函数值取平均,并将得到的平均值减去所述第二变量值所对应的短时平均 幅度差函数值,将得到的差值作为所述第二变量值的清晰度;通过比较所述第一变量值所对应的短时平均幅度差函数值与所述第二变 量值所对应的短时平均幅度差函数值,以及所述第一变量值的清晰度和所述第 二变量值的清晰度,确定所述目标检测帧语音的基音周期。8、 根据权利要求7所述的方法,其特征在于,通过比较所述第一变量值 所对应的短时平均幅度差函数值与所述第二变量值所对应的短时平均幅度差 函数值,以及所述第一变量值的清晰度和所述第二变量值的清晰度,确定所述 目标检测帧语音的基音周期的步骤包括当所述第一变量值所对应的短时平均幅度差函数值小于所述第二变量值 所对应的短时平均幅度差函数值时,确定所述目标检测帧语音的基音周期为所 述第一变量值;当所述第一变量值所对应的短时平均幅度差函数值大于所述第二变量值 所对应的短时平均幅度差函数值,且所述第一变量值的清晰度小于所述第二变 量值的清晰度时,确定所述目标检测帧语音的基音周期为所述第二变量值;当所述第一变量值所对应的短时平均幅度差函数值大于所述第二变量值 所对应的短时平均幅度差函数值,且所述第一变量值的清晰度大于所述第二变 量值的清晰度时,如果所述第二变量值约等于两倍的所述第一变量值,且所述 第一变量值所对应的短时平均幅度差函数值与所述第二变量值所对应的短时 平均幅度差函数值的差值小于一定值时,确定所述目标检测帧语音的基音周期 为所述第一变量值;否则,确定所述目标检测帧语...
【专利技术属性】
技术研发人员:徐磊,张晨,
申请(专利权)人:北京中星微电子有限公司,
类型:发明
国别省市:11[中国|北京]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。