一种语音变调方法及装置制造方法及图纸

技术编号：3044171 阅读：170 留言：0更新日期：2012-04-11 18:40

本发明专利技术公开了一种语音变调方法及装置，用以实现语音的自适应变调。本发明专利技术提供的一种语音变调方法包括：对接收到的语音进行基音检测，确定所述语音的基音周期；确定所述语音的基音周期所属的基音周期范围，并根据预先设置的基音周期范围与变调参数的对应关系，获取所述语音的基音周期所属的基音周期范围所对应的变调参数；采用所述变调参数对所述语音进行变调处理。本发明专利技术用于实现语音的自适应变调，避免现有技术需要用户通过手工设置升调或者降调的幅度来固定地改变音调，从而方便用户操作，并且提高变调准确性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及语音处理
，尤其涉及一种语音变调方法及装置。
技术介绍
目前，语音通信涉及的范围越来越广，包括电话，手机，网络视频聊天，语音邮件等。出于军事安全、保护隐私或者是个人娱乐等方面的需要，人们在语音通信中除了希望通过改变自己的声音特征掩盖自己的身份外，同时也有在本地通话端改变对方通话端声音特征的需要。现有的语音变调特效，一般应用在语音信号的发送端，通过指定升调或者降调的范围，来固定地改变音调，起到男声变女声，或者女声变男声的作用。一般情况下，女声的音调要高于男声，因此，当用户是位女性时，该用户通过在语音信号的发送端设定降调的幅度，即可实现将自己的音调调低，从而达到将自己的声音变成男声后发送给接收端的目的。同理，当用户是位男性时，该用户通过在语音信号的发送端设定升调的幅度，即可实现将自己的音调调高，从而达到将自己的声音变成女声后发送给接收端的目的。综上所述，现有语音变调技术是通过用户手工设定升调或者降调的幅度，来固定地改变音调，即现有技术无法实现语音的自适应变调。
技术实现思路
本专利技术实施例提供了一种语音变调方法及装置，用以实现语音的自适应变调。本专利技术实施例提供的一种语音变调方法包括对接收到的语音进行基音检测，确定所述语音的基音周期；确定所述语音的基音周期所属的基音周期范围，并根据预先设置的基音周期范围与变调参数的对应关系，获取所述语音的基音周期所属的基音周期范围所对应的变调参数；采用所述变调参数对所述语音进行变调处理。本专利技术实施例提供的另一种语音变调方法包括对接收到的语音进行基音检测，确定所述语音...

【技术保护点】
一种语音变调方法，其特征在于，所述方法包括：　对接收到的语音进行基音检测，确定所述语音的基音周期；　确定所述语音的基音周期所属的基音周期范围，并根据预先设置的基音周期范围与变调参数的对应关系，获取所述语音的基音周期所属的基音周期范围所对应的变调参数；　采用所述变调参数对所述语音进行变调处理。

【技术特征摘要】
1、一种语音变调方法，其特征在于，所述方法包括对接收到的语音进行基音检测，确定所述语音的基音周期；确定所述语音的基音周期所属的基音周期范围，并根据预先设置的基音周期范围与变调参数的对应关系，获取所述语音的基音周期所属的基音周期范围所对应的变调参数；采用所述变调参数对所述语音进行变调处理。2、根据权利要求1所述的方法，其特征在于，对所述接收到的语音进行基音检测，确定所述语音的基音周期的步骤包括确定噪声短时平均幅度；当一帧语音的短时平均幅度大于所述噪声短时平均幅度一定倍数时，将该帧作为目标;险测帧；采用短时平均幅度差函数确定目标检测帧语音的基音周期。3、根据权利要求2所述的方法，其特征在于，所述当一帧语音的短时平均幅度大于所述噪声短时平均幅度一定倍数时，进一步对该帧语音进行中心削波，当该帧语音经过中心削波后至少有半数以上的子帧中保留有信号时，将该帧作为目标^r测帧。4、根据权利要求2或3所述的方法，其特征在于，确定所述噪声短时平均幅度的步骤包括:计算接收到的第一帧信号中的各个子帧信号的平均幅度，并丢弃其中大于第一个子帧信号的平均幅度预先设定的倍数的平均幅度，将剩余的平均幅度取平均，并将得到的平均值与预先设置的阔值进行比较，将较大的值作为噪声短时平均幅度的值。5、根据权利要求2所述的方法，其特征在于，确定了所述目标检测帧之后，采用短时平均幅度差函数确定目标检测帧语音的基音周期之前还包括对所述目标检测帧语音进行带通滤波处理，消除电源以及共振峰的干扰。6、根据权利要求5所述的方法，其特征在于，对所述目标检测帧语音进行带通滤波处理之后，釆用短时平均幅度差函数确定目标;险测帧语音的基音周期之前还包括对所述目标检测帧语音进行中心削波处理。7、根据权利要求2所述的方法，其特征在于，预先根据女性基音周期范围设置短时平均幅度差函数的第一变量值范围，以及根据男性基音周期范围设置短时平均幅度差函数的第二变量值范围；所述采用短时平均幅度差函数确定目标检测帧语音的基音周期的步骤包括分别选取第一变量值范围内短时平均幅度差函数值最小的第一变量值和第二变量值范围内短时平均幅度差函数值最小的第二变量值；将小于和大于所述第一变量值的一定个数的变量值所对应的短时平均幅度差函数值取平均，并将得到的平均值减去所述第一变量值所对应的短时平均幅度差函数值，将得到的差值作为所述第一变量值的清晰度；并且，将小于和大于所述第二变量值的一定个数的变量值所对应的短时平均幅度差函数值取平均，并将得到的平均值减去所述第二变量值所对应的短时平均幅度差函数值，将得到的差值作为所述第二变量值的清晰度；通过比较所述第一变量值所对应的短时平均幅度差函数值与所述第二变量值所对应的短时平均幅度差函数值，以及所述第一变量值的清晰度和所述第二变量值的清晰度，确定所述目标检测帧语音的基音周期。8、根据权利要求7所述的方法，其特征在于，通过比较所述第一变量值所对应的短时平均幅度差函数值与所述第二变量值所对应的短时平均幅度差函数值，以及所述第一变量值的清晰度和所述第二变量值的清晰度，确定所述目标检测帧语音的基音周期的步骤包括当所述第一变量值所对应的短时平均幅度差函数值小于所述第二变量值所对应的短时平均幅度差函数值时，确定所述目标检测帧语音的基音周期为所述第一变量值；当所述第一变量值所对应的短时平均幅度差函数值大于所述第二变量值所对应的短时平均幅度差函数值，且所述第一变量值的清晰度小于所述第二变量值的清晰度时，确定所述目标检测帧语音的基音周期为所述第二变量值；当所述第一变量值所对应的短时平均幅度差函数值大于所述第二变量值所对应的短时平均幅度差函数值，且所述第一变量值的清晰度大于所述第二变量值的清晰度时，如果所述第二变量值约等于两倍的所述第一变量值，且所述第一变量值所对应的短时平均幅度差函数值与所述第二变量值所对应的短时平均幅度差函数值的差值小于一定值时，确定所述目标检测帧语音的基音周期为所述第一变量值；否则，确定所述目标检测帧语...

【专利技术属性】
技术研发人员：徐磊，张晨，
申请(专利权)人：北京中星微电子有限公司，
类型：发明
国别省市：11[中国|北京]

全部详细技术资料下载我是这个专利的主人