人声基频范围确定方法、电子设备及存储介质技术

技术编号:38214289 阅读:7 留言:0更新日期:2023-07-25 11:22
本发明专利技术公开一种人声基频范围确定方法、电子设备及存储介质。方法包括:获取人声基频分布,所述人声基频分布包括人声基频的多个频率以及对应幅值;对所述人声基频分布进行双拟合,得到两个拟合分布;基于两个所述拟合分布的比较结果,确定所述人声基频分布的频率范围的最小边界值和/或最大边界值。本发明专利技术通过对人声基频分布进行双拟合得到两个拟合分布,并基于两个拟合分布进行比较,准确确定人声基频分布的频率范围的最小边界值和/或最大边界值,从而可以正确的计算基频的值。从而可以正确的计算基频的值。从而可以正确的计算基频的值。

【技术实现步骤摘要】
人声基频范围确定方法、电子设备及存储介质


[0001]本专利技术涉及语音技术相关
,特别是一种人声基频范围确定方法、电子设备及存储介质。

技术介绍

[0002]音高(pitch):是指各种音调高低不同的声音,即音的高度,是音的基本特征的一种。声音的本质是机械波,所以声速一定时,音的高低是由机械波的频率和波长决定的。频率高、波长短,则音"高",反之,频率低、波长长,则音"低"。
[0003]声音可以分解成很多正弦波。傅立叶从数学上证明了,任何的一种非正弦的振动,都可以分解为若干个不同频率的正弦波的叠加。频率最低的波就是基频(F0)。
[0004]尽管音高与基频有所不同,但通常并不区分。音高增高八度音程相当于基频翻倍。在1000Hz以下,基频翻倍略小于音高的八度音程;而在1000-5000Hz范围,基频翻倍略大于音高的。其中,男性的基频一般处于100

300Hz之间,但是有些男低音会处于60

120Hz.女性的基频一般处于200

500Hz之间,有些女生音调比较尖,或者小孩的基频会达到600

700Hz.
[0005]在语音合成、语音识别、声纹识别及其他声学应用领域,存在提取基频的需求。现有的基频提取错误一般是半频、倍频错误造成,解决这种错误的一个有效手段就是确定基频的范围,即确定基频范围的最小值和最大值,其中最小值对基频提取的准确度有较大的影响。但是由于不同的人的基频范围差异很大,很难给出基频的有效范围。/>
技术实现思路

[0006]基于此,有必要针对现有技术存在无法确定基频的频率范围的边界值的技术问题,提供一种人声基频范围确定方法、电子设备及存储介质。
[0007]本专利技术提供一种人声基频范围确定方法,包括:
[0008]获取人声基频分布,所述人声基频分布包括人声基频的多个频率以及对应幅值;
[0009]对所述人声基频分布进行双拟合,得到两个拟合分布;
[0010]基于两个所述拟合分布的比较结果,确定所述人声基频分布的频率范围的最小边界值和/或最大边界值。
[0011]进一步地,所述对所述人声基频分布进行双拟合,得到两个拟合分布,具体包括:
[0012]采用双高斯对所述人声基频分布进行拟合,得到两个拟合分布。
[0013]进一步地,所述基于两个所述拟合分布的比较结果,确定所述人声基频分布的频率范围的最小边界值,具体包括:
[0014]比较两个所述拟合分布的最小频率、中心线频率和/或最大频率;
[0015]根据两个所述拟合分布的最小频率、中心线频率和/或最大频率的比较结果,确定所述人声基频分布对应的频率范围的最小边界值。
[0016]更进一步地,所述根据两个所述拟合分布的最小频率、中心线频率和/或最大频率的比较结果,确定所述人声基频分布对应的频率范围的最小边界值,具体包括:
[0017]如果两个所述拟合分布的最小频率的差值绝对值在预设差值阈值、和/或两个所述拟合分布的中心线频率的差值绝对值在预设差值阈值、和/或两个所述拟合分布的最大频率的差值绝对值在预设差值阈值,则以其中一个所述拟合分布的最小频率作为所述频率范围的最小边界值。
[0018]再进一步地,所述以其中一个所述拟合分布的最小频率作为所述频率范围的最小边界值,具体包括:
[0019]选择中心线频率大的所述拟合分布作为主拟合分布,另一拟合分布作为低频拟合分布,所述中心线频率为所述拟合分布的中心线对应的频率;
[0020]以所述主拟合分布的最小频率作为所述频率范围的最小边界值。
[0021]再进一步地,根据两个所述拟合分布的最小频率、中心线频率和/或最大频率的比较结果,确定所述人声基频分布对应的频率范围的最小边界值,具体包括:
[0022]如果两个所述拟合分布的最小频率的差值绝对值大于预设差值阈值、和/或两个所述拟合分布的中心线频率的差值绝对值大于预设差值阈值、和/或两个所述拟合分布的最大频率的差值绝对值大于预设差值阈值,则:
[0023]选择中心线频率大的所述拟合分布作为主拟合分布,另一拟合分布作为低频拟合分布,所述中心线频率为所述拟合分布的中心线对应的频率;
[0024]计算第一参考值为low_mu+A*low_sigma,计算第二参考值为main_mu

A*main_sigma,其中low_mu为所述低频拟合分布的频率均值,low_sigma为所述低频拟合分布的频率方差,main_mu为所述主拟合分布的频率均值,main_sigma为所述主拟合分布的频率方差,A为第一常数;
[0025]根据所述第一参考值与所述第二参考值的比较结果,确定所述人声基频分布对应的频率范围的最小边界值。
[0026]再进一步地,所述根据所述第一参考值与所述第二参考值的比较结果,确定所述人声基频分布对应的频率范围的最小边界值,具体包括:
[0027]如果所述第一参考值小于所述第二参考值,则确定所述人声基频分布对应的频率范围的最小边界值为:min_freq=low_mu+A*low_sigma,其中min_freq为所述最小边界值;
[0028]如果所述第一参考值大于所述第二参考值,则确定所述人声基频分布对应的频率范围的最小边界值为:min_freq=mean(main_mu

A*main_sigma,low_mu+A*low_sigma),其中mean为求均值函数。
[0029]再进一步地,所述确定所述人声基频分布的频率范围的最大边界值,具体包括:确定所述人声基频分布的最大边界值为:max_freq=max(B,main_mu+C*main_sigma),其中max_freq为所述最大边界值,B为第二常数,C为第三常数。
[0030]本专利技术提供一种电子设备,包括:
[0031]至少一个处理器;以及,
[0032]与至少一个所述处理器通信连接的存储器;其中,
[0033]所述存储器存储有可被至少一个所述处理器执行的指令,所述指令被至少一个所述处理器执行,以使至少一个所述处理器能够执行如前所述的人声基频范围确定方法。
[0034]本专利技术提供一种存储介质,所述存储介质存储计算机指令,当计算机执行所述计算机指令时,用于执行如前所述的人声基频范围确定方法的所有步骤。
[0035]本专利技术通过对人声基频分布进行双拟合得到两个拟合分布,并基于两个拟合分布进行比较,准确确定人声基频分布的频率范围的最小边界值和/或最大边界值,从而可以正确的计算基频的值。
附图说明
[0036]图1为本专利技术一实施例一种人声基频范围确定方法的工作流程图;
[0037]图2为本专利技术另一实施例一种人声基频范围确定方法的工作流程图;
[0038]图3为本专利技术的双拟合分布示意图;
[0039]图4为本专利技术最佳一实施例一种人声基频范围确定方法的本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种人声基频范围确定方法,其特征在于,包括:获取人声基频分布,所述人声基频分布包括人声基频的多个频率以及对应幅值;对所述人声基频分布进行双拟合,得到两个拟合分布;基于两个所述拟合分布的比较结果,确定所述人声基频分布的频率范围的最小边界值和/或最大边界值。2.根据权利要求1所述的人声基频范围确定方法,其特征在于,所述对所述人声基频分布进行双拟合,得到两个拟合分布,具体包括:采用双高斯对所述人声基频分布进行拟合,得到两个拟合分布。3.根据权利要求1所述的人声基频范围确定方法,其特征在于,所述基于两个所述拟合分布的比较结果,确定所述人声基频分布的频率范围的最小边界值,具体包括:比较两个所述拟合分布的最小频率、中心线频率和/或最大频率;根据两个所述拟合分布的最小频率、中心线频率和/或最大频率的比较结果,确定所述人声基频分布对应的频率范围的最小边界值。4.根据权利要求3所述的人声基频范围确定方法,其特征在于,所述根据两个所述拟合分布的最小频率、中心线频率和/或最大频率的比较结果,确定所述人声基频分布对应的频率范围的最小边界值,具体包括:如果两个所述拟合分布的最小频率的差值绝对值在预设差值阈值、和/或两个所述拟合分布的中心线频率的差值绝对值在预设差值阈值、和/或两个所述拟合分布的最大频率的差值绝对值在预设差值阈值,则以其中一个所述拟合分布的最小频率作为所述频率范围的最小边界值。5.根据权利要求4所述的人声基频范围确定方法,其特征在于,所述以其中一个所述拟合分布的最小频率作为所述频率范围的最小边界值,具体包括:选择中心线频率大的所述拟合分布作为主拟合分布,另一拟合分布作为低频拟合分布,所述中心线频率为所述拟合分布的中心线对应的频率;以所述主拟合分布的最小频率作为所述频率范围的最小边界值。6.根据权利要求4所述的人声基频范围确定方法,其特征在于,根据两个所述拟合分布的最小频率、中心线频率和/或最大频率的比较结果,确定所述人声基频分布对应的频率范围的最小边界值,具体包括:如果两个所述拟合分布的最小频率的差值绝对值大于预设差值阈值、和/或两个所述拟合分布的中心线频率的差值绝对值大于预设差值阈值、和/或两个所述拟合分布的最大频率的差值绝对值大于预设差值阈值,则:选择中心线频率...

【专利技术属性】
技术研发人员:胡云燎杨明祺张博闻
申请(专利权)人:名日之梦北京科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1