一种基于长时共振峰测量的语音同一性验证方法技术

技术编号:30075003 阅读:15 留言:0更新日期:2021-09-18 08:29
本发明专利技术提供一种基于长时共振峰测量的语音同一性验证方法,已知一份来自同一说话人的语音文件,计算已知的语音文件中,任意两段语音的长时共振峰数据之间的距离,获得上限距离和下限距离,当采集到一份检材语音时,计算检材语音与已知语音文件的长时共振峰距离,若小于下限距离,则判断该检材语音与已知语音文件具有同一性;若大于上限距离,判断该检材语音与已知语音文件不具有同一性;若在上下限距离之间,则采用假设检验法来对同一性进行验证。本发明专利技术通过获取语音文件的长时共振峰,根据长时共振峰的距离,结合假设检验法,来进行语音同一性验证,能够提高验证的精度。能够提高验证的精度。能够提高验证的精度。

【技术实现步骤摘要】
一种基于长时共振峰测量的语音同一性验证方法


[0001]本专利技术属于语音检测
,具体涉及一种基于长时共振峰测量的语音同一性验证方法。

技术介绍

[0002]共振峰是声纹鉴定中重要的特征,其不仅为辅音和元音分辨提供了参考,同时还包含了发音人的个性特征。共振峰频率受声道长度的影响,声道变长会导致元音共振峰降低,另外声道各部分之间的比例大小也会影响共振峰的频率。
[0003]测量共振峰频率的方法有很多。其中,测量不同元音共振峰中心频率值的方法最经典。然而不同元音的共振峰频率之间以及不同共振峰之间没有充分的相关性,此特性降低了鉴定的准确性。研究共振峰的另一种方法是动态特性分析法,个体发音时会留下其特定运动方式的痕迹,这些痕迹反映了说话人的个性特征,但共振峰的动态性同时还受到音段和韵律语境的影响,该方法还需要进一步研究不同说话语境时的差异问题。

技术实现思路

[0004]本专利技术要解决的技术问题是:提供一种基于长时共振峰测量的语音同一性验证方法,能够提高验证的精度。
[0005]本专利技术为解决上述技术问题所采取的技术方案为:一种基于长时共振峰测量的语音同一性验证方法,本方法包括:
[0006]已知一份来自同一说话人的语音文件,计算已知的语音文件中,任意两段语音的长时共振峰数据之间的距离,获得上限距离和下限距离
[0007]当采集到一份检材语音时,计算该检材语音与所述已知的语音文件的长时共振峰距离D,并进行以下判断:
[0008]当判断该时段检材语音与已知语音文件具有同一性,即为同一说话人;
[0009]当判断该时段检材语音与已知语音文件不具有同一性,即为不同说话人;
[0010]当则采用假设检验法来对同一性进行验证。
[0011]按上述方法,所述的上限距离和下限距离的计算方法如下:
[0012]设所述已知的语音文件中,其中2段语音的4个长时共振峰测量数据为X1 和Y1,其中,
[0013][0014][0015]式中,x
F11
……
x
F1m
为第一段语音第一频率下第一至第m个共振峰数据, x
F21
……
x
F2m
为第一段语音第二频率下第一至第m个共振峰数据,x
F31
……
x
F3m
为第一段语音第三频率下第一至第m个共振峰数据,x
F41
……
x
F4m
为第一段语音第四频率下第一至第m个共振峰数据;y
F11
……
y
F1n
为第二段语音第一频率下第一至第n个共振峰数据,y
F21
……
y
F2n
为第二段语音第二频率下第一至第n 个共振峰数据,y
F31
……
y
F3n
为第二段语音第三频率下第一至第n个共振峰数据, y
F41
……
y
F4n
为第二段语音第四频率下第一至第n个共振峰数据;所述第一至第四频率为依次增大或依次减小的频率;
[0016]每一个长时共振峰测量数据矩阵的列数据组成一个共振峰矢量x
i
= [x
F1i x
F2i x
F3i x
F4i
]、y
i
=[y
F1i y
F2i y
F3i y
F4i
],针对第一段语音m个矢量和第二段语音n个矢量分别计算中心位置,令x
c
=[x
F1c x
F2c x
F3c x
F4c
]为 X1矩阵的中心,令y
c
=[y
F1c y
F2c y
F3c y
F4c
]为Y1矩阵的中心,根据聚类原理得到x
c
到x
i
的距离之和最小,因此通过求解如下最小问题得到x
c
和y
c

[0017][0018][0019]在x
c
和y
c
基础上,通过计算中心之间的欧氏距离来计算这两段语音的长时共振峰距离D
*

[0020][0021]从所述已知的语音文件中分别对不同段语音按上述方法计算两两之间的距离,取最大值和最小值作为所述的上限距离和下限距离
[0022]按上述方法,所述的计算检材语音的长时共振峰距离D的方法,与所述已知的语音文件中两段语音的长时共振峰距离D
*
的方法相同。
[0023]按上述方法,所述的假设检验法为t检验法,具体如下:
[0024]设所述检材语音的4个长时共振峰测量数据为Z1,其中
[0025][0026]式中,z
F11
……
z
F1j
为检材语音第一频率下第一至第j个共振峰数据, z
F21
……
z
F2j
为检材语音第二频率下第一至第j个共振峰数据,z
F31
……
z
F3j
为检材语音第三频率下第一至第j个共振峰数据,Z
F41
……
z
F4j
为检材语音第四频率下第一至第j个共振峰数据;
[0027]设x
F21
、x
F22
、x
F23

……
、x
F2m
服从形如N(u,σ2)的正态分布,z
F21
、z
F22
、 z
F23
……
z
F2j
服从形如N(v,σ2)的正态分布,按照统计理论第二频率下共振峰数据服从如下分布:
[0028][0029]其中x
F2mean
、S
x
分别为x
F21
、x
F22
、x
F23

……
、x
F2m
的均值和标准差, z
F2mean
、S
z
分别为z
F21
、z
F22
、z
F23
……
z
F2j
的均值和标准差;
[0030]给定信度α,当
[0031][0032]则判断该时段检材语音与已知语音文件具有同一性,否则判断该时段检材语音与已知语音文件不具有同一性。
[0033]一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现所述基于长时共振峰测量的语音同一性验证方法的步骤。
[0034]一种非暂态计算机可读存储介本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于长时共振峰测量的语音同一性验证方法,其特征在于:本方法包括:已知一份来自同一说话人的语音文件,计算已知的语音文件中,任意两段语音的长时共振峰数据之间的距离,获得上限距离和下限距离当采集到一份检材语音时,计算该检材语音与所述已知的语音文件的长时共振峰距离D,并进行以下判断:当判断该时段检材语音与已知语音文件具有同一性,即为同一说话人;当判断该时段检材语音与已知语音文件不具有同一性,即为不同说话人;当则采用假设检验法来对同一性进行验证。2.根据权利要求1所述的方法,其特征在于:所述的上限距离和下限距离的计算方法如下:设所述已知的语音文件中,其中2段语音的4个长时共振峰测量数据为X1和Y1,其中,设所述已知的语音文件中,其中2段语音的4个长时共振峰测量数据为X1和Y1,其中,式中,x
F11
……
x
F1m
为第一段语音第一频率下第一至第m个共振峰数据,x
F21
……
x
F2m
为第一段语音第二频率下第一至第m个共振峰数据,x
F31
……
x
F3m
为第一段语音第三频率下第一至第m个共振峰数据,x
F41
……
x
F4m
为第一段语音第四频率下第一至第m个共振峰数据;y
F11
……
y
F1n
为第二段语音第一频率下第一至第n个共振峰数据,y
F21
……
y
F2n
为第二段语音第二频率下第一至第n个共振峰数据,y
F31
……
y
F3n
为第二段语音第三频率下第一至第n个共振峰数据,y
F41
……
y
F4n
为第二段语音第四频率下第一至第n个共振峰数据;所述第一至第四频率为依次增大或依次减小的频率;每一个长时共振峰测量数据矩阵的列数据组成一个共振峰矢量x
i
=[x
F1i x
F2i x
F3i x
F4i
]、y
i
=[y
F1i y
F2i y
F3i y
F4i
],针对第一段语音m个矢量和第二段语音n个矢量分别计算中心位置,令x
c
=[x
F1c x
F2c x
F3c x
F4c
]为X1矩阵的中心,令y
c
=[y
F1c y
F2c y
F3c y
F4c
]为Y1矩阵的中心,根据聚类原理得到x
c
到x
i
的距离之和最小,因此通过求解如下最小问题得到x...

【专利技术属性】
技术研发人员:汤申亮张华军邓小涛王征华
申请(专利权)人:武汉大晟极科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1