语音同一性的检验方法、装置、电子设备及存储介质制造方法及图纸

技术编号:36181389 阅读:15 留言:0更新日期:2022-12-31 20:38
本申请公开了一种语音同一性的检验方法、装置、电子设备及存储介质,该方法包括:获取待检验语音片段和样本语音片段;分别确定待检验语音片段中的第一语音子片段和样本语音片段中的第二语音子片段;分别提取第一语音子片段的第一特征和第二语音子片段的第二特征,并根据第一特征确定第一特征曲线以及根据第二特征确定第二特征曲线;确定第一特征曲线和第二特征曲线之间的相似度,并根据相似度确定待检验语音片段和样本语音片段的同一性的检验结果。本申请能够根据不同语音片段的发声者在连续语流子片段中表现出来的语音个性特征及其相似度来确定不同语音片段是否来自同一发声者,提高了语音同一性的准确性。提高了语音同一性的准确性。提高了语音同一性的准确性。

【技术实现步骤摘要】
语音同一性的检验方法、装置、电子设备及存储介质


[0001]本申请涉及音频处理领域,更具体地,涉及一种语音同一性的检验方法、装置、电子设备及存储介质。

技术介绍

[0002]语音同一性检验是指通过对两段输入语音进行比对分析,确定两段输入语音是否来自同一人。目前,在语音同一性认定过程中,是根据单个音节(单个韵母或单个字)的声纹特征来对语音的同一性进行判断,但是单音节的声纹特征并不能反映说话人语音特征的全貌,进而语音同一性检验的准确度不高,导致同一性检验结果的可靠性不高。因此,如何全面而准确地反映说人话的语音特征以提高语音同一性检验的准确性称为亟待解决的问题。

技术实现思路

[0003]鉴于上述问题,本申请实施例提出了一种语音同一性的检验方法、装置、电子设备及存储介质,以改善上述问题。
[0004]第一方面,本申请实施例提供了一种语音同一性的检验方法,该方法包括:获取待检验语音片段和样本语音片段;分别确定所述待检验语音片段中的第一语音子片段和所述样本语音片段中的第二语音子片段,其中,所述第一语音子片段和所述第二语音子片段是具有相同音素序列的语音子片段;分别提取所述第一语音子片段的第一特征和所述第二语音子片段的第二特征,并根据所述第一特征确定第一特征曲线以及根据所述第二特征确定第二特征曲线;确定所述第一特征曲线和所述第二特征曲线之间的相似度,并根据所述相似度确定所述待检验语音片段和所述样本语音片段的同一性的检验结果。
[0005]第二方面,本申请实施例提供了一种语音同一性的检验装置,该装置包括:获取模块,用于获取待检验语音片段和样本语音片段;语音子片段确定模块,用于分别确定所述待检验语音片段中的第一语音子片段和所述样本语音片段中的第二语音子片段,其中,所述第一语音子片段和所述第二语音子片段是具有相同音素序列的语音子片段;特征提取模块,用于分别提取所述第一语音子片段的第一特征和所述第二语音子片段的第二特征,并根据所述第一特征确定第一特征曲线以及根据所述第二特征确定第二特征曲线;确定模块,用于确定所述第一特征曲线和所述第二特征曲线之间的相似度,并根据所述相似度确定所述待检验语音片段和所述样本语音片段的同一性的检验结果。
[0006]在一些实施例中,该语音同一性的检验装置还包括:时间戳确定模块,用于分别确定所述第一特征曲线中各音素的时间戳和所述第二特征曲线中各音素的时间戳;对齐模块,用于根据所述第一特征曲线中各音素的时间戳和所述第二特征曲线中各音素的时间戳,将所述第一特征曲线和所述第二特征曲线中的相同音素进行对齐。
[0007]在一些实施例中,所述第一特征曲线包括第一基频特征曲线,确定模块包括:峰值点序列第一确定单元,用于根据所述第一基频特征曲线中的各峰值点确定第一峰值序列,以及根据所述第二基频特征曲线中的各峰值点确定第二峰值点序列;位置信息确定单元,
用于确定所述第一峰值点序列中各峰值点的第一位置信息和所述第二峰值点序列中各峰值点的第二位置信息;第一差值确定单元,用于根据所述第一位置信息和所述第二位置信息,确定所述第一峰值点序列和所述第二峰值点序列中各对应峰值点的位置偏差的均值和所述第一峰值点序列和所述第二峰值点序列中各对应峰值点的位置偏差的方差;第一相似度确定单元,用于根据所述均值和所述方差确定所述第一基频特征曲线和所述第二基频特征曲线之间的相似度。
[0008]在一些实施例中,所述第一特征曲线包括第一过零率特征曲线,所述第二特征曲线包括第二过零率特征曲线;确定模块包括:峰值点序列第二确定单元,用于根据所述第一过零率特征曲线中的各峰值点确定第三峰值点序列,以及根据所述第二过零率特征曲线中的各峰值点确定第四峰值点序列;数量获取单元,用于获取所述第三峰值点序列的峰值点的第一数量和所述第四峰值点序列的峰值的第二数量;数量差确定单元,用于确定所述第一数量和所述第二数量的数量差;第二相似度确定单元,用于根据所述数量差确定所述第一过零率特征曲线和所述第二过零率特征曲线之间的相似度。
[0009]在一些实施例中,所述第一特征曲线包括第一能量特征曲线,所述第二特征曲线包括第二能量特征曲线;确定模块包括:峰值点序列第三确定单元,用于根据所述第一能量特征曲线中的各峰值点确定第五峰值点序列,以及根据所述第二能量特征曲线中的各峰值点确定第六峰值点序列;强度值确定单元,用于确定所述第五峰值点序列中各峰值点对应的强度值和所述第六峰值点序列中各峰值点对应的强度值;第二差值确定单元,用于确定所述第五峰值点序列中各峰值点对应的强度值的第一均值和第一方差,以及确定所述第六峰值点序列中各峰值点对应的强度值的第二均值和第二方差;第三差值确定单元,用于确定所述第一均值和第二均值的均值差,并确定所述第一方差和所述第二方差的方差差;第三相似度确定单元,用于根据所述均值差和所述方差差确定所述第一能量特征曲线和所述第二能量特征曲线之间的相似度。
[0010]在一些实施例中,确定模块还包括:归一化模块,用于对所述第一能量特征曲线进行归一化处理获得归一化后的第一能量特征曲线,并对所述第二能量特征曲线进行归一化处理获得归一化后的第二能量特征曲线。
[0011]在一些实施例中,确定模块还包括:确定单元,用于确定所述相似度是否大于相似度阈值;同一性确定单元,用于若所述相似度大于所述相似度阈值,则确认所述待检验语音片段和所述样本语音片段归属于同一对象。
[0012]第三方面,本申请实施例提供了一种电子设备,包括:处理器;存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,实现如上所述的语音同一性的检验的方法。
[0013]第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机可读指令,当所述计算机可读指令被处理器执行时,实现如上所述的语音同一性的检验的方法。
[0014]在本申请的方案中,通过确定待检验语音片段和样本语音片段中具有相同音素序列的两个语音子片段,然后提取具有相同音素序列的两个语音子片段中的语音特征并生成对应的两个特征曲线,再确定两个特征曲线之间的相似度,最后根据该相似度来确定待检验语音片段和样本语音片段的同一性的检验结果。本申请能够根据不同语音片段的发声者
在连续语流子片段中表现出来的语音个性特征及其相似度来确定不同语音片段是否来自同一发声者,提高了语音同一性的准确性。
[0015]应当理解的是,以上的一般描述和后文细节描述仅是示例性和解释性的,并不能限制本专利技术。
附图说明
[0016]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0017]图1是根据本申请一实施例示出的语音同一性的检验的方法的流程示意图。
[0018]图2是根据本申请一实施例示出的步骤140的具体步骤流程示意图。
[00本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音同一性的检验方法,其特征在于,所述方法包括:获取待检验语音片段和样本语音片段;分别确定所述待检验语音片段中的第一语音子片段和所述样本语音片段中的第二语音子片段,其中,所述第一语音子片段和所述第二语音子片段是具有相同音素序列的语音子片段;分别提取所述第一语音子片段的第一特征和所述第二语音子片段的第二特征,并根据所述第一特征确定第一特征曲线以及根据所述第二特征确定第二特征曲线;确定所述第一特征曲线和所述第二特征曲线之间的相似度,并根据所述相似度确定所述待检验语音片段和所述样本语音片段的同一性的检验结果。2.根据权利要求1所述的方法,其特征在于,在所述确定所述第一特征曲线和所述第二特征曲线之间的相似度之前,所述方法还包括:分别确定所述第一特征曲线中各音素的时间戳和所述第二特征曲线中各音素的时间戳;根据所述第一特征曲线中各音素的时间戳和所述第二特征曲线中各音素的时间戳,将所述第一特征曲线和所述第二特征曲线中的相同音素进行对齐。3.根据权利要求1所述的方法,其特征在于,所述第一特征曲线包括第一基频特征曲线,所述第二特征曲线包括第二基频特征曲线;所述确定所述第一特征曲线和所述第二特征曲线之间的相似度包括:根据所述第一基频特征曲线中的各峰值点确定第一峰值点序列,以及根据所述第二基频特征曲线中的各峰值点确定第二峰值点序列;确定所述第一峰值点序列中各峰值点的第一位置信息和所述第二峰值点序列中各峰值点的第二位置信息;根据所述第一位置信息和所述第二位置信息,确定所述第一峰值点序列和所述第二峰值点序列中各对应峰值点的位置偏差的均值和所述第一峰值点序列和所述第二峰值点序列中各对应峰值点的位置偏差的方差;根据所述均值和所述方差确定所述第一基频特征曲线和所述第二基频特征曲线之间的相似度。4.根据权利要求1所述的方法,其特征在于,所述第一特征曲线包括第一过零率特征曲线,所述第二特征曲线包括第二过零率特征曲线;所述确定所述第一特征曲线和所述第二特征曲线之间的相似度包括:根据所述第一过零率特征曲线中的各峰值点确定第三峰值点序列,以及根据所述第二过零率特征曲线中的各峰值点确定第四峰值点序列;获取所述第三峰值点序列的峰值点的第一数量和所述第四峰值点序列的峰值的第二数量;确定所述第一数量和所述第二数量的数量差;根据所述数量差确定所述第一过零率特征曲线和所述第二过零率特征曲线之间的相似度。5.根据权利要求1所述方法,其特征在于,所述第一特征曲线包括第一能量特征曲线,所述第二特征曲线包括第二能量特征...

【专利技术属性】
技术研发人员:丁俊豪陈东鹏
申请(专利权)人:深圳市声扬科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1