复制语音的检测方法、装置、电子设备及存储介质制造方法及图纸

技术编号:36270810 阅读:42 留言:0更新日期:2023-01-07 10:12
本申请公开了一种复制语音的检测方法、装置、电子设备及存储介质,涉及音频处理领域,该方法包括:获取待检测语音数据;对所述待检测语音数据进行语音识别,确定所述待检测语音数据中的至少两个语音段,所述至少两个语音段具有相同语音内容;对所述至少两个语音段进行复制语音检测,获得复制语音检测结果,其中,所述复制语音检测结果包括所述至少两个语音段为复制语音段。本申请相较于直接对原始待检测语音数据进行复制片段的暴力检测,能够提高复制语音检测的效率,并且降低计算量。并且降低计算量。并且降低计算量。

【技术实现步骤摘要】
复制语音的检测方法、装置、电子设备及存储介质


[0001]本申请涉及音频处理领域,更具体地,涉及一种语音同一性的检验方法、装置、电子设备及存储介质。

技术介绍

[0002]语音复制是伪造录音证据的常用手段,因此复制语音的检测是法庭确定录音证据的真实性检验的重要内容。音频信号是一种随机信号,实际录音过程中,即使完全相同的音源,录制的音频数据也不可能完全相同。因此,当语音数据中存在两个完全相同的数据片段,则说明这两个相同片段一定是人为复制造成的。
[0003]目前,常见的复制语音的检测方法是通过对全部语音采样数据进行无遗漏的复制片段匹配检测,计算量巨大,对于较长的音频,复制语音的检测效率极低。如何提高复制语音的检测的效率成为目标亟待解决的问题。

技术实现思路

[0004]鉴于上述问题,本申请实施例提出了一种复制语音的检测方法、装置、电子设备及存储介质,以改善上述问题。
[0005]第一方面,本申请提供了一种复制语音的检测方法,该方法包括:获取待检测语音数据;对所述待检测语音数据进行语音识别,确定所述待检测语音数据中的至少两个语音段,所述至少两个语音段具有相同语音内容;对所述至少两个语音段进行复制语音检测,获得复制语音检测结果,其中,所述复制语音检测结果包括所述至少两个语音段为复制语音段。
[0006]第二方面,本申请提供了一种复制语音的检测装置,该装置包括:待检测语音数据获取模块,用于获取待检测语音数据;语音识别模块,用于对所述待检测语音数据进行语音识别,确定所述待检测语音数据中的至少两个语音段,所述至少两个语音段具有相同语音内容;复制语音检测模块,用于对所述至少两个语音段进行复制语音检测,获得复制语音检测结果,其中,所述复制语音检测结果包括所述至少两个语音段为复制语音段。
[0007]在一些实施例中,所述复制语音检测模块包括:特征第一提取子模块,用于对所述至少两个语音段进行特征提取,获得所述至少两个语音段各自对应的特征序列;壁纸确定子模块,用于确定所述至少两个语音段各自对应的特征序列之间的比值;复制语音段第一确定子模块,用于若所述比值为恒定值或者与恒定值之间的差值小于预设差值,则确定所述至少两个语音段为复制语音段。
[0008]在一些实施例中,所述复制语音段第一确定子模块包括:第一确定单元,用于若所述比值为所述恒定值,则根据所述恒定值确定所述至少两个语音段由复制和粘贴获得;第二确定单元,用于若所述比值与所述恒定值之间的差值小于预设差值,则根据所述预设差值确定所述至少两个语音段由复制、缩放、抖动、粘贴获得。
[0009]在一些实施例中,所述恒定值包括第一恒定值和第二恒定值,所述若所述比值为
所述恒定值,所述第一确定单元包括:第一确定子单元,用于若所述比值为第一恒定值,则确定所述至少两个语音段中的第一语音段由对所述至少两个语音段中的第二语音段进行复制后粘贴获得;或者第二确定子单元,用于若所述比值为第二恒定值,则确定所述至少两个语音段中的第一语音段由对所述至少两个语音段中的第二语音段依次进行复制和缩放后粘贴获得。
[0010]在一些实施例中,所述恒定值包括第三恒定值和第四恒定值,所述预设差值包括第一预设差值和第二预设差值,所述第二确定单元包括:第三确定子单元,用于若所述比值与第三恒定值之间的差值小于第一预设差值,则确定所述至少两个语音段中的第一语音段由对所述至少两个语音段中的第二语音段依次进行复制、缩放以及抖动后粘贴获得;或者第四确定子单元,用于若所述比值与第四恒定值之间的差值小于第二预设差值,则确定所述至少两个语音段中的第一语音段由对所述至少两个语音段中的第二语音段依次进行复制、抖动以及缩放后粘贴获得。
[0011]在一些实施例中,所述复制语音检测模块还包括:特征第二提取子模块,用于对所述至少两个语音段进行特征提取,获得所述至少两个语音段各自对应的特征序列;差值确定子模块,用于确定所述至少两个语音段各自对应的特征序列之间的差值;复制语音段第二确定子模块,用于若所述差值为恒定值或者所述差值位于预设差值范围内,则确定所述至少两个语音段为复制语音段。
[0012]在一些实施例中,所述复制语音段第二确定子模块包括:第五确定单元,用于若所述差值为第五恒定值,则确定所述至少两个语音段中的第一语音段由对所述至少两个语音段中的第二语音段进行复制后粘贴获得;或第六确定单元,用于若所述差值位于所述预设差值范围内,则确定所述至少两个语音段中的第一语音段由对所述至少两个语音段中的第二语音段依次进行复制和抖动后粘贴获得。
[0013]在一些实施例中,所述复制语音检测模块还包括:对齐子模块,用于对所述至少两个语音段各自对应的特征序列进行对齐,确定所述至少两个语音段各自对应的特征序列的对齐距离;目标序列确定子模块,用于根据所述对齐距离,确定所述至少两个语音段各自对应的特征序列对应的目标序列,其中,所述目标序列包括重叠差分序列和重叠比例序列中的至少一种;复制语音检测结果确定子模块,用于若所述目标序列符合对齐条件,则对所述目标序列进行复制语音检测,获得所述复制语音检测结果。
[0014]在一些实施例中,所述复制语音的检测装置还包括:语音时长确定模块,用于确定所述复制语音段在所述待检测语音数据中的时间戳,并根据所述时间戳确定所述复制语音段的语音时长;目标复制语音段确定模块,用于从所述复制语音段中确定语音时长大于预设时长的目标复制语音段。
[0015]第三方面,本申请实施例提供了一种电子设备,包括:处理器;存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,实现如上所述的复制语音的检测方法。
[0016]第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机可读指令,当所述计算机可读指令被处理器执行时,实现如上所述的复制语音的检测方法。
[0017]在本申请的方案中,通过对待检测语音数据进行语音识别,以提取具有相同语音内容的至少两个语音段,进而能够根据该至少两个语音段进行复制语音检测,以此确定该
待检测语音数据对应的复制语音检测结果。本申请相较于直接对原始待检测语音数据进行复制片段的暴力检测,能够提高复制语音检测的效率,并且降低计算量。
[0018]应当理解的是,以上的一般描述和后文细节描述仅是示例性和解释性的,并不能限制本专利技术。
附图说明
[0019]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0020]图1是根据本申请一实施例示出的复制语音的检测方法的流程示意图。
[0021]图2是本申请另一实施例示出的复制语音的检测方法的流程示意图。
[0022]图3是根据本申请一实施例示出的步骤250的具体步骤流程示意图。
[0023]图4是本申请再一本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种复制语音的检测方法,其特征在于,所述方法包括:获取待检测语音数据;对所述待检测语音数据进行语音识别,确定所述待检测语音数据中的至少两个语音段,所述至少两个语音段具有相同语音内容;对所述至少两个语音段进行复制语音检测,获得复制语音检测结果,其中,所述复制语音检测结果包括所述至少两个语音段为复制语音段。2.根据权利要求1所述的方法,其特征在于,所述对所述至少两个语音段进行复制语音检测,获得复制语音检测结果,包括:对所述至少两个语音段进行特征提取,获得所述至少两个语音段各自对应的特征序列;确定所述至少两个语音段各自对应的特征序列之间的比值;若所述比值为恒定值或者与恒定值之间的差值小于预设差值,则确定所述至少两个语音段为复制语音段。3.根据权利要求2所述的方法,其特征在于,所述若所述比值为恒定值或者与恒定值之间的差值小于预设差值,则确定所述至少两个语音段为复制语音段,包括:若所述比值为所述恒定值,则根据所述恒定值确定所述至少两个语音段由复制和粘贴获得;若所述比值与所述恒定值之间的差值小于预设差值,则根据所述预设差值确定所述至少两个语音段由复制、缩放、抖动和粘贴获得。4.根据权利要求3所述的方法,其特征在于,所述恒定值包括第一恒定值和第二恒定值,所述若所述比值为所述恒定值,则根据所述恒定值确定所述至少两个语音段由复制和粘贴获得,包括:若所述比值为所述第一恒定值,则确定所述至少两个语音段中的第一语音段由对所述至少两个语音段中的第二语音段进行复制后粘贴获得;或者若所述比值为所述第二恒定值,则确定所述至少两个语音段中的第一语音段由对所述至少两个语音段中的第二语音段依次进行复制和缩放后粘贴获得。5.根据权利要求3所述的方法,其特征在于,所述恒定值包括第三恒定值和第四恒定值,所述预设差值包括第一预设差值和第二预设差值,所述若所述比值与所述恒定值之间的差值小于预设差值,则根据所述预设差值确定所述至少两个语音段由复制、缩放、抖动、粘贴获得,包括:若所述比值与所述第三恒定值之间的差值小于所述第一预设差值,则确定所述至少两个语音段中的第一语音段由对所述至少两个语音段中的第二语音段依次进行复制、缩放以及抖动后粘贴获得;或者若所述比值与所述第四恒定值之间的差值小于所述第二预设差值,则确定所述至少两个语音段中的第一语音段由对所述至少两个语音段中的第二语音段依次进行复制、抖动以及缩放后粘贴获得。6.根据权利要求1所述的方法,其特征在于,所述对所述至少两个语音段进行复制语音检测,获得复制语音检测结果包括:对所述至少两个语音段进行特征提取...

【专利技术属性】
技术研发人员:陈东鹏丁俊豪范恒胜
申请(专利权)人:深圳市声扬科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1