System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 音频设备来源取证的开集识别方法、系统及计算机设备技术方案_技高网
当前位置: 首页 > 专利查询>西北大学专利>正文

音频设备来源取证的开集识别方法、系统及计算机设备技术方案

技术编号:41294987 阅读:6 留言:0更新日期:2024-05-13 14:44
本发明专利技术属于音频设备来源取证技术领域,公开了一种音频设备来源取证的开集识别方法、系统及计算机设备,通过计算基于残差网络模型生成特征值和基于双向长短期记忆网络生成类原型的相似值,从而实现音频设备来源取证的开集识别。为了使模型具有对已知样本进行分类的判别能力,使用了基于距离的交叉熵损失训练。为了提高模型对未知的鲁棒性,使用了L2正则化作为原型损失,交叉熵损失和原型损失的结合使残差网络模型成为一个混合模型,在闭集识别和开集识别方面都具有优势。本发明专利技术对于模型在OSR中的应用,提出了基于距离的拒绝规则,从而实现开集识别;所提出的框架在该领域唯一公开可用的数据集MOBIPHONE上总体精确度为93%。

【技术实现步骤摘要】

本专利技术属于音频设备来源取证,尤其涉及一种音频设备来源取证的开集识别方法、系统及计算机设备


技术介绍

1、目前,近年来,数字媒体技术的不断发展,使得修改伪造音频变得更加容易,因此音频取证技术变得越来越重要。数字音频取证的研究方向可分为录音设备来源取证、说话人识别取证、音频篡改检测、重压缩与重采样检测、音频隐写分析等。录音设备来源取证技术是音频取证技术的一个很有前途的分支,它可以验证所获得证据的真实性和唯一性。

2、录音设备来源识别作为被动音频取证技术的一部分,一般被应用于司法领域。在法庭上,当语音文件被作为证据时,通常需要对录制该语音文的设备来源做判定,因此录音设备源识别技术具有研究意义。录音设备源识别本质是通过不同录音设备录制的录音文件中所嵌入的设备指纹信息来确定其录音是由哪个品牌中的哪个型号设备所录制的,甚至能精确到同品牌同型号的哪个体录音设备。由于不同录音设备使用不同的信号采集功能的设备,因此录音文件会被嵌入有差异的相关录音设备信息,此差异信息可应用于录音设备来源取证的研究。

3、最开始,录音设备来源识别主要通过传统分类器对记录设备进行分类。现如今,深度学习在各个领域都取得了良好的效果,越来越多的专家将深度学习方法应用于音频设备识别领域。

4、但是录音设备来源识别技术有了一定的发展,也存在一定的局限性。在实际生活中,所得到的音频,是不知道录音设备的具体身份,它在开放环境中处理未知(已知类外的未知)时仍然缺乏鲁棒性。因此录音设备来源的开放集识别,更具有现实意义和挑战性。开放集识别(open set recognition,osr)是依据真实场景提出的研究方向,要求模型在没有任何辅助信息时,不仅能分类见过的类别,还能准确识别新出现的类别。这一要求打破了传统封闭环境下识别的限制,建立模型的过程中人们不需要花费大量的时间和金钱收集标记样本甚至辅助信息.而且,osr问题更贴近真实场景中新类不断出现的现实.

5、很多应用问题本身就具有开放集识别特性,例如在音频设备识别中,如果将音频当作证据呈上法庭时在法庭上,通常需要对录制该语音文的设备来源做判定,因此录音设备源识别技术具有研究意义。录音设备源识别本质是通过不同录音设备录制的录音文件中所嵌入的设备指纹信息来确定其录音是由哪个品牌中的哪个型号设备所录制的,甚至能精确到同品牌同型号的哪个体录音设备。在做设备取证时候,训练数据集必须是完备的,可这一点往往会受到现实情况的限。但是目前由于录音设备的增多,在现实情况下,训练集不将将所有的录音设备概括进去,在做测试时,测试集中很会出现训练集中没有的类别,从而使得在确定该录音是使用什么设备录制时,导致分类错误。因此在开放环境下对音频设备来源进行识别是一项很大的挑战。

6、通过上述分析,现有技术存在的问题及缺陷为:现有技术音频设备来源取证闭集识别,对于音频设备来源取证的开集识别关注较少。


技术实现思路

1、针对现有技术存在的问题,本专利技术提供了一种音频设备来源取证的开集识别方法、系统及计算机设备。

2、本专利技术是通过提出基于双向长短期记忆网络来生成类原型,并结合基于距离的交叉熵损失和原型损失函数训练模型,并通过基于距离的拒绝规则来实现音频设备来源取证的开集识别。所述音频设备来源取证的开集识别方法通过计算基于残差网络模型生成特征值和基于双向长短期记忆网络生成类原型的相似值,实现音频设备来源取证的开集识别;使用基于距离的交叉熵损失和l2正则化作为原型损失训练残差网络模型;

3、进一步,所述音频设备来源取证的开集识别方法,包括以下步骤:

4、第一步,对音频进行处理,得到语音的频域特征,将语音进行短时傅里叶变换,从而得到语音的频域特征;

5、第二步,将处理后得到的音频输入到残差网络中,使用基于距离的交叉熵损失和原型损失pl的原型损失函数相结合以训练模型;

6、第三步,随后将通过残差网络得到的实例f(x;θ)通过双向长短期记忆网络生成类原型;

7、第四步,通过将得到的特征与所有原型进行匹配进行识别。

8、进一步,所述第二步,具体处理方法包括:

9、(1)通过欧式距离衡量特征值与类原型之间的相似度:

10、

11、其中f(x)是特征值与mij是类原型,xi表示数据的特征,yi表示原型。

12、(2)通过计算特征值f(x)与所有类原型mij之间的距离,样本属于某一类的概率通过相应的距离来测量;通过相应的距离来测量某一样本属于某一类原型,并且通过softmax的类似方式对概率进行归一化:

13、

14、给定p(x∈mij|x)的定义,进一步将p(y|x)的概率定义为:

15、

16、其中k为每一类中原型的数量;

17、(3)基于p(y|x)的概率,将基于距离的交叉熵dce损失定义为:

18、l((x,y);θ,{mij})=-log p(y|x)

19、(4)原型损失定义为:

20、

21、(5)模型使用两个损失函数的加和作为总的损失函数;

22、

23、其中cyi表示第yi个原型中心。

24、进一步,所述第三步,具体处理方法包括:

25、(1)在获取到的训练实例中,根据标签来找索引,获取嵌入实例,数据形状通常为(n,l),n为类别数量,l为经过嵌入函数输出的维度,并且其中的每个元素都是从嵌入实例获取的索引;

26、(2)将嵌入实例进行扩维,扩维后其形状变为(1,n,l),随后将嵌入实例作为inputs及嵌入实例第一维度的长度n输入到双向长短期记忆网络中;

27、(3)lstm的输出为output、hn和cn,其中output的形状为(1,l,2n);

28、(4)在backward层沿着时刻t到时刻1反向计算一遍,得到每个时刻向后隐藏层的输出,每个bilstm单元的输入和隐藏层输出之间的相加来产生类原型。

29、进一步,所述第四步,具体处理方法包括:

30、(1)首先获取样本x与类别原型之间的距离,gi(x)表示距离最小值:

31、

32、(2)对于测试样本x,如果满足一下公式,则代表其为已知类别,则进行预测,看其属于哪一已知类别。否则将其分配给已知类:

33、gi(x)<t

34、(3)根据gi(x)的定义,方程也可等价为,方程的左边部分是深度特征f(x;θ)到最近的原型的距离,因此这种未知的检测规则被称为基于距离的拒绝:

35、

36、进一步,所述第四步,还包括在对数据集进行测试时,将所得到的特征计算与类原型之前的距离,随后取最小值,当最小值小于阈值t,那就归为已知类别,并对其进行分类,如果大于阈值t,那就将其归为未知类别,实现音频设备的开集识别。

37、本专利技术的本文档来自技高网...

【技术保护点】

1.一种音频设备来源取证的开集识别方法,其特征在于,所述音频设备来源取证的开集识别方法通过计算基于残差网络模型生成特征值和基于长短期记忆网络下生成类原型的相似值,实现音频设备来源取证的开集识别;使用基于距离的交叉熵损失训练;使用L2正则化作为原型损失,交叉熵损失和原型损失的结合使残差网络模型成为一个混合模型。

2.如权利要求1所述的音频设备来源取证的开集识别方法,其特征在于,所述音频设备来源取证的开集识别方法,包括以下步骤:

3.如权利要求2所述的音频设备来源取证的开集识别方法,其特征在于,所述第二步,具体处理方法包括:

4.如权利要求2所述的音频设备来源取证的开集识别方法,其特征在于,所述第三步,具体处理方法包括:

5.如权利要求2所述的音频设备来源取证的开集识别方法,其特征在于,所述第四步,具体处理方法包括:

6.如权利要求2所述的音频设备来源取证的开集识别方法,其特征在于,所述第四步,还包括在对数据集进行测试时,将所得到的特征计算与类原型之前的距离,随后取最小值,当最小值小于阈值T,那就归为已知类别,并对其进行分类,如果大于阈值T,那就将其归为未知类别,实现音频设备的开集识别。

7.一种计算机设备,其特征在于,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行权利要求1~6任意一项所述音频设备来源取证的开集识别方法。

8.一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行权利要求1~6任意一项所述音频设备来源取证的开集识别方法。

9.一种信息数据处理终端,其特征在于,所述信息数据处理终端用于实现权利要求1~6任意一项所述音频设备来源取证的开集识别方法。

10.一种基于权利要求1~6任意一项所述音频设备来源取证的开集识别方法的音频设备来源取证的开集识别系统,其特征在于,所述音频设备来源取证的开集识别系统包括:

...

【技术特征摘要】

1.一种音频设备来源取证的开集识别方法,其特征在于,所述音频设备来源取证的开集识别方法通过计算基于残差网络模型生成特征值和基于长短期记忆网络下生成类原型的相似值,实现音频设备来源取证的开集识别;使用基于距离的交叉熵损失训练;使用l2正则化作为原型损失,交叉熵损失和原型损失的结合使残差网络模型成为一个混合模型。

2.如权利要求1所述的音频设备来源取证的开集识别方法,其特征在于,所述音频设备来源取证的开集识别方法,包括以下步骤:

3.如权利要求2所述的音频设备来源取证的开集识别方法,其特征在于,所述第二步,具体处理方法包括:

4.如权利要求2所述的音频设备来源取证的开集识别方法,其特征在于,所述第三步,具体处理方法包括:

5.如权利要求2所述的音频设备来源取证的开集识别方法,其特征在于,所述第四步,具体处理方法包括:

6.如权利要求2所述的音频设备来源取证的开集识别方法,其特征在于,所述第四步,还包括在对数据...

【专利技术属性】
技术研发人员:孟宪佳丁勤勤易江燕陈佳林
申请(专利权)人:西北大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1