一种手机录音的设备来源辨识方法技术

技术编号:16429354 阅读:353 留言:0更新日期:2017-10-22 02:09
本发明专利技术提供的手机录音的设备来源辨识方法通过频带能量差特征来进行设备来源辨识,由于频带能量差特征能够表征设备相邻频带响应的平均强弱程度,因此可以利用分类器技术来对手机录音的设备来源进行辨识。

A device source identification method for mobile phone recording

The source identification device provided by the invention mobile phone recording by the band energy difference characteristic of source identification equipment, due to the band energy difference feature can average degree of adjacent frequency response characterization equipment, so we can use technology to the mobile phone classifier recording equipment source identification.

【技术实现步骤摘要】
一种手机录音的设备来源辨识方法
本专利技术涉及多媒体信号处理
,更具体地,涉及一种手机录音的设备来源辨识方法。
技术介绍
在司法取证过程中,一个很重要的取证环节是鉴定信息来源。通常每一件物证都需要做来源的鉴定。对于多媒体信息而言,其来源通常是获取信息的设备。譬如对于图像来说,其来源于摄像机或者数码相机,音频来源于录音机或录音笔等。近年来,智能手机的快速发展,使得用户可以很方便地用手机进行录影或者录音。因此对手机的录音来源进行认证,也成了一项重要的取证任务。手机源辨识,主要包含两种典型任务,识别任务及鉴定任务:(1)来源识别任务:识别任务是具有先验知识的辨识问题,已知某段录音的录制设备属于一组已知的手机中的某一个,任务是识别出哪一个手机是该段录音的录制设备。(2)来源鉴定任务:鉴定任务是没有先验知识的辨识问题,给定某一段录音以及一个手机设备,要求鉴定此段录音是否真的来源于此手机。音频设备辨识技术发展得较慢,最近几年才开始有学者开展相关的研究工作。国外学者Kraetzer和Dittmann在麦克风鉴定工作方面有着较为深入的研究,他们在文献[1]中第一次提出了估计麦克风的型号以及环境的位置(提取了隐写分析技术中常用的7个音频时域统计量及基于梅尔倒谱的56维系数特征),对于几款麦克风设备的识别任务准确率为75%左右;随后,他们又提出一种频谱系数统计方法[2],首先从音频的“近静音帧”中提取其频谱系数作为特征,然后使用SVM分类器进行分类,对七款麦克风的识别任务可达93.5%的准确率;在他们的另一个文献[3]中,详细地分析了大量分类器及分类特征在麦克风分类问题上的性能。Espy-Wilson等[4]也提出了一种基于不同的内在统计特性的方法用于分类8个电话语音及8个麦克风的语音,准确率达到90%以上。最近的工作是文献[5]在MFCC系数的基础上建立了高斯超向量(GSV),并利用它的稀疏特性来分类手机录音设备的指纹。目前,由于对音频的理解还比较抽象,此类工作暂时未能指明所提取的特征的物理意义。因此也难以深入研究所提出的特征对于研究音频来源辨识问题的确切作用。另外,以上所提及的文献中,实验中使用的设备数量最多只有22个,更大规模的实验有待测试。参考文献:[1]KraetzerC,OermannA,DittmannJ,etal.Digitalaudioforensics:afirstpracticalevaluationonmicrophoneandenvironmentclassification[C].Proceedingsofthe9thworkshoponMultimediaandSecurity,2007:63-74.[2]BuchholzR,KraetzerC,DittmannJ.Microphoneclassificationusingfouriercoefficients[C].InProceedingsofthe11thWorkshoponInformationHiding,2009:235-246.[3]KraetzerC,QianK,SchottM,DittmannJ.Acontextmodelformicrophoneforensicsanditsapplicationinevaluations[C].IS&T/SPIEElectronicImaging.InternationalSocietyforOpticsandPhotonics,2011,78800P-78800P-15.[4]Garcia-RomeroD,Espy-WilsonCY.Automaticacquisitiondeviceidentificationfromspeechrecordings[C].InProceedingsofInternationalConferenceonAcousticsSpeechandSignalProcessing,2010:1806-1809.[5]ZouL,HeQ,WuJ.Sourcecellphoneverificationfromspeechrecordingsusingsparserepresentation[J].DigitalSignalProcessing,2017(62):125-136.
技术实现思路
本专利技术提供的方法对录音的波形信号进行分析,提出“频带能量差特征”,它是能够有效刻画“录音设备频率响应特性”的指纹特征,然后利用分类器进行分类,可以有效地进行手机录音设备辨识(包括识别任务及鉴定任务)。本专利技术可协助音频取证司法部门的取证过程,提高取证的效率。为实现以上专利技术目的,采用的技术方案是:一种手机录音的设备来源辨识方法,包括以下步骤:S1.对若干训练样本按照(1)~(5)的方式进行特征的提取,然后基于提取的特征对分类器进行训练;S2.对测试样本按照(1)~(5)的方式进行特征的提取,然后将测试样本提取的特征输入至训练好的分类器内,分类器输出分类结果,实现对测试样本的设备来源辨识;(1)对于一段训练样本/测试样本,将其平均分为T帧音频帧,并为每一帧音频帧加汉明窗;(2)对音频帧求取其傅里叶窄带频谱,得到音频帧的傅里叶频域系数;(3)对于音频帧的傅里叶频域系数,求取其相邻的两个系数之间的差值;(4)令(3)中得到的相邻的两个系数之间的差值进行二值化,得到音频帧的二值化信号;(5)对训练样本/测试样本中的每一帧音频帧执行步(2)~(4)的操作,得到每一帧音频帧的二值化信号,将训练样本/测试样本中的所有音频帧的二值化信号在“帧”的维度上求均值,得到训练样本/测试样本的特征。与现有技术相比,本专利技术的有益效果是:本专利技术提供的方法通过频带能量差特征来进行设备来源辨识,由于频带能量差特征能够表征设备相邻频带响应的平均强弱程度,因此可以利用分类器技术来对手机录音的设备来源进行辨识。附图说明图1为频带能量差特征的示意图。图2为特征识别分类的t-SNE示意图。图3为用于识别任务的SVM检测框架示意图。图4为用于鉴定任务的SVM检测框架示意图。图5为识别任务的平均检测准确率的示意图。图6在CC数据集上识别任务的检测准确率及比较结果的示意图。图7为在CC数据集上识别31部手机的准确率的示意图。图8为在UC数据集上识别141部手机的准确率分布图。图9为在CC数据集上鉴定任务的正检率(TPR)及误报率(FPR)的示意图。图10为在CC数据集上鉴定任务的ROC曲线的比较图。图11为在UC数据集上鉴定任务的实验结果图。具体实施方式附图仅用于示例性说明,不能理解为对本专利的限制;以下结合附图和实施例对本专利技术做进一步的阐述。实施例1本专利技术提供的方法无论是对测试样本,抑或是对训练样本,均是通过同样的方式来进行特征提取的。其中所述测试样本或训练样本是通过不同手机采集录音所获得的录音文件,其被存储为无压缩的WAV格式文件,经过裁剪后形成若干2秒钟长度的录音片段。其中对测试样本或对训练样本进行特征提取的具体过程如下:a)测试样本/训练样本首先被分帧,得到若干帧音频帧,然后为每一帧音频帧加汉明窗。记测试样本/训练样本为s,帧长度为N=256,将测试样本/训练样本分成为T帧音频帧,每帧音频帧记为s(t)本文档来自技高网
...
一种手机录音的设备来源辨识方法

【技术保护点】
一种手机录音的设备来源辨识方法,其特征在于:包括以下步骤:S1.对若干训练样本按照(1)~(5)的方式进行特征的提取,然后基于提取的特征对分类器进行训练;S2.对测试样本按照(1)~(5)的方式进行特征的提取,然后将测试样本提取的特征输入至训练好的分类器内,分类器输出分类结果,实现对测试样本的设备来源辨识;(1)对于一段训练样本/测试样本,将其平均分为T帧音频帧,并为每一帧音频帧加汉明窗;(2)对音频帧求取其傅里叶窄带频谱,得到音频帧的傅里叶频域系数;(3)对于音频帧的傅里叶频域系数,求取其相邻的两个系数之间的差值;(4)令(3)中得到的相邻的两个系数之间的差值进行二值化,得到音频帧的二值化信号;(5)对训练样本/测试样本中的每一帧音频帧执行步(2)~(4)的操作,得到每一帧音频帧的二值化信号,将训练样本/测试样本中的所有音频帧的二值化信号在“帧”的维度上求均值,得到训练样本/测试样本的特征。

【技术特征摘要】
1.一种手机录音的设备来源辨识方法,其特征在于:包括以下步骤:S1.对若干训练样本按照(1)~(5)的方式进行特征的提取,然后基于提取的特征对分类器进行训练;S2.对测试样本按照(1)~(5)的方式进行特征的提取,然后将测试样本提取的特征输入至训练好的分类器内,分类器输出分类结果,实现对测试样本的设备来源辨识;(1)对于一段训练样本/测试样本,将其平均分为T帧音频帧,并为每一帧音频帧加汉明窗;(2)对音频帧求取其傅里叶窄带频谱,得到音频帧的傅里叶频域系数;(3)对于音频帧的傅里叶频域系数,求取其相邻的两个系数之间的差值;(4)令(3)中得到的相邻的两个系数之间的差值进行二值化,得到音频帧的二值化信号;(5)对训练样本/测试样本中的每一帧音频帧执行步(2)~(4)的操作,得到每一帧音频帧的二值化信号,将训练样本/测试样本中的所有...

【专利技术属性】
技术研发人员:罗达黄继武
申请(专利权)人:东莞理工学院深圳大学
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1