当前位置: 首页 > 专利查询>宁波大学专利>正文

基于比例因子系数差值的AAC双压缩音频检测方法技术

技术编号:21161593 阅读:76 留言:0更新日期:2019-05-22 08:27
本发明专利技术公开了一种基于比例因子系数差值的AAC双压缩音频检测方法,其获取AAC单压缩音频和AAC双压缩音频;然后获取AAC单压缩音频的第一特征向量和第二特征向量,及AAC双压缩音频的第一特征向量和第二特征向量;再融合AAC单压缩音频的第一特征向量和第二特征向量得到AAC单压缩音频的特征向量,融合AAC双压缩音频的第一特征向量和第二特征向量得到AAC双压缩音频的特征向量;利用特征向量进行LIBSVM分类器训练;利用LIBSVM分类器模型对待检测的AAC音频的特征向量进行测试;优点是其能实现低码率转高码率的AAC双压缩音频及同码率的AAC双压缩音频的有效检测,且检测准确率高、计算复杂度较低、鲁棒性较强。

AAC Dual Compressed Audio Detection Method Based on the Difference of Scale Factor Coefficient

The invention discloses an AAC dual-compression audio detection method based on the difference of proportional factor coefficients, which obtains AAC single-compression audio and AAC double-compression audio; then obtains the first and second eigenvectors of AAC single-compression audio, and the first and second eigenvectors of AAC double-compression audio; and then fuses the first eigenvector and the second eigenvector of AAC single-compression audio. The feature vectors of AAC single compressed audio are obtained quantitatively, and the first and second feature vectors of AAC double compressed audio are fused to get the feature vectors of AAC double compressed audio; the LIBSVM classifier is trained by using the feature vectors; the feature vectors of AAC audio to be detected are tested by using the LIBSVM classifier model; the advantage is that the AAC double compressed audio and the AAC double compressed audio with low bit rate to high bit rate can be realized. AAC dual compression audio detection with the same bit rate has high detection accuracy, low computational complexity and strong robustness.

【技术实现步骤摘要】
基于比例因子系数差值的AAC双压缩音频检测方法
本专利技术涉及一种音频双压缩检测技术,尤其是涉及一种基于比例因子系数差值的AAC(AdvancedAudioCoding,高级音频编码)双压缩音频检测方法。
技术介绍
随着移动互联网时代的发展,移动智能终端的普及以及多媒体技术的不断进步,人们的生活方式发生了较大的变化,能够更加便捷地使用手机采集图像、音频等多媒体信息并分享在网络上。这些多媒体信息无时无刻不渗透在人们的生活之中,其真假性难以辨别。为检测多媒体信息的真实性、完整性,多媒体取证技术应运而生且已成为信息安全领域的热点研究问题之一。数字音频取证技术是数字多媒体取证技术重要的组成部分之一,引起了越来越多的关注。而音频压缩历史检测是数字音频取证技术中的热点问题之一,也获得了重大进展。不法分子在对音频进行篡改、插入等操作时,都会对音频进行压缩,导致音频压缩历史的改变。因此,音频压缩历史检测是判断音频是否被篡改的或伪造的一个必要条件,是检测音频真实性的前一步工作。在MP3音频压缩历史检测方面:如,LiuQZ,SungAH,QiaoMY.DetectionofDoubleMP3Compression.CognitiveComputation,2010,2(4):291-296.(刘庆忠、黄继武、乔铭宇,MP3音频的检测),其通过分析压缩前后MP3音频中的MDCT(ModifiedDiscreteCosineTransform,修正离散余弦变换)系数矩阵中的1值系数的数量,发现其发生较为明显的变化,因此利用MDCT系数矩阵中的1值系数在所有MDCT系数中的占比作为检测特征,对低码率转高码率MP3双压缩音频进行有效检测;此外,其将图像隐写分析中的Benford定理修正后应用于音频的检测,对两次压缩的MP3音频的MDCT系数进行了研究分析,利用Benford定理对MP3双压缩音频进行有效检测。又如,RenY,FanM,YeD,etal.DetectionofdoubleMP3compressionBasedonDifferenceofCalibrationHistogram[J].MultimediaTools&Applications,2016,75(21):13855-13870.(任延珍等人,基于校准直方图差异的MP3双压缩检测[J],多媒体工具与应用),其利用双压缩校准音频与待测音频的QMDCT(QuantizedModifiedDiscreteCosineTransform,量化修正离散余弦变换)系数分布的差异,进行MP3双压缩音频检测以及压缩音频原始码率的估计。再如,BianchiT,DeRosaA,FontaniM,RoccioloG,PivaA.DetectionandlocalizationofdoublecompressioninMP3audiotracks[J].EurasipJournalonInformationSecurity,2014,2014:10.(MP3双压缩音频的检测和定位)、BianchiT,DeRosaA,FontaniM,RoccioloG,PivaA.DetectionandclassificationofdoublecompressedMP3audiotracks[C].IHandMMSec2013-Proceedingsofthe2013ACMInformationHidingandMultimediaSecurityWorkshop,2013:159-164.(MP3双压缩音频的检测和分类,2013年ACM信息隐藏和多媒体安全研讨会论文集),其利用图像的双压缩校正原理,将待测音频进行解码提取出量化步长,对得到的PCM(PulseCodeModulation,脉冲编码调制)采样值进行裁剪并使用之前提取的量化步长进行重新编码,利用一次和二次压缩音频在经过双压缩校正后MDCT系数分布与校正前分布呈现出不一样的规律,实现对MP3双压缩音频的有效检测。在AMR音频压缩历史检测方面:如,Luo,D.;Yang,R.;Huang,J.DetectingdoublecompressedAMRaudiousingdeeplearning.InProceedingsoftheIEEEInternationalConferenceonAcoustics,SpeechandSignalProcessing,Florence,Italy,4–9May2014;pp.2669–2673,doi:10.1109/ICASSP.2014.6854084.(罗达,杨瑞,黄继武等,利用深度学习检测AMR音频。IEEE国际声学,语音和信号处理会议论文集)和Luo,D.;Yang,R.;Huang,J.DetectionofDoubleCompressedAMRAudioUsingStackedAutoencoder.IEEETrans.Inf.ForensicsSecur.2017,12,432–444,doi:10.1109/TIFS.2016.2622012.(罗达,杨瑞,黄继武等,利用叠加自动编码器检测AMR双压缩音频,IEEETrans),其利用深度学习算法以及大多数投票策略来设计决策检测的AMR(AdaptiveMulti-Rate,自适应多速率)音频,并在进一步的工作中提出了基于堆叠自动编码器(SAE)网络和通用背景模型-高斯混合模型(UBM-GMM)的AMR双压缩音频检测框架。在AAC音频压缩历史检测方面:如,SeichterD,CuccovilloL,AichrothP.AACencodingdetectionandbitrateestimationusingaconvolutionalneuralnetwork[C]//IEEEInternationalConferenceonAcoustics,SpeechandSignalProcessing.IEEE,2016.(利用卷积神经网络进行AAC双压缩音频的检测以及原始码率估计,IEEE国际声学,语音和信号处理会议),其利用卷积神经网络(CNN)对AAC双压缩音频分类检测和原始码率估计。又如,ChaoJin,RangdingWang,etal.AnefficientalgorithmfordoublecompressedAACaudiodetection[J].MultimediaToolsandApplications,2016,75:4815–4832.(金超、王让定、严迪群,一种有效的检测AAC双压缩音频的方法,2016年多媒体工具和应用),其将Huffman码表索引出现的概率作为第一特征,将Markov单步转移概率作为第二特征,将两个特征进行融合并进行降维得到最终特征,利用LIBSVM对单压缩和双压缩AAC音频进行有效分类,其对同码率压缩音频的检测识别率较低。再如,李晗提出的AMR和AAC音频检测研究(华南理工大学,2015.),其发现压缩过程中AAC双压缩音频的频率成分以及能量值存在较大差异,利用堆栈自动编码器(SAE)进行双压缩历史的检测。现有的音频压缩历史检测研究大多针对MP3双压缩音频,对于AA本文档来自技高网...

【技术保护点】
1.一种基于比例因子系数差值的AAC双压缩音频检测方法,其特征在于包括以下步骤:步骤一:随机选取No个时长一致而风格不同的原始音频,原始音频的格式为WAV格式;然后使用AAC编码器并采用Nb种比特率,分别对每个原始音频进行压缩,得到Nb类具有不同比特率的共N1个AAC单压缩音频;接着使用AAC解码器,对每个AAC单压缩音频进行解压,得到每个AAC单压缩音频对应的解压音频,解压音频的格式为WAV格式;再使用相同的AAC编码器并采用Nb种比特率中大于或等于获取对应的AAC单压缩音频时所采用的比特率的所有比特率,分别对每个AAC单压缩音频对应的解压音频进行压缩,得到

【技术特征摘要】
1.一种基于比例因子系数差值的AAC双压缩音频检测方法,其特征在于包括以下步骤:步骤一:随机选取No个时长一致而风格不同的原始音频,原始音频的格式为WAV格式;然后使用AAC编码器并采用Nb种比特率,分别对每个原始音频进行压缩,得到Nb类具有不同比特率的共N1个AAC单压缩音频;接着使用AAC解码器,对每个AAC单压缩音频进行解压,得到每个AAC单压缩音频对应的解压音频,解压音频的格式为WAV格式;再使用相同的AAC编码器并采用Nb种比特率中大于或等于获取对应的AAC单压缩音频时所采用的比特率的所有比特率,分别对每个AAC单压缩音频对应的解压音频进行压缩,得到类共N2个AAC双压缩音频;其中,No为正整数,No≥100,原始音频的时长为大于或等于0.5秒,Nb为正整数,Nb≥1,N1=No×Nb,步骤二:将步骤一中对每个AAC单压缩音频对应的解压音频进行压缩时所采用的比特率与获取该AAC单压缩音频时所采用的比特率相同时得到的AAC双压缩音频作为该AAC单压缩音频相应的同比特率再次压缩后AAC音频;使用与步骤一中相同的AAC解码器,对每个AAC双压缩音频进行解压,得到每个AAC双压缩音频对应的解压音频,解压音频的格式为WAV格式;再使用与步骤一中相同的AAC编码器并采用获取对应的AAC双压缩音频时第二次压缩所采用的比特率,对每个AAC双压缩音频对应的解压音频进行压缩,得到每个AAC双压缩音频相应的同比特率再次压缩后AAC音频;步骤三:提取每个AAC单压缩音频的比例因子系数矩阵,将第n1个AAC单压缩音频的比例因子系数矩阵记为然后获取每个AAC单压缩音频的比例因子系数矩阵中值在[140,200]范围内的比例因子系数的出现概率,将中值在[140,200]范围内的比例因子系数的出现概率记为其中,n1为正整数,n1的初始值为1,1≤n1≤N1,的维数为M×N,M表示原始音频中包含的帧的总帧数,N表示比例因子子带数,表示中下标为(1,1)的比例因子系数,亦表示第n1个AAC单压缩音频中的第1帧中的第1个比例因子带的系数,表示中下标为(1,N)的比例因子系数,亦表示第n1个AAC单压缩音频中的第1帧中的第N个比例因子带的系数,表示中下标为(M,1)的比例因子系数,亦表示第n1个AAC单压缩音频中的第M帧中的第1个比例因子带的系数,表示中下标为(M,N)的比例因子系数,亦表示第n1个AAC单压缩音频中的第M帧中的第N个比例因子带的系数,的维数为1×61,表示中比例因子系数为140的出现概率,表示中比例因子系数为200的出现概率;提取每个AAC单压缩音频相应的同比特率再次压缩后AAC音频的比例因子系数矩阵,将第n1个AAC单压缩音频相应的同比特率再次压缩后AAC音频的比例因子系数矩阵记为然后获取每个AAC单压缩音频相应的同比特率再次压缩后AAC音频的比例因子系数矩阵中值在[140,200]范围内的比例因子系数的出现概率,将中值在[140,200]范围内的比例因子系数的出现概率记为其中,的维数为M×N,表示中下标为(1,1)的比例因子系数,亦表示第n1个AAC单压缩音频相应的同比特率再次压缩后AAC音频中的第1帧中的第1个比例因子带的系数,表示中下标为(1,N)的比例因子系数,亦表示第n1个AAC单压缩音频相应的同比特率再次压缩后AAC音频中的第1帧中的第N个比例因子带的系数,表示中下标为(M,1)的比例因子系数,亦表示第n1个AAC单压缩音频相应的同比特率再次压缩后AAC音频中的第M帧中的第1个比例因子带的系数,表示中下标为(M,N)的比例因子系数,亦表示第n1个AAC单压缩音频相应的同比特率再次压缩后AAC音频中的第M帧中的第N个比例因子带的系数,的维数为1×61,表示中比例因子系数为140的出现概率,表示中比例因子系数为200的出现概率;同样,提取每个AAC双压缩音频的比例因子系数矩阵,将第n2个AAC双压缩音频的比例因子系数矩阵记为然后获取每个AAC双压缩音频的比例因子系数矩阵中值在[140,200]范围内的比例因子系数的出现概率,将中值在[140,200]范围内的比例因子系数的出现概率记为其中,n2为正整数,n2的初始值为1,1≤n2≤N2,的维数为M×N,表示中下标为(1,1)的比例因子系数,亦表示第n2个AAC双压缩音频中的第1帧中的第1个比例因子带的系数,表示中下标为(1,N)的比例因子系数,亦表示第n2个AAC双压缩音频中的第1帧中的第N个比例因子带的系数,表示中下标为(M,1)的比例因子系数,亦表示第n2个AAC双压缩音频中的第M帧中的第1个比例因子带的系数,表示中下标为(M,N)的比例因子系数,亦表示第n2个AAC双压缩音频中的第M帧中的第N个比例因子带的系数,的维数为1×61,表示中比例因子系数为140的出现概率,表示中比例因子系数为200的出现概率;同样,提取每个AAC双压缩音频相应的同比特率再次压缩后AAC音频的比例因子系数矩阵,将第n2个AAC双压缩音频相应的同比特率再次压缩后AAC音频的比例因子系数矩阵记为然后获取每个AAC双压缩音频相应的同比特率再次压缩后AAC音频的比例因子系数矩阵中值在[140,200]范围内的比例因子系数的出现概率,将中值在[140,200]范围内的比例因子系数的出现概率记为其中,的维数为M×N,表示中下标为(1,1)的比例因子系数,亦表示第n2个AAC双压缩...

【专利技术属性】
技术研发人员:王让定黄其娟严迪群
申请(专利权)人:宁波大学
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1