当前位置: 首页 > 专利查询>宁波大学专利>正文

一种基于量化特性的语音篡改定位检测方法技术

技术编号:13326611 阅读:66 留言:0更新日期:2016-07-11 16:01
本发明专利技术公开了一种基于量化特性的语音篡改定位检测方法,主要是基于现有技术中帧偏移的MP3篡改定位检测算法进行的深入研究,并提出一种更新的检测方法用于描述量化特性,这种检测方法无需进行帧偏移检测,故能避免计算帧偏移带来的计算复杂性,极大降低了计算的复杂度,同时还解决了帧偏移无法检测的高码率情况,实验结果表明这种检测方法具有较高的检测准确率。

【技术实现步骤摘要】

本专利技术涉及语音篡改定位检测方法,具体是指一种基于量化特性的语音篡改定位检测方法
技术介绍
随着数字技术和互联网技术的快速发展,数字多媒体在日常生活中得到了广泛的应用。人们每天都在产生大量的多媒体信息,例如:使用数码相机拍摄视频、拍摄照片、语音聊天,人们可以将这些信息通过互联网技术在网络上与朋友分享,丰富了人们的精神文化生活,方便了人们之间的交流沟通,让人们因掌握了新的技术而受益。但是,任何技术都存在两面性,大量的多媒体编辑软件可以对这些数字信息进行篡改,如果篡改的信息被非法使用,将会给我们的生活带来极大的威胁,由此数字取证技术孕育而生。通常数字取证技术可分为两类:主动取证技术和被动取证技术;主动取证技术有两种常见的方法:第一种是数字水印,对认证的数字信息嵌入认证信息;第二种是数字签名,从数字信号中提取一个与内容相关的指纹作为数字签名。这两种方法都可以用来检测数字信息的真实性。被动取证技术是通过对数字内容进行分析,运用数字信号处理的技术鉴别数字信息的原始性和真实性,它不需要事先嵌入信息。在实际情况下要鉴别的数字信号往往都不具备数字水印和数字签名信息,因此实际应用中被动取证技术更具有现实意义。MP3是目前流行的音频格式之一,MP3音频采用MPEG-1第三层音频压缩标准,以其近CD的音质、高压缩比、开放性和易用性深受好评,在因特网上广为流行,相应的编解码软件和硬件设备也不断涌现。音频是指人类能够听到的所有声音,语音是指由人的发音器官发出,负载着一定的语言意义,语音是音频的一个范畴。我们把经过MP3音频编码器压缩的语音信号称为MP3语音。正是因为MP3编码软件和硬件设备不断的普及使得我们获取MP3语音变得非常便捷,而音频编辑软件可以随意的对语音内容进行编辑篡改,如果被非法利用将会给我们的生活带来严重的威胁。例如在法庭上用于取证的录音材料:“我没有看到事情的经过”篡改为“我看到了事情的经过”,仅仅将“没有”二字删除完全扭曲了原本的意思,将会破坏最终判决的公正性。语音内容常见的篡改方式有:删除、插入、拼接。删除操作就是将原始语音的内容删除部分,达到掩盖原始内容的目的;插入操作是将另一段语音内容插入原始语音特定位置处,同样达到掩盖原始语音内容表达的目的;拼接篡改操作是删除和插入操作的结合,首先将原始语音内容的部分内容删除,然后插入另一段语音内容,同样达到掩盖原始语音内容的目的。从这些篡改的操作过程可以看出,对语音内容的真实性和原始性验证是非常重要的。目前,语音内容篡改取证领域中也引起较多研究者的关注。《基于背景噪声的数字音频取证[J].2010IEEE国际会议,106-110》文献中,Ikram和Malik提出一种基于环境背景噪声的音频取证方法,利用待测音频中背景噪声与不同环境背景噪声的相关性大小来判断音频信号的完整性。《基于混响的录音环境识别[C].声学、语音信号处理.2012年:1833-1836》文献中,Malik等利用逆滤波器从音频文件中估计回响信号,提取回响信号的24维梅尔倒谱系数和24维对数梅尔谱系数,构成48维的特征向量,然后利用SVM分类以实现对录音环境的识别。《基于双谱分析的数字取证检测[J].MIT,2004》文献中,Farid提出了利用双谱分析检测音频信号真伪的方法,他认为自然信号在频域内具有较弱的高阶相关性,而经篡改后的非自然信号,会引入了非线性,从而导致高阶相关性的增强;因此,可以利用双谱分析检测三阶相关性强弱的方法来检验音频信号有没有被篡改。《基于帧偏移的数字音频篡改取证[C].第10届ACM多媒体安全会议,牛津大学,2008:21-26》文献中,Yang等人提出了一种检测MP3文件篡改的方法,文献中首先分析了MP3的编解码过程,指出由于语音信号是以帧为单位进行编码的,在编码之后每一帧都具有固定的帧偏移量,而篡改会破坏这种偏移,文献中通过检测帧偏移的不一致性进行篡改定位检测。《基于频谱分析的MP3音频比特率[C].第11届多媒体信息安全会议.2009:57-61》文献中,Brian提出了一种通过频谱分析检测MP3格式音频的真实比特率的方法,作者通过实验证实不同比特率的音乐的功率谱在16kHz至20kHz频带内呈现不同分布。如果将低比特率音乐转换成高比特率,其高频段内的功率谱依然会保持与原来低比特率相同的特性,因此提取16kHz至20kHz高频段功率谱的有效特征,并经过SVM分类器进行分类,即可有效检测出待检测音乐的真实比特率。《数字音频录音分析电网频率[J].语言与法律的国际会议,2005,12(1):63-76》文献中,Grigoras提出了利用电网频率(ElectricNetworkFrequency,ENF)对数字音频录音进行分析,他认为数字录音设备在拾取音频信息的同时,还记录了50/60Hz的电网频率,并且ENF只在50/60Hz上下随机波动;因此,篡改过的音频信号,它的ENF声谱图会存在不连续的特征。实验表明,在同一电网条件下,不同录音系统所记录的音频信号,ENF声谱图之间的差异非常小,并且不同时间记录的音频中的频率偏差不同;因此,可以通过电力公司建立相关ENF库,进一步确定录制音频的正确时间。综上所述,尽管语音篡改检测在国内外已得到了较大的关注和发展,并取得了一定的研究成果,但是还存在不少问题,如基于MP3音频格式特点的篡改检测,在对高码率压缩的情况往往无法检测,对于录音设备和环境特征的篡改检测准确率还有较大的提高空间,特别是对录音设备来源的描述不够准确。造成了识别的准确率较低等问题,因此在研究以上方面问题时都有较大的发展空间。
技术实现思路
本专利技术所要解决的技术问题在于克服现有技术的缺陷而提供一种检测过程计算简单、能够检测高码率和检测准确度高的一种基于量化特性的语音篡改定位检测方法,拟解决MP3语音格式特点的篡改在高码率无法检测的情况,以及改善已有方法计算复杂的问题。本专利技术的技术问题通过以下技术方案实现:一种基于量化特性的语音篡改定位检测方法,其包括如下步骤:步骤一、选取给定的包含L个样本的语音信号X,将X划分为每帧1152个样本,每帧有50%的重叠,因此一共有帧,,其中F表示lame3.99.5编码器中分帧和加窗函数操作;步骤二、应用滤波器组和MDCT到每一帧,以获取其频谱系数,其中表示lame3.99.5编码器中滤波器组和MDCT,表示第帧的频谱,每帧包含576个频谱系数;,其中表示提取每帧频谱系数中值为0和的个数,记为;步骤三、对的每一个频谱系数用,进行如下公式量化:<本文档来自技高网
...

【技术保护点】
一种基于量化特性的语音篡改定位检测方法,其特征在于该语音篡改定位检测方法包括如下步骤:步骤一、选取给定的包含L个样本的语音信号X,将X划分为每帧1152个样本,每帧有50%的重叠,因此一共有帧,,其中F表示分帧和加窗函数操作;步骤二、应用滤波器组和MDCT到每一帧,以获取其频谱系数,其中表示滤波器组和MDCT,表示第帧的频谱,每帧包含576个频谱系数;,其中表示提取每帧频谱系数中值为0和的个数,记为;步骤三、对的每一个频谱系数用,进行如下公式量化:表示第帧中第个频谱系数,表示量化的第帧第个频谱系数,用表示第帧的量化频谱系数;步骤四、将获取的量化频谱系数,应用函数获取每帧中值为0的个数记为,,并计算;步骤五、最后计算其中find函数表示中值不等于0时返回索引值;表示设置的阈值,在实验中设置为4,也即表示返回没有连续出现4个值为0值的位置,其中设置检测时滑动框数量为6个单位,表示检测的精度在6/2帧的范围,也即检测误差为3帧,经过计算并最终确认语音文件的篡改定位。

【技术特征摘要】
1.一种基于量化特性的语音篡改定位检测方法,其特征在于该语音篡改定位检测方法
包括如下步骤:
步骤一、选取给定的包含L个样本的语音信号X,将X划分为每帧1152个样本,每帧有50%
的重叠,因此一共有帧,
,其中F表示分帧和加窗函数操作;
步骤二、应用滤波器组和MDCT到每一帧,以获取其频谱系数
,其中表示滤波器组和MDCT,表示第帧的频
谱,每帧包含576个频谱系数;

其中表示提取每帧频谱系数中值为0和的个数,记为;步骤三、对的每一个频谱系数用,进行如下公式量化:
表示第帧中第个频谱系数,表示量化的第帧第个频谱系数,用表
示第帧的量化频谱系数;
步骤四、将获取的量...

【专利技术属性】
技术研发人员:王让定陶表犁严迪群金超周劲蕾
申请(专利权)人:宁波大学
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1