一种基于量化特性的语音篡改定位检测方法技术

技术编号：13326611 阅读：66 留言：0更新日期：2016-07-11 16:01

本发明专利技术公开了一种基于量化特性的语音篡改定位检测方法，主要是基于现有技术中帧偏移的MP3篡改定位检测算法进行的深入研究，并提出一种更新的检测方法用于描述量化特性，这种检测方法无需进行帧偏移检测，故能避免计算帧偏移带来的计算复杂性，极大降低了计算的复杂度，同时还解决了帧偏移无法检测的高码率情况，实验结果表明这种检测方法具有较高的检测准确率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及语音篡改定位检测方法，具体是指一种基于量化特性的语音篡改定位检测方法。
技术介绍
随着数字技术和互联网技术的快速发展，数字多媒体在日常生活中得到了广泛的应用。人们每天都在产生大量的多媒体信息，例如：使用数码相机拍摄视频、拍摄照片、语音聊天，人们可以将这些信息通过互联网技术在网络上与朋友分享，丰富了人们的精神文化生活，方便了人们之间的交流沟通，让人们因掌握了新的技术而受益。但是，任何技术都存在两面性，大量的多媒体编辑软件可以对这些数字信息进行篡改，如果篡改的信息被非法使用，将会给我们的生活带来极大的威胁，由此数字取证技术孕育而生。通常数字取证技术可分为两类：主动取证技术和被动取证技术；主动取证技术有两种常见的方法：第一种是数字水印，对认证的数字信息嵌入认证信息；第二种是数字签名，从数字信号中提取一个与内容相关的指纹作为数字签名。这两种方法都可以用来检测数字信息的真实性。被动取证技术是通过对数字内容进行分析，运用数字信号处理的技术鉴别数字信息的原始性和真实性，它不需要事先嵌入信息。在实际情况下要鉴别的数字信号往往都不具备数字水印和数字签名信息，因此实际应用中被动取证技术更具有现实意义。MP3是目前流行的音频格式之一，MP3音频采用MPEG-1第三层音频压缩标准，以其近CD的音质、高压缩比、开放性和易用性深受好评，在因特网上广为流行，相应的编解码软件和硬件设备也不断涌现。音频是指人类能够听到的所有声音，语...

【技术保护点】
一种基于量化特性的语音篡改定位检测方法，其特征在于该语音篡改定位检测方法包括如下步骤：步骤一、选取给定的包含L个样本的语音信号X，将X划分为每帧1152个样本，每帧有50%的重叠，因此一共有帧，，其中F表示分帧和加窗函数操作；步骤二、应用滤波器组和MDCT到每一帧，以获取其频谱系数，其中表示滤波器组和MDCT，表示第帧的频谱，每帧包含576个频谱系数；，其中表示提取每帧频谱系数中值为0和的个数，记为；步骤三、对的每一个频谱系数用，进行如下公式量化：表示第帧中第个频谱系数，表示量化的第帧第个频谱系数，用表示第帧的量化频谱系数；步骤四、将获取的量化频谱系数，应用函数获取每帧中值为0的个数记为，，并计算；步骤五、最后计算其中find函数表示中值不等于0时返回索引值；表示设置的阈值，在实验中设置为4，也即表示返回没有连续出现4个值为0值的位置，其中设置检测时滑动框数量为6个单位，表示检测的精度在6/2帧的范围，也即检测误差为3帧，经过计算并最终确认语音文件的篡改定位。

【技术特征摘要】
1.一种基于量化特性的语音篡改定位检测方法，其特征在于该语音篡改定位检测方法
包括如下步骤：
步骤一、选取给定的包含L个样本的语音信号X，将X划分为每帧1152个样本，每帧有50%
的重叠，因此一共有帧，
，其中F表示分帧和加窗函数操作；
步骤二、应用滤波器组和MDCT到每一帧，以获取其频谱系数
，其中表示滤波器组和MDCT，表示第帧的频
谱，每帧包含576个频谱系数；
，
其中表示提取每帧频谱系数中值为0和的个数，记为；步骤三、对的每一个频谱系数用，进行如下公式量化：
表示第帧中第个频谱系数，表示量化的第帧第个频谱系数，用表
示第帧的量化频谱系数；
步骤四、将获取的量...

【专利技术属性】
技术研发人员：王让定，陶表犁，严迪群，金超，周劲蕾，
申请(专利权)人：宁波大学，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人