当前位置: 首页 > 专利查询>宁波大学专利>正文

一种针对MP3Stego隐写后的音频的隐写检测方法技术

技术编号:10905543 阅读:321 留言:0更新日期:2015-01-14 14:42
本发明专利技术公开了一种针对MP3Stego隐写后的音频的隐写检测方法,其先将未隐写的MP3压缩音频和隐写MP3压缩音频构成样本库;然后对每个样本进行重压缩编码,获得每个样本的载体估计;接着提取每个样本中的每帧的量化后的MDCT系数,获取每个样本对应的第一系数矩阵,同样提取每个载体估计中的每帧的量化后的MDCT系数,获取每个载体估计对应的第二系数矩阵;再通过计算对应的第一系数矩阵与第二系数矩阵中对应列之间的Hausdorff距离值,得到每个样本的最终隐写分析特征行向量;之后通过SVM分类器训练得到训练模板;最后利用训练模板对待检测的MP3压缩音频进行检测;优点是能很准确地确定MP3压缩音频是否经过MP3Stego隐写,尤其在隐秘信息嵌入率较低的情况下依然能获得很高的检测效率。

【技术实现步骤摘要】
一种针对MP3Stego隐写后的音频的隐写检测方法
本专利技术涉及一种隐写检测方法,尤其是涉及一种针对MP3Stego隐写后的音频的隐写检测方法。
技术介绍
隐写术是一种结合公开传播的多媒体文件的自身特点,将要传递的隐秘信息通过隐写算法隐藏到多媒体文件中的技术。隐写后的多媒体文件具有良好的不可感知性,在传输的过程中一般较难被检测出其携带的隐秘信息,只有隐写者指定的特定人群才能够从隐写后的多媒体文件中提取出隐秘信息。为防止不法分子将隐写术用于危害公共安全,需利用隐写检测技术对公开传播的多媒体文件进行检测,来判断公开传播的多媒体文件是否经过隐写。作为隐写载体的多媒体文件的格式主要有图像、文本、视频、音频等。音频文件因其近年来在互联网上广泛流传,已成为隐写者与隐写检测者关注的热点。MP3Stego是目前最典型并且应用最广泛的音频隐写工具。针对MP3Stego隐写音频,目前已有很多检测算法,但大多数针对MP3Stego隐写音频的检测算法都是直接提取作为隐秘信息嵌入点的音频中的每一帧的编码块长度或者其他编码参数,通过分析这些编码参数变化特点来检测音频是否经过MP3Stego隐写,然而由于音频风格变化存在多样性,因此会影响编码块长度或其他编码参数的变化,从而会对隐写检测工作造成干扰,最终影响检测准确率。近年来,出现了一些对待检测音频进行消除隐写痕迹的操作如去噪,从而得到对原始音频的估计,然后将估计得到的音频与待检测音频相减从而消除音频本身风格变化的影响,提高了检测率,然而这些方法对原始音频的估计操作不能很好的消除隐写痕迹,因此得到的对原始音频的估计不够精确,导致在音频嵌入较少隐秘信息的情况下,检测效果不够理想。
技术实现思路
本专利技术所要解决的技术问题是提供一种针对MP3Stego隐写后的音频的隐写检测方法,其在隐秘信息嵌入率较低的情况下,依然能够获得很高的检测效率。本专利技术解决上述技术问题所采用的技术方案为:一种针对MP3Stego隐写后的音频的隐写检测方法,其特征在于包括以下步骤:①选取N个变化风格各不相同且未压缩的WAV音频,其中,N≥100;然后利用MP3音频8HZ编码器对每个WAV音频进行压缩编码,得到每个WAV音频对应的MP3压缩音频;并利用MP3Stego音频隐写工具对每个WAV音频隐写不同长度、不同内容的隐秘信息,得到每个WAV音频对应的隐写MP3压缩音频;再将N个MP3压缩音频和N个隐写MP3压缩音频构成一个样本库;②利用MP3音频lame解码器对样本库中的每个音频样本进行解压缩,得到样本库中的每个音频样本对应的WAV音频,在解压缩过程中,对样本库中的每个音频样本中的所有帧序号为偶数的帧的编码参数量化步长进行修正;然后利用MP3音频lame编码器对样本库中的每个音频样本对应的WAV音频进行压缩编码,得到样本库中的每个音频样本对应的载体估计;③利用MP3音频lame解码器对样本库中的每个音频样本进行解压缩,提取出样本库中的每个音频样本中的每帧的576个量化后的MDCT系数,以每个音频样本中的每帧的576个量化后的MDCT系数作为一行,将样本库中的每个音频样本对应的所有量化后的MDCT系数构成一个第一系数矩阵,将样本库中的第i个音频样本对应的所有量化后的MDCT系数构成的第一系数矩阵记为Xi,其中,1≤i≤2N,Xi的维数为表示样本库中的第i个音频样本中包含的帧的总数,x1,1、x1,2、x1,575、x1,576对应表示样本库中的第i个音频样本中的第1帧的第1个、第2个、第575个、第576个量化后的MDCT系数,x2,1、x2,2、x2,575、x2,576对应表示样本库中的第i个音频样本中的第2帧的第1个、第2个、第575个、第576个量化后的MDCT系数,对应表示样本库中的第i个音频样本中的第帧的第1个、第2个、第575个、第576个量化后的MDCT系数;同样,利用MP3音频lame解码器对样本库中的每个音频样本对应的载体估计进行解压缩,提取出样本库中的每个音频样本对应的载体估计中的每帧的576个量化后的MDCT系数,以每个载体估计中的每帧的576个量化后的MDCT系数作为一行,将样本库中的每个音频样本对应的载体估计对应的所有量化后的MDCT系数构成一个第二系数矩阵,将样本库中的第i个音频样本对应的载体估计对应的所有量化后的MDCT系数构成的第二系数矩阵记为Xi',其中,1≤i≤2N,Xi'的维数为表示样本库中的第i个音频样本中包含的帧的总数,亦表示样本库中的第i个音频样本对应的载体估计中包含的帧的总数,x'1,1、x'1,2、x'1,575、x'1,576对应表示样本库中的第i个音频样本对应的载体估计中的第1帧的第1个、第2个、第575个、第576个量化后的MDCT系数,x'2,1、x'2,2、x'2,575、x'2,576对应表示样本库中的第i个音频样本对应的载体估计中的第2帧的第1个、第2个、第575个、第576个量化后的MDCT系数,对应表示样本库中的第i个音频样本对应的载体估计中的第帧的第1个、第2个、第575个、第576个量化后的MDCT系数;④计算样本库中的每个音频样本对应的所有量化后的MDCT系数构成的第一系数矩阵中的每一列与该音频样本对应的载体估计对应的所有量化后的MDCT系数构成的第二系数矩阵中对应列之间的Hausdorff距离值,将样本库中的每个音频样本对应的576个Hausdorff距离值构成一个初级隐写分析特征行向量,将样本库中的第i个音频样本对应的576个Hausdorff距离值构成的初级隐写分析特征行向量记为Fi,Fi=[hd1hd2…hdk…hd575hd576],其中,1≤i≤2N,hdk表示Xi中的第k列与Xi'中的第k列之间的Hausdorff距离值,1≤k≤576;⑤根据样本库中的每个音频样本对应的576个Hausdorff距离值构成的初级隐写分析特征行向量,获取样本库中的每个音频样本对应的最终隐写分析特征行向量,将样本库中的第i个音频样本对应的最终隐写分析特征行向量记为Fi',Fi'=[μimiσipisi],其中,1≤i≤2N,μi表示Fi中的所有元素的均值,mi表示Fi中的所有元素中的最大值,mi=max(hd1,hd2,...,hdk,...,hd576),max()为取最大值函数,σi表示Fi中的所有元素的方差,pi表示Fi中的所有元素的峰度系数,si表示Fi中的所有元素的三阶中心距,⑥对样本库中的每个音频样本对应的最终隐写分析特征行向量进行标记,对于样本库中的第i个音频样本,如果该音频样本为MP3压缩音频,则将该音频样本对应的最终隐写分析特征行向量标记为-1,如果该音频样本为隐写MP3压缩音频,则将该音频样本对应的最终隐写分析特征行向量标记为+1,其中,1≤i≤2N;然后将所有标记后的最终隐写分析特征行向量输入SVM分类器进行训练,得到训练模板;⑦对于任意一个待检测的MP3压缩音频,按照步骤②至步骤⑤的过程,以相同的方式获取该MP3压缩音频对应的最终隐写分析特征行向量,然后利用训练模板对该MP3压缩音频对应的最终隐写分析特征行向量进行检测,以确定该MP3压缩音频是否经过MP3Stego音频隐写工具隐写。所述的步骤②中对样本库中的每个音频样本文档来自技高网
...
一种针对MP3Stego隐写后的音频的隐写检测方法

【技术保护点】
一种针对MP3Stego隐写后的音频的隐写检测方法,其特征在于包括以下步骤:①选取N个变化风格各不相同且未压缩的WAV音频,其中,N≥100;然后利用MP3音频8HZ编码器对每个WAV音频进行压缩编码,得到每个WAV音频对应的MP3压缩音频;并利用MP3Stego音频隐写工具对每个WAV音频隐写不同长度、不同内容的隐秘信息,得到每个WAV音频对应的隐写MP3压缩音频;再将N个MP3压缩音频和N个隐写MP3压缩音频构成一个样本库;②利用MP3音频lame解码器对样本库中的每个音频样本进行解压缩,得到样本库中的每个音频样本对应的WAV音频,在解压缩过程中,对样本库中的每个音频样本中的所有帧序号为偶数的帧的编码参数量化步长进行修正;然后利用MP3音频lame编码器对样本库中的每个音频样本对应的WAV音频进行压缩编码,得到样本库中的每个音频样本对应的载体估计;③利用MP3音频lame解码器对样本库中的每个音频样本进行解压缩,提取出样本库中的每个音频样本中的每帧的576个量化后的MDCT系数,以每个音频样本中的每帧的576个量化后的MDCT系数作为一行,将样本库中的每个音频样本对应的所有量化后的MDCT系数构成一个第一系数矩阵,将样本库中的第i个音频样本对应的所有量化后的MDCT系数构成的第一系数矩阵记为Xi,Xi=x1,1x1,2···x1,575x1,576x2,1x2,2···x2,575x2,576···············xNif,1xNif,2···xNif,575xNif,576,]]>其中,1≤i≤2N,Xi的维数为表示样本库中的第i个音频样本中包含的帧的总数,x1,1、x1,2、x1,575、x1,576对应表示样本库中的第i个音频样本中的第1帧的第1个、第2个、第575个、第576个量化后的MDCT系数,x2,1、x2,2、x2,575、x2,576对应表示样本库中的第i个音频样本中的第2帧的第1个、第2个、第575个、第576个量化后的MDCT系数,对应表示样本库中的第i个音频样本中的第帧的第1个、第2个、第575个、第576个量化后的MDCT系数;同样,利用MP3音频lame解码器对样本库中的每个音频样本对应的载体估计进行解压缩,提取出样本库中的每个音频样本对应的载体估计中的每帧的576个量化后的MDCT系数,以每个载体估计中的每帧的576个量化后的MDCT系数作为一行,将样本库中的每个音频样本对应的载体估计对应的所有量化后的MDCT系数构成一个第二系数矩阵,将样本库中的第i个音频样本对应的载体估计对应的所有量化后的MDCT系数构成的第二系数矩阵记为Xi',Xi′=x′1,1x′1,2···x′1,575x′1,576x′2,1x′2,2···x′2,575x′2,576···············x′Nif,1x′Nif,2···x′Nif,575x′Nif,576,]]>其中,1≤i≤2N,Xi'的维数为表示样本库中的第i个音频样本中包含的帧的总数,亦表示样本库中的第i个音频样本对应的载体估计中包含的帧的总数,x'1,1、x'1,2、x'1,575、x'1,576对应表示样本库中的第i个音频样本对应的载体估计中的第1帧的第1个、第2个、第575个、第576个量化后的MDCT系数,x'2,1、x'2,2、x'2,575、x'2,576对应表示样本库中的第i个音频样本对应的载体估计中的第2帧的第1个、第2个、第5...

【技术特征摘要】
1.一种针对MP3Stego隐写后的音频的隐写检测方法,其特征在于包括以下步骤:①选取N个变化风格各不相同且未压缩的WAV音频,其中,N≥100;然后利用MP3音频8HZ编码器对每个WAV音频进行压缩编码,得到每个WAV音频对应的MP3压缩音频;并利用MP3Stego音频隐写工具对每个WAV音频隐写不同长度、不同内容的隐秘信息,得到每个WAV音频对应的隐写MP3压缩音频;再将N个MP3压缩音频和N个隐写MP3压缩音频构成一个样本库;②利用MP3音频lame解码器对样本库中的每个音频样本进行解压缩,得到样本库中的每个音频样本对应的WAV音频,在解压缩过程中,对样本库中的每个音频样本中的所有帧序号为偶数的帧的编码参数量化步长进行修正;然后利用MP3音频lame编码器对样本库中的每个音频样本对应的WAV音频进行压缩编码,得到样本库中的每个音频样本对应的载体估计;所述的步骤②中对样本库中的每个音频样本中的所有帧序号为偶数的帧的编码参数量化步长进行修正的具体过程为:②-1、将样本库中当前待处理的第i个音频样本定义为当前音频样本,其中,1≤i≤2N;②-2、假设当前音频样本中包含有帧,且帧序号从1开始编,并将当前音频样本中当前待处理的第j帧定义为当前帧,其中,②-3、如果当前帧的帧序号j为奇数,则保持当前帧的编码参数量化步长不变,然后执行步骤②-4;如果当前帧的帧序号j为偶数,则将前一帧的编码参数量化步长作为当前帧的编码参数量化步长,完成对当前帧的编码参数量化步长的修正,然后执行步骤②-4;②-4、令j=j+1,然后将当前音频样本中下一帧待处理的帧作为当前帧,再返回步骤②-3继续执行,直至当前音频样本中的所有帧处理完毕,其中,j=j+1中的“=”为赋值符号;②-5、令i=i+1,然后将样本库中下一个待处理的音频样本作为当前音频样本,再返回步骤②-2继续执行,直至样本库中的所有音频样本处理完毕,其中,i=i+1中的“=”为赋值符号;③利用MP3音频lame解码器对样本库中的每个音频样本进行解压缩,提取出样本库中的每个音频样本中的每帧的576个量化后的MDCT系数,以每个音频样本中的每帧的576个量化后的MDCT系数作为一行,将样本库中的每个音频样本对应的所有量化后的MDCT系数构成一个第一系数矩阵,将样本库中的第i个音频样本对应的所有量化后的MDCT系数构成的第一系数矩阵记为Xi,其中,1≤i≤2N,Xi的维数为表示样本库中的第i个音频样本中包含的帧的总数,x1,1、x1,2、x1,575、x1,576对应表示样本库中的第i个音频样本中的第1帧的第1个、第2个、第575个、第576个量化后的MDCT系数,x2,1、x2,2、x2,575、x2,576对应表示样本库中的第i个音频样本中的第2帧的第1个、第2个、第575个、第576个量化后的MDCT系数,对应表示样本库中的第i个音频样本中的第帧的第1个、第2个、第575个、第576个量化后的MDCT系数;同样,利用MP3音频lame解码器对样本库中的每个音频样本对应的载体估计进行解压缩,提取出样本库中的每个音频样本对应的载体估计中的每帧的576个量化后的MDCT系数,以每个载体估计中的每帧的576个量化后的MDCT系数作为一行,将样本库中的每个音频样本对应的载体估计对应的所有量化后的MDCT系数构成一个第二系数矩阵,将样本库中的第i个音频样本对应的载体估计对应的所有量化后的MDCT系数构成的第二系数矩阵记为Xi',其中,1≤i≤2N,Xi'的维数为表示样本库中的第i个音频样本中包含的帧的总数,亦表示样本库中的第i个音频样本对应的载体估计中包含...

【专利技术属性】
技术研发人员:王让定羊开云严迪群金超孙冉周劲蕾
申请(专利权)人:宁波大学
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1