面向多类低速率压缩语音隐写的通用信息隐藏检测方法技术

技术编号:20078077 阅读:30 留言:0更新日期:2019-01-15 01:33
本发明专利技术公开了面向多类低速率压缩语音隐写的通用信息隐藏检测方法,用于检测G.723.1低速率语音编码器的编码,所述方法具体步骤如下:步骤1)基于低速率压缩语音码流中的码元构建所有码元帧内帧间关联的码元时空关联网络CESN;步骤2)利用码元时空关联网络CESN中的强关联边进一步构建用于隐写分析的码元贝叶斯网络CEBN;步骤3)基于训练样本对码元贝叶斯网络CEBN进行网络参数学习并得到阈值Jthr;步骤4)给定一段包含N帧的语音片段,根据码元贝叶斯网络CEBN的网络参数计算语音隐写指数J,当J<Jthr时,判定为未隐写语音片段;当J≥Jthr时,判定为隐写语音片段。本发明专利技术的方法的通用隐写分析能力明显高于基于非压缩域MFCC通用隐写分析方法。

A General Information Hiding Detection Method for Multi-class Low Rate Compressed Speech Steganography

The invention discloses a general information hiding detection method for multi-class low-rate compressed voice steganography, which is used to detect the encoding of G.723.1 low-rate voice coder. The specific steps of the method are as follows: step 1) constructing a symbol spatio-temporal association network CESN based on the symbols in the low-rate compressed voice stream; step 2) utilizing the symbol spatio-temporal association network CESN; Strong correlation edges further construct symbol Bayesian network CEBN for steganalysis; Step 3) Learning network parameters of symbol Bayesian network CEBN based on training samples and obtaining threshold Jthr; Step 4) Given a speech segment containing N frames, calculating the speech steganographic index J according to the network parameters of symbol Bayesian network CEBN. When J < Jthr, it is determined that the steganographic speech segment is not steganographic. When J is greater than Jthr, it is determined to be a steganographic speech segment. The general steganalysis ability of the method of the present invention is obviously higher than that of the general steganalysis method based on the uncompressed domain MFCC.

【技术实现步骤摘要】
面向多类低速率压缩语音隐写的通用信息隐藏检测方法
本专利技术涉及信息安全
,特别涉及面向多类低速率压缩语音隐写的通用信息隐藏检测方法。
技术介绍
VoIP(VoiceoverInternetProtocol)语音信息隐藏是一种将秘密信息嵌入到VoIP语音载体中而使秘密信息难于被监管者察觉的技术。VoIP系统使用了多种语音编码器,包括G.711、G.726、G.728、G.729、G.723.1、iLBC、AMR以及它们的衍生版本等,它们可大致分为两类:一是基于脉冲编码调制(PulseCodeModulation,PCM)的高速率波形编码器,典型代表如G.711;二是基于合成分析法的线性预测编码(AnalysisbySynthesis–LinearPredictiveCoding,AbS-LPC)的中低速率混合编码器,典型代表如G.723.1、G.729以及AMR等。由于高速率语音编码器在实际的VoIP系统中应用并不多,为节省带宽资源,多采用低速率编码器。目前,常用的语音信息隐藏方法是基于AbS-LPC低速率压缩语音编码实现秘密信息的嵌入。从现有的文献看,基于AbS-LPC低速率压缩语音编码器的信息隐藏方法根据嵌入位置的不同可分为三类:第一类方法是利用音调合成滤波器进行信息隐藏;第二类方法是利用LPC合成滤波器进行信息隐藏;第三类方法是直接修改压缩语音码流中的码元进行信息隐藏。以检测语音码流中是否存在隐藏信息为目的信息隐藏检测技术,亦称为语音隐写分析技术,是与语音信息隐藏技术同步发展的,它们相互对立又相互促进发展。现有的AbS-LPC低速率压缩语音隐写分析方法针对信息隐藏方法分为三类:第一类是针对基于音调合成滤波器进行信息隐藏的隐写分析方法;第二类是针对基于LPC合成滤波器进行信息隐藏的隐写分析方法;第三类是针对语音码流中码元调制信息隐藏的隐写分析方法。上述三类AbS-LPC低速率压缩语音隐写分析方法主要包含三个步骤:首先提取AbS-LPC低速率压缩语音中的多种特征;然后进行特征融合处理,如果特征维度过高则进行特征选取或者降维处理;最后以处理后的特征作为特征向量,利用支持向量机(SupportVectorMachine,SVM)训练分类器,实现AbS-LPC低速率压缩语音隐写分析。这些方法主要有两个特点:一是采用“特征提取——特征处理——SVM分类”的框架;二是针对特定信息隐藏方法进行检测,在特征提取时只利用了特定的编码信息或者特定的码元信息,因而不能进行通用隐写分析。如果进行通用隐写分析,则需要使用多种隐写分析方法,复杂度高,很难满足实际应用要求。一些基于非压缩域提取语音特征的隐写分析方法,如梅尔倒谱特征,这类方法是一种通用的隐写分析方法,虽然可以用于AbS-LPC低速率语音隐写分析;但是该类方法主要是为非压缩语音文件隐写分析而设计,没有结合AbS-LPC编码原理,对AbS-LPC低速率压缩语音的检测准确率比较低,泛化能力较弱。因此亟需一种高效的通用AbS-LPC低速率压缩语音隐写分析方法。
技术实现思路
本专利技术的目的在于克服上述技术缺陷,提出了一种面向多类低速率压缩语音隐写的通用信息隐藏检测方法,用于检测G.723.1低速率语音编码器的编码,所述方法包括下:步骤1)基于低速率压缩语音码流中的码元构建所有码元帧内帧间关联的码元时空关联网络CESN;步骤2)利用码元时空关联网络CESN中的强关联边进一步构建用于隐写分析的码元贝叶斯网络CEBN;步骤3)基于训练样本对码元贝叶斯网络CEBN进行网络参数学习并得到阈值Jthr;步骤4)给定一段包含N帧的语音片段,根据码元贝叶斯网络CEBN的网络参数计算语音隐写指数J,当J<Jthr时,判定为未隐写语音片段;当J≥Jthr时,判定为隐写语音片段。作为上述方法的一种改进,所述步骤1)具体包括:步骤1-1)G.723.1低速率语音编码器的编码码流每帧由24个码元组成;24个码元包括:3个LPC矢量量化索引码元:VQ1、VQ2和VQ3,4个自适应码本延时码元:ACL0、ACL1、ACL2和ACL3,4个组合增益码元:GAIN0、GAIN1、GAIN2和GAIN3,5个脉冲位置索引码元:POS0、POS1、POS2、POS3和MSBPOS,4个脉冲符号索引码元:PSIG0、PSIG1、PSIG2和PSIG3,4个栅格索引码元GRID0、GRID1、GRID2和GRID3;步骤1-2)将24个码元记为Ci,i=1,2,…,24,以Ci为顶点,帧内帧间关联关系作为边的有向图,记为图D=&lt;V,E&gt;,其中V和E表示为:其中:V表示有向图D中顶点的集合,vi[m]表示第m帧第i个码字;E表示D中边的集合,由顶点vi[p]指向顶点vj[q]的有向边;当i=j且p≠q时表示帧内关联边;当j>i时表示帧间关联边;分析j-i∈{0,1}时的关联关系:由24个码元组成的帧内关联边有276条、帧间关联边有576条,共有852条;步骤1-3)计算码元Ci和Cj的相关性指数Ic(Ci,Cj):其中,ri和rj分别表示码元Ci和Cj的最大取值,p(Ci=ci)和p(Cj=ci)分别表示码元Ci=ci的边缘概率和码元Cj=ci的边缘概率,p(Ci=ci,Cj=ci)表示码元Ci=ci且Cj=ci的联合概率;若码元Ci和Cj相互独立,则对应任意的ci和ci均满足p(Ci=ci)p(Cj=ci)=p(Ci=ci,Cj=ci),则Ic(Ci,Cj)=0;步骤1-4)在852条关联边中保留Ic(Ci,Cj)>0.5的强关联边,则码元时空关联网络CESN包含4条帧内强关联边和7条帧间强关联边共11条边;帧内强关联边为:ACL0-ACL2、VQ1-VQ2、VQ1-VQ3和VQ2-VQ3;帧间强关联边为:ACL0-ACL0、ACL0-ACL2、ACL2-ACL0、ACL2-ACL2、VQ1-VQ1、VQ2-VQ2以及VQ3-VQ3。作为上述方法的一种改进,所述步骤2)具体包括:步骤2-1)以语音帧类别作为根节点O,所述语音帧类别包括:未隐写,记为0和隐写,记为1;步骤2-2)分别以24个码元取值作为根节点O的子节点,将栅格索引码元GRID0、GRID1、GRID2、GRID3这4个节点合并为一个节点,记为GRID,比特分配数为4;将码元ACL1和ACL3合并为一个节点,记为ACL,比特分配数为4;合并完之后共有20个子节点,构成由O到20个节点的有向边;步骤2-3)删除步骤1-4)得到的帧内强关联边ACL0-ACL2、VQ1-VQ2、VQ1-VQ3和VQ2-VQ3中VQ1到VQ3的有向边VQ1-VQ3;步骤2-4)分别以相邻帧间取值作为节点ACL0、ACL2、VQ1、VQ2、VQ3的子节点ACL0’、ACL2’、VQ1’、VQ2’、VQ3’,构成由ACL0到ACL0’、ACL0到ACL2’、ACL2到ACL2’、ACL2到ACL0’、VQ1到VQ1’、VQ2到VQ2’、VQ3到VQ3’的七条有向边;去掉ACL0到ACL2’和ACL2到ACL0两条边;将有向边O到ACL0’、O到ACL2’、O到VQ1’、O到VQ2’、O到VQ3’添加到网络中;步骤2-5)最终所构建的码元贝本文档来自技高网
...

【技术保护点】
1.一种面向多类低速率压缩语音隐写的通用信息隐藏检测方法,用于检测G.723.1低速率语音编码器的编码,所述方法具体步骤如下:步骤1)基于低速率压缩语音码流中的码元构建所有码元帧内帧间关联的码元时空关联网络CESN;步骤2)利用码元时空关联网络CESN中的强关联边进一步构建用于隐写分析的码元贝叶斯网络CEBN;步骤3)基于训练样本对码元贝叶斯网络CEBN进行网络参数学习并得到阈值Jthr;步骤4)给定一段包含N帧的语音片段,根据码元贝叶斯网络CEBN的网络参数计算语音隐写指数J,当J<Jthr时,判定为未隐写语音片段;当J≥Jthr时,判定为隐写语音片段。

【技术特征摘要】
1.一种面向多类低速率压缩语音隐写的通用信息隐藏检测方法,用于检测G.723.1低速率语音编码器的编码,所述方法具体步骤如下:步骤1)基于低速率压缩语音码流中的码元构建所有码元帧内帧间关联的码元时空关联网络CESN;步骤2)利用码元时空关联网络CESN中的强关联边进一步构建用于隐写分析的码元贝叶斯网络CEBN;步骤3)基于训练样本对码元贝叶斯网络CEBN进行网络参数学习并得到阈值Jthr;步骤4)给定一段包含N帧的语音片段,根据码元贝叶斯网络CEBN的网络参数计算语音隐写指数J,当J<Jthr时,判定为未隐写语音片段;当J≥Jthr时,判定为隐写语音片段。2.根据权利要求1所述的面向多类低速率压缩语音隐写的通用信息隐藏检测方法,其特征在于,所述步骤1)具体包括:步骤1-1)G.723.1低速率语音编码器的编码码流每帧由24个码元组成;24个码元包括:3个LPC矢量量化索引码元:VQ1、VQ2和VQ3,4个自适应码本延时码元:ACL0、ACL1、ACL2和ACL3,4个组合增益码元:GAIN0、GAIN1、GAIN2和GAIN3,5个脉冲位置索引码元:POS0、POS1、POS2、POS3和MSBPOS,4个脉冲符号索引码元:PSIG0、PSIG1、PSIG2和PSIG3,4个栅格索引码元GRID0、GRID1、GRID2和GRID3;步骤1-2)将24个码元记为Ci,i=1,2,…,24,以Ci为顶点,帧内帧间关联关系作为边的有向图,记为图D=&lt;V,E&gt;,其中V和E表示为:其中:V表示有向图D中顶点的集合,vi[m]表示第m帧第i个码字;E表示D中边的集合,由顶点vi[p]指向顶点vj[q]的有向边;当i=j且p≠q时表示帧内关联边;当j>i时表示帧间关联边;分析j-i∈{0,1}时的关联关系:由24个码元组成的帧内关联边有276条、帧间关联边有576条,共有852条;步骤1-3)计算码元Ci和Cj的相关性指数Ic(Ci,Cj):其中,ri和rj分别表示码元Ci和Cj的最大取值,p(Ci=ci)和p(Cj=ci)分别表示码元Ci=ci的边缘概率和码元Cj=ci的边缘概率,p(Ci=ci,Cj=ci)表示码元Ci=ci且Cj=ci的联合概率;若码元Ci和Cj相互独立,则对应任意的ci和ci均满足p(Ci=ci)p(Cj=ci)=p(Ci=ci,Cj=ci),则Ic(Ci,Cj)=0;步骤1-4)在852条关联边中保留Ic(Ci,Cj)>0.5的强关联边,则码元时空关联网络CESN包含4条帧内强关联边和7条帧间强关联边共11条边;帧内强关联边为:ACL0-ACL2、VQ1-VQ2、VQ1-VQ3和VQ2-VQ3;帧间强关联边为:ACL0-ACL0、ACL0-ACL2、ACL2-ACL0、ACL2-ACL2、VQ1-VQ1、VQ2-VQ2以及VQ3-VQ3。3.根据权利要求2所述的面向多类低速率压缩语音隐写的通用信息隐藏检测方法,其特征在于,所述步骤2)具体包括:步骤2-1)以语音帧类别作为根节点O,所述语音帧类别包括:未隐写,记为0和隐写,记为1;步骤2-2)分别以24个码元取值作为根节点O的子节点,将栅格索引码元GRID0、GRID1、GRID2、GRID3这4个节点合并为一个节点,记为GRID,比特分配数为4;将码元ACL1和ACL3合并为一个节点,记为ACL,比特分配数为4;合并完之后共有20个子节点,构成由O到20个节点的有向边;步骤2-3)删除步骤1-4)得到的帧内强关联边ACL0-ACL2、VQ1-VQ2、VQ1-VQ3和VQ2-VQ3中VQ1到VQ3的有向边VQ1-VQ3;步骤2-4)分别以相邻帧间取值作为节点ACL0、ACL2、VQ1、VQ2、VQ3的子节点ACL0’、ACL2’、VQ1’、...

【专利技术属性】
技术研发人员:李松斌刘鹏杨洁
申请(专利权)人:中国科学院声学研究所中国科学院声学研究所南海研究站
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1