一种基于贝叶斯推理的码元改写信息隐藏检测方法及系统技术方案

技术编号:17707382 阅读:36 留言:0更新日期:2018-04-14 19:36
本发明专利技术公开了一种基于贝叶斯推理的码元改写信息隐藏检测方法,所述方法包括:步骤1)在训练样本中根据压缩语音码元取值分布熵选取隐写敏感码元,由此构建码元强关联网络;基于码元强关联网络构建码元贝叶斯网络分类器,并使用Dirichlet分布作为先验分布学习码元贝叶斯网络分类器的参数;步骤2)根据码元贝叶斯网络分类器和训练样本计算隐写指数阈值Jthr;步骤3)对于一段未知类型的压缩语音,计算其隐写指数J0,若J0≥Jthr,判定该语音段为未隐写语音段;若J0<Jthr,判定该语音段为隐写语音段。本发明专利技术的方法能够得到更准确的隐写检测结果;而且本发明专利技术的方法以码流中的码元作为分析对象,不需要进行解码,可以达到实时隐写检测的效果。

【技术实现步骤摘要】
一种基于贝叶斯推理的码元改写信息隐藏检测方法及系统
本专利技术涉及信息安全和机器学习
,特别涉及一种基于贝叶斯推理的码元改写信息隐藏检测方法及系统。
技术介绍
随着带宽的持续增长以及网络融合趋势的增强,基于网络数据通信的网络流媒体服务得到了空前的发展,网络压缩语音码流成为隐蔽通信常用载体之一。它给人们的生活和工作带来便利的同时,也给犯罪分子带来了可乘之机。对于敏感机构而言,需要对机构中的语音码流进行评估审查,确定是否存在隐蔽通信信道进行秘密信息的外泄。信息隐藏检测技术作为隐蔽通信的对抗技术,能够有效的监控网络压缩语音码流中的隐蔽通信,实现对敏感机构中的语音码流信息隐藏检测。在压缩语音中进行信息隐藏之后,都会对码元造成不同程度的改写。现有的压缩语音信息隐藏检测方法绝大部分是在解码过程中进行的,即针对某种编码过程的信息隐藏进行检测,如线性预测编码、开环基音预测、码本搜索等;还有小部分是针对特定的信息隐藏方法直接分析压缩语音码流,该类方法针对单一码元分别进行分析,以效果最好的码元检测结果为最终检测结果。现有的码元改写信息隐藏检测方法都只能针对特定的信息隐藏方法进行检测,目前尚未有能适合任意码元改写的检测方法。在实际应用过程中,很难获取到压缩语音中使用的是何种信息隐藏方法,因此,研究一种通用的码元改写信息隐藏检测方法很有必要。
技术实现思路
本专利技术的目的在于提出一种通用的码元改写信息隐藏检测方法,该方法首先分析压缩语音各个码元自身取值统计特征,计算得到码元分布熵,选取分布熵较小的码元作为隐写敏感码元;接着以同类隐写敏感码元帧内取值和相邻帧间取值关系构建码元关联网络;然后以马尔科夫转移概率为关联指数对码元关联网络进行剪枝,得到码元强关联网络;最后基于码元强关联网络构建码元贝叶斯网络分类器,并使用Dirichlet分布作为先验分布学习网络参数,从而实现对码元改写的信息隐藏检测。为了实现上述目的,本专利技术提供了一种基于贝叶斯推理的码元改写信息隐藏检测方法,所述方法包括以下步骤:步骤1)在训练样本中根据压缩语音码元取值分布熵选取隐写敏感码元,由此构建码元强关联网络;基于码元强关联网络构建码元贝叶斯网络分类器,并使用Dirichlet分布作为先验分布学习码元贝叶斯网络分类器的参数;步骤2)根据码元贝叶斯网络分类器和训练样本计算隐写指数阈值Jthr;步骤3)对于一段未知类型的压缩语音,计算其隐写指数J0,若J0≥Jthr,判定该语音段为未隐写语音段;若J0<Jthr,判定该语音段为隐写语音段。作为上述方法的一种改进,所述步骤1)具体包括:步骤S1)根据训练样本计算压缩语音码元取值分布熵,选取分布熵小于阈值的码元作为隐写敏感码元;步骤S2)以隐写敏感码元帧内取值和相邻帧间取值关系构建码元关联网络,以马尔科夫转移概率为关联指数对码元关联网络进行剪枝,得到码元强关联网络;步骤S3)基于码元强关联网络构建码元贝叶斯网络分类器,并使用Dirichlet分布作为先验分布学习码元贝叶斯网络分类器的参数。作为上述方法的一种改进,所述步骤S1)具体包括:步骤S1-1)计算压缩语音码元取值分布,记第k个码元的取值范围为[0,rk],其取值概率分布为步骤S1-2)根据码元取值概率分布计算各个码元取值分布熵,第k个码元的分布熵Ek计算如下:步骤S1-3)选取分布熵小于阈值Ethr的码元作为隐写敏感码元。作为上述方法的一种改进,所述步骤S2)具体包括:步骤S2-1)根据步骤S1-3)得到的隐写敏感码元构建码元关联网络,记为有向图D=(V,E),定义如下:V={vi[k],i∈{0,1,2,...}}E={<vu[p],vv[q]>,vu[p],vv[q]∈V,v-u∈{0,1}}其中,V为有向图中的顶点构成的集合,每个顶点对应一个隐写敏感码元vi[k],vi[k]表示第i帧中的第k个码元;其中E为有向图中的有向边构成的集合,<vu[p],vv[q]>表示由顶点vu[p]指向vv[q]的有向边,且vu[p]和vv[q]为取值范围相同的同类码元,即rp=rq;当v-u=0时,表示帧内关联边;当v-u=1时,表示帧间关联边;步骤S2-2)根据步骤S2-1)得到的码元关联网络,计算每条边对应的码元取值转移概率矩阵Rpq,如下:其中Pi,j,i=0,1,...,rp,j=0,1,...,rq,rp=rq表示第p个码元取值为i,第q个码元取值为j时的转移概率;步骤S2-3)根据步骤S2-2)得到的转移概率矩阵Rpq计算关联指数REpq,计算公式如下:REpq表示两个码元取值相同时的转移概率之和;步骤S2-4)根据步骤S2-3)得到的关联指数REpq,去掉关联指数REpq小于阈值REthr的关联边,得到码元强关联网络D′=(V′,E′),记V′中包含N个顶点,为V′=v1,v2,...,vN。作为上述方法的一种改进,所述步骤S3)具体包括:步骤S3-1)根据步骤S2-4)得到的码元强关联网络,构建码元贝叶斯网络分类器,其网络节点随机变量记为U={X0,X1,…,XM},M为节点的总个数;随机变量相应的取值记为u={u0,u1,…,uM};步骤S3-2)根据步骤S3-1)得到的码元贝叶斯网络分类器,使用Dirichlet分布作为先验分布学习码元贝叶斯网络分类器的参数。作为上述方法的一种改进,所述步骤S3-1)具体包括:步骤S3-1-1)以压缩语音帧类别作为码元贝叶斯网络分类器的根节点X0,帧类别为:未隐写和隐写;步骤S3-1-2)根据步骤S2-4)得到的码元强关联网络,将顶点V′中每个码元取值范围分为多个取值集合;其中,对于取值范围大于255的码元,利用训练样本计算码元取值直方图,将码元取值直方图按降序排列,将排序后的取值均匀划分为256个取值集合;对于取值范围小于或者等于255的码元,每个取值为一个集合;以码元取值集合作为子节点X1,X2,...,XN,构成由X0→X1,X0→X2,...,X0→XN的N条有向边,节点Xi取值对应码元vi的一个取值集合;步骤S3-1-3)根据步骤S2-4)得到的码元强关联网络,若存在帧内关联边<vi[p],vi[q]>,则增加子节点构成由的两条有向边,节点表示帧内码元v[p]和v[q]取值关系,取值关系包括:取值不同和取值相同,取值不同记为0;取值相同记为1;步骤S3-1-4)根据步骤S2-4)得到的码元强关联网络,若存在相邻帧间关联边<vi[p],vi+1[p]>,则增加子节点构成由的两条有向边,节点表示同一码元v[p]帧间取值关系,取值关系包括:取值不同和取值相同,取值不同记为0;取值相同记为1,至此完成码元贝叶斯网络分类器的构建,其网络节点随机变量记为U={X0,X1,…,XM},随机变量相应的取值记为u={u0,u1,…,uM}。作为上述方法的一种改进,所述步骤S3-2)具体包括:步骤S3-2-1)根据步骤S3-1)得到的码元贝叶斯网络分类器,记随机变量Xi共有Ki个取值,Xi的取值概率为其中θijk表示随机变量Xi取其第k个取值且Xi的父节点Pa(Xi)取其第j个取值时的条件概率,则θijk表示为:θijk=P(Xi=xik|Pa(Xi)=Pa(Xi)j)初始化随机变量Xi取值先验分布π(θij)为Diri本文档来自技高网...
一种基于贝叶斯推理的码元改写信息隐藏检测方法及系统

【技术保护点】
一种基于贝叶斯推理的码元改写信息隐藏检测方法,所述方法包括:步骤1)在训练样本中根据压缩语音码元取值分布熵选取隐写敏感码元,由此构建码元强关联网络;基于码元强关联网络构建码元贝叶斯网络分类器,并使用Dirichlet分布作为先验分布学习码元贝叶斯网络分类器的参数;步骤2)根据码元贝叶斯网络分类器和训练样本计算隐写指数阈值Jthr;步骤3)对于一段未知类型的压缩语音,计算其隐写指数J0,若J0≥Jthr,判定该语音段为未隐写语音段;若J0<Jthr,判定该语音段为隐写语音段。

【技术特征摘要】
1.一种基于贝叶斯推理的码元改写信息隐藏检测方法,所述方法包括:步骤1)在训练样本中根据压缩语音码元取值分布熵选取隐写敏感码元,由此构建码元强关联网络;基于码元强关联网络构建码元贝叶斯网络分类器,并使用Dirichlet分布作为先验分布学习码元贝叶斯网络分类器的参数;步骤2)根据码元贝叶斯网络分类器和训练样本计算隐写指数阈值Jthr;步骤3)对于一段未知类型的压缩语音,计算其隐写指数J0,若J0≥Jthr,判定该语音段为未隐写语音段;若J0<Jthr,判定该语音段为隐写语音段。2.根据权利要求1所述的基于贝叶斯推理的码元改写信息隐藏检测方法,其特征在于,所述步骤1)具体包括:步骤S1)根据训练样本计算压缩语音码元取值分布熵,选取分布熵小于阈值的码元作为隐写敏感码元;步骤S2)以隐写敏感码元帧内取值和相邻帧间取值关系构建码元关联网络,以马尔科夫转移概率为关联指数对码元关联网络进行剪枝,得到码元强关联网络;步骤S3)基于码元强关联网络构建码元贝叶斯网络分类器,并使用Dirichlet分布作为先验分布学习码元贝叶斯网络分类器的参数。3.根据权利要求2所述的贝叶斯推理的码元改写信息隐藏检测方法,其特征在于,所述步骤S1)具体包括:步骤S1-1)计算压缩语音码元取值分布,记第k个码元的取值范围为[0,rk],其取值概率分布为步骤S1-2)根据码元取值概率分布计算各个码元取值分布熵,第k个码元的分布熵Ek计算如下:步骤S1-3)选取分布熵小于阈值Ethr的码元作为隐写敏感码元。4.根据权利要求2或3所述的贝叶斯推理的码元改写信息隐藏检测方法,其特征在于,所述步骤S2)具体包括:步骤S2-1)根据步骤S1-3)得到的隐写敏感码元构建码元关联网络,记为有向图D=(V,E),定义如下:V={vi[k],i∈{0,1,2,...}}E={<vu[p],vv[q]>,vu[p],vv[q]∈V,v-u∈{0,1}}其中,V为有向图中的顶点构成的集合,每个顶点对应一个隐写敏感码元vi[k],vi[k]表示第i帧中的第k个码元;其中E为有向图中的有向边构成的集合,<vu[p],vv[q]>表示由顶点vu[p]指向vv[q]的有向边,且vu[p]和vv[q]为取值范围相同的同类码元,即rp=rq;当v-u=0时,表示帧内关联边;当v-u=1时,表示帧间关联边;步骤S2-2)根据步骤S2-1)得到的码元关联网络,计算每条边对应的码元取值转移概率矩阵Rpq,如下:其中Pi,j,i=0,1,...,rp,j=0,1,...,rq,rp=rq表示第p个码元取值为i,第q个码元取值为j时的转移概率;步骤S2-3)根据步骤S2-2)得到的转移概率矩阵Rpq计算关联指数REpq,计算公式如下:REpq表示两个码元取值相同时的转移概率之和;步骤S2-4)根据步骤S2-3)得到的关联指数REpq,去掉关联指数REpq小于阈值REthr的关联边,得到码元强关联网络D′=(V′,E′),记V′中包含N个顶点,为V′=v1,v2,...,vN。5.根据权利要求4所述的贝叶斯推理的码元改写信息隐藏检测方法,其特征在于,所述步骤S3)具体包括:步骤S3-1)根据步骤S2-4)得到的码元强关联网络,构建码元贝叶斯网络分类器,其网络节点随机变量记为U={X0,X1,…,XM},M为节点的总个数;随机变量相应的取值记为u={u0,u1,…,uM};步骤S3-2)根据步骤S3-1)得到的码元贝叶斯网络分类器,使用Dirichlet分布作为先验分布学习码元贝叶斯网络分类器的参数。6.根据权利要求5所述的贝叶斯推理的码元改写信息隐藏检测方法,其特征在于,所述步骤S3-1)具体包括:步骤S3-1-1)以压缩语音帧类别作为码元贝叶斯网络分类器的根节点X0,帧类别为:未隐写和隐写;步骤S3-1-2)根据步骤S2-4)得到的码元强关联网络,将顶点V′中每个码元取值范围分为多个取值集合;其中,对于取值范围大于255的码元,利用训练样本计算码元取值直方图,将码元取值直方图按降序排列,将排序后的取值均匀划分为256个取值集合;对于取值范围小于或者等于255的码元,每个取值为一个集合;以码元取值集合作为子节点X1,X2,...,XN,构成由X0→X1,X0→X2,...,X0→XN的N条有向边,节点Xi取值对应码元vi的一个取值集合;步骤S3-1-3)根据步骤S2-4)得到的码元强关联网络,若存在帧内关联边<vi[p],vi[q]>,则增加子节点构成由的两条有向边,节点表示帧内码元v[p]和v[q]取值关系,取值关系包括:取值不同和取值相同,取值不同记为0;取值相同记为1;步骤S3-1-4)根据步骤S2-4)得到的码元强关联网络,若存在相邻帧间关联边<vi[p],vi+1[...

【专利技术属性】
技术研发人员:李松斌杨洁邓浩江
申请(专利权)人:中国科学院声学研究所
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1