当前位置: 首页 > 专利查询>上海大学专利>正文

一种多嵌入率含密图像的隐写检测方法技术

技术编号:19426488 阅读:83 留言:0更新日期:2018-11-14 10:49
本发明专利技术涉及一种多嵌入率含密图像的隐写检测方法。本方法是通过不同嵌入率图像训练得到两个集成FLD分类器。第一个集成FLD分类器由低嵌入率图像和载体图像训练得到,其能选择出更好代表载体图像和隐写图像特征的训练样本,将选出的样本和其高嵌入率版本一同训练得到第二个集成FLD分类器。在对未知类别图像分类的主要步骤是:第一个集成FLD分类器对投票数在一定范围内的图像进行分类,再由第二个集成FLD分类器对投票数在一定范围内的剩余图像进行分类,最后未分类图像由第一个集成FLD分类器分类。本发明专利技术方法分别利用这两个集成FLD分类器的优势,因而能够提升对JPEG隐写图像的识别准确率。

【技术实现步骤摘要】
一种多嵌入率含密图像的隐写检测方法
本专利技术涉及一种多嵌入率含密图像的隐写检测方法,针对训练时可得到多个嵌入率的隐写图像的特点,通过高嵌入率图像提升低嵌入率图像的识别准确率。
技术介绍
隐写分析是多媒体信息安全中的重要组成部分,其主要任务是在数字载体中检测是否有秘密信息。在众多的数字载体中最常使用的数字图像,因为一幅512×512大小的数字图像就可以携带足够多的秘密信息。数字图像由于其格式的不同可以分为很多类,JPEG(JointPictureExpertGroup联合图像专家小组)图像因为其压缩和图像重建的效果而在生活中大量使用。很多隐写方法是以JPEG图像为基础进行设计的,将含有秘密信息的隐写图像夹杂在互联网大量正常JPEG图像中进行信息传输,这样就有很高的隐蔽性。目前优秀的JPEG图像隐写方法的特点是:统计特性不变和充足的信息嵌入量。如果嵌入信息时的嵌入率在0.05bpac(bitspernonzeroACDCTcoefficient比特每非零离散余弦变换交流系数),0.1bpac等低嵌入率时,隐写分析对这些优秀的JPEG图像隐写方法的识别准确率不高。隐写分析的一项研究内容是通过抓住隐写图像和正常数字图像之间的差别和隐写算法的原理,提取出能更好区别隐写图像和正常数字图像的隐写分析特征,另一个研究内容是设计符合应用场景的分类器。
技术实现思路
本专利技术的目的是针对已有技术存在的不足,提供一种多嵌入率含密图像的隐写检测方法,针对隐写分析能够在训练分类器时获得多个不同嵌入率的隐写图像特征集,设计新的集成FLD(费舍线性判别)分类器,利用高嵌入率隐写图像来提升低嵌入率图像的识别准确率。为达到上述目的,本专利技术采用如下技术方案:1.一种多嵌入率含密图像的隐写检测方法,其特征在于操作步骤如下:(1)低嵌入率图像和载体图像训练得到EFLD1(集成费舍线性判别分类器1):由载体图像和低嵌入率图像训练得到一个集成FLD分类器EFLD1,并通过EFLD1选择出得票数高的训练图像;(2)低嵌入率图像,高嵌入率图像和载体图像训练得到EFLD2(集成费舍线性判别分类器2):通过上一步选择出的训练图像及其高嵌入率版本训练得到第二个集成FLD分类器EFLD2;(3)交叉验证确定参数值:通过交叉验证确定最终对未分类图像进行分类时使用的参数大小,即确定得票数范围;(4)对未分类图像进行分类:首先使用EFLD1对得票数范围内的测试图像进行分类,剩下的测试图像使用EFLD2对得票数范围内的图像进行分类,还未分类的测试图像由EFLD1分类所述步骤(1)低嵌入率图像和载体图像训练得到EFLD1:首先有3个n×p的隐写分析数据集,n是样本数,p是样本的维度,N是集成分类器子分类器数量。第一个数据集是载体图像隐写分析特征集,第二个数据集是低嵌入率含密图像特征集,第三个数据集是高嵌入率含密图像特征集。生成一组长度等于0.5n,最大值等于n的随机正整数集合,数字之间互相不重复,以这些数字为序号对这三个数据集提取出训练样本,剩下的留作测试样本;经过这样处理后共有0.5n幅载体图像,0.5n幅低嵌入率图像,和0.5n幅高嵌入率图像参与训练;在训练第一个集成FLD分类器之前还需要留下部分训练图像作为交叉验证集,余下训练集会训练得到第一个集成FLD分类器;在训练第一个集成FLD分类器时,要先对样本特征抽取随机子空间,即从样本的原始p维特征中随机选取一定维度;抽取载体图像和低嵌入率图像样本的随机子空间后,可计算得到该FLD子分类器的最佳投影方向;可根据公式(1)优化计算得到最佳投影方向,也可使用下述替代方法:[1]计算类内散度矩阵:对这两类样本分别计算每一个特征值的均值,并得到这两类特征的均值差;每一类特征减去自身特征值的均值并和该计算结果的转置矩阵相乘,再将两类特征计算结果相加得到类内散度矩阵。[2]计算两类均值差矩阵:该矩阵实际上就是[1]中计算得到的两类均值差矩阵。[3]增加L2优化项:将类内散度矩阵加上一个和其矩阵大小相同并乘上10-10的单位矩阵。[4]计算得到最佳投影方向:增加L2优化项的类内散度矩阵除以两类均值差矩阵就得到近似的最佳投影方向。(1)(2)(3)其中是类内散度矩阵,是类间散度矩阵,表示第类的均值,表示第类中第个图像特征向量,表示所有训练数据的均值。得到最佳投影方向后,计算判决门限b;具体计算方法为,将训练样本乘以得到投影结果,取b为投影结果的最小值,然后不断的增加b的大小,当分类准确率最大时,此时的b就是判决门限。重复N次后得到一个共有N个子分类器的集成FLD分类器EFLD1;使用EFLD1对训练样本进行分类,可得到所有训练图像的投票结果;从中取出得票数在一定范围内的训练图像和这些训练图像对应的高嵌入率图像;这些取出的图像由于得到的票数较高,说明有较多的子分类器的判断是相同的,那么这些图像能够更好的体现出隐写图像或者载体图像的特点。所述步骤(2)低嵌入率图像,高嵌入率图像和载体图像训练得到EFLD2:有了得票数高的载体图像和低嵌入隐写图像及其高嵌入率的版本后,训练一个新的集成FLD分类器EFLD2,但是训练过程和第一步中的略有不同;因为选出图像的数量一般来说是比第一步中的训练图像数量要少的,所以每次训练子分类器时首先采用bootstrap(重复抽样)方法对这些少量的样本进行重采样生成新的训练集;通常来说每次bootstrap后有一定数量的样本没有被抽取到,这些样本被用于OOB(outofbag袋外错误率)测试来确定参数的值;在训练时,会缓慢的不断加入或去除一定数量的高嵌入率图像,并在这个过程中选择出一个OOB效果最好的子分类器;同样循环N次后得到一个共有N个子分类器的集成FLD分类器EFLD2。所述步骤(3)交叉验证确定参数值:训练得到两个集成FLD分类器EFLD1和EFLD2后,还需要额外计算一个测试时使用的参数,这个参数的作用是确定测试时集成分类器的判别阈值;具体方法是利用步骤(1)中未参与训练分类器的训练样本进行交叉验证,取使得交叉验证结果最好的参数值。所述步骤(4)对未分类图像进行分类:首先使用EFLD1对测试样本进行判断,EFLD1仅分类投票数在一定范围内的测试样本;然后使用有高嵌入率样本参与训练的EFLD2对余下的测试样本进行分类,同样仅分类投票数在一定范围内的测试样本,对已经被分类的测试样本直接跳过;经过这两步之后会有一些测试样本还未分类,这些测试样本由EFLD1进行分类;这是由于低嵌入率图像和载体图像的最佳判决平面和判决门限是在EFLD1的子分类器中得到的,因而余下的未分类测试样本在EFLD1下有最高的识别准确率;最终的样本预测结果由三部分组成,EFLD1对高票数样本的判别,EFLD2对高票数样本的判别和EFLD1对所有剩下样本的判别,如果第三部分中存在投票结果为0的样本,那么EFLD1将随机对样本分类,通常需要随机判断的样本的数量是非常少的;样本被分类后,无论对错,之后的分类器不会再对这个样本进行分类,因而这三部分不会出现对同一个样本重复分类情况;这样针对隐写图像有多个嵌入率的特点而设计的新集成FLD分类器,能够提升隐写分析准确率。本专利技术与现有技术相比较,具有如下显而易见的突出实质性特点和显著的技术进步:本文档来自技高网...

【技术保护点】
1.一种多嵌入率含密图像的隐写检测方法,其特征在于操作步骤如下:(1)低嵌入率图像和载体图像训练得到EFLD1:由载体图像和低嵌入率图像训练得到一个集成FLD分类器EFLD1,并通过EFLD1选择出得票数高的训练图像;(2)低嵌入率图像,高嵌入率图像和载体图像训练得到EFLD2:通过上一步选择出的训练图像及其高嵌入率版本训练得到第二个集成FLD分类器EFLD2;(3)交叉验证确定参数值:通过交叉验证确定最终对未分类图像进行分类时使用的参数大小,即确定得票数范围;(4)对未分类图像进行分类:首先使用EFLD1对得票数范围内的测试图像进行分类,剩下的测试图像使用EFLD2对得票数范围内的图像进行分类,还未分类的测试图像由EFLD1分类。

【技术特征摘要】
1.一种多嵌入率含密图像的隐写检测方法,其特征在于操作步骤如下:(1)低嵌入率图像和载体图像训练得到EFLD1:由载体图像和低嵌入率图像训练得到一个集成FLD分类器EFLD1,并通过EFLD1选择出得票数高的训练图像;(2)低嵌入率图像,高嵌入率图像和载体图像训练得到EFLD2:通过上一步选择出的训练图像及其高嵌入率版本训练得到第二个集成FLD分类器EFLD2;(3)交叉验证确定参数值:通过交叉验证确定最终对未分类图像进行分类时使用的参数大小,即确定得票数范围;(4)对未分类图像进行分类:首先使用EFLD1对得票数范围内的测试图像进行分类,剩下的测试图像使用EFLD2对得票数范围内的图像进行分类,还未分类的测试图像由EFLD1分类。2.根据权利要求1所述的一种多嵌入率含密图像的隐写检测方法,其特征在于:所述步骤(1)低嵌入率图像和载体图像训练得到EFLD1:有3个n×p的隐写分析数据集,n是样本数,p是样本的维度,N是集成分类器子分类器数量,第一个数据集是载体图像隐写分析特征集,第二个数据集是低嵌入率含密图像特征集,第三个数据集是高嵌入率含密图像特征集,生成一组长度等于0.5n,最大值等于n的随机正整数集合,数字之间互相不重复,以这些数字为序号对这三个数据集提取出训练样本,剩下的留作测试样本;经过这样处理后共有0.5n幅载体图像,0.5n幅低嵌入率图像,和0.5n幅高嵌入率图像参与训练;在训练第一个集成FLD分类器之前还需要留下部分训练图像作为交叉验证集,余下训练集会训练得到第一个集成FLD分类器;在训练第一个集成FLD分类器时,要先对样本特征抽取随机子空间,即从样本的原始p维特征中随机选取一定维度;抽取载体图像和低嵌入率图像样本的随机子空间后,可计算得到该FLD子分类器的最佳投影方向;重复N次后得到一个共有N个子分类器的集成FLD分类器EFLD1;使用EFLD1对训练样本进行分类,可得到所有训练图像的投票结果;从中取出得票数在一定范围内的训练图像和这些训练图像对应的高嵌入率图像。3.根据权利要求1所述的一种多嵌入率含密...

【专利技术属性】
技术研发人员:冯国瑞孙物一钟凯
申请(专利权)人:上海大学
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1