基于墨粉堆积纹理分析的打印文件鉴别方法技术

技术编号:6982532 阅读:329 留言:0更新日期:2012-04-11 18:40
本发明专利技术提出了一种基于墨粉堆积纹理分析的打印文件鉴别方法。首先,利用高精度显微放大系统采集打印文件上的打印字符笔画图像;然后从打印笔画图像中提取墨粉堆积小块来构造归一化墨粉纹理图;对归一化墨粉堆积纹理图特征的提取,采用局部二进模式,灰度共生矩阵,傅里叶频谱,GABOR以及WAVELET技术提取归一化纹理图像的纹理特征;提取的打印文件的纹理特征利用主成分分析和线性判别分析进行模式分类,以判断两份打印文件是否为相同打印机打印生成。本发明专利技术实现了基于计算机图像分析,文本独立的的自动化打印文件鉴别,准确率达到89%以上。

【技术实现步骤摘要】

本专利技术涉及对打印文件的真伪进行鉴定方法。尤其涉及一种属于公共安全,物证检验领域。
技术介绍
公共安全部门的专家一股通过检测打印材料成分,查找打印瑕疵,提取走纸压痕等传统方法对打印文件进行比对和取证。随着计算机科学的发展,基于计算机的打印文件取证技术又成为新的研究热点,包括分析打印字符的尺寸,打印边缘粗糙度等打印质量特征;分析打印字符图像的灰度共生矩阵特征;提取包含打印信息的水印特征等。传统打印文件取证方法虽然证据性较充分,但针对性太强,应用范围窄,无法对大部分的普通打印文件进行鉴别。如针对墨粉或墨水成分检验的化学和光学方法,无法区分打印材料成分相同的打印文件;打印水印比较方法只针对部分嵌入水印的高档打印机打印文件,大部分普通打印文件没有嵌入水印。现有的计算机方法分析打印字符的尺寸以及细节打印质量特征,这些已有的取证技术提取的特征大都较简单,维数较低,其准确率、适用范围和实用性也无法达到支撑司法依据的标准。总的来说,计算机打印文件取证的研究处于起步阶段,成果有限,准确度离实用还较远。不同打印机打印的相同字符,在肉眼下几乎没有差别,难以区分,但在放大设备观察下,显现了字符形状,字符边缘粗糙度,打印墨粉堆积密度等多种差异。本专利技术就是通过比较打印墨粉堆积密度特征,来进行打印文件司法鉴定和取证。
技术实现思路
本专利技术以公共安全案件中最常见的激光打印文件为对象,用计算机视觉和模式识别技术,提供一种。本专利技术把判断打印文件是否为相同打印文件的检验鉴别问题,作为模式识别中的分类问题来解决。本专利技术的一种,包括打印文件图像采集,打印文件预处理构造墨粉堆积纹理图,纹理图特征提取和特征变换,最后按特征进行打印文件聚类和分类,鉴别流程框图如图2。具体是先利用高精度显微放大系统采集打印文件上的打印字符笔画图像;然后从打印笔画图像中提取墨粉堆积小块来构造归一化墨粉纹理图;对归一化墨粉堆积纹理图提取纹理特征;对提取的纹理特征利用主成分分析和线性判别分析进行模式分类,以判断两份打印文件是否为相同打印机打印生成。本专利技术的基于墨粉堆积纹理分析鉴别打印文件方法中,采集到的打印文件上的打印字符笔画图像要经过预处理来提取归一化打印墨粉堆积纹理图像,预处理步骤包括先通过图像分割定位打印笔画中心的稳定墨粉覆盖区域,再从这些区域中提取16X16的小墨粉堆积图片拼接成大小为256X256的归一化纹理图像;对构造出的归一化纹理图像进行局部灰度均衡,实现纹理图像的背景均衡;最后得到归一化的256X256像素的灰度纹理图像。本专利技术在图像预处理中的小墨粉堆积图片和拼接的归一化纹理图像尺寸均可调離iF. ο本专利技术的中,打印文件纹理特征的提取,采用局部二进模式,灰度共生矩阵,傅里叶频谱,GABOR以及WAVELET技术提取归一化纹理图像的纹理特征。本专利技术的方法中,所述的模式分类采用SVM分类器,ADAB00ST分类器,以及多特征和多分类器融合方法。本专利技术的适用于普通黑白激光打印文件、彩色激光打印文件和激光复印文件的鉴别。本专利技术的打印文件图像采集所使用印刷字符图像放大扫描系统结构如图3。现有的扫描仪扫描到的文件图像分辨率较底,达不到观测要求。真正能够反映打印机身份的许多细节特征只有在高倍放大显微镜的观察下才能显现,因此选择高倍放大镜头加CCD摄像机来采集打印文件图像;图像放大倍数要满足清晰的显示打印文件上墨粉堆积形态等细节(40 60倍);采用LED灯照明提供充足均勻的光线。本专利技术中图像预处理,通过去除打印文件图像中的背景区域以及打印字符的边界区域,提取打印字符笔画中心区域的稳定墨粉覆盖图像来构造统一尺寸的纹理图片。先通过图像分割定位打印笔画中心的稳定墨粉覆盖区域,再从这些区域中提取16X16的小墨粉堆积图片拼接成大小为256X256的归一化纹理图像;对构造出的归一化纹理图像进行局部灰度均衡,从而减少了非均勻光照的影响,实现纹理图像的背景均衡。图4. a-d给出了打印文件的墨粉堆积纹理提取过程。图4. d和图4. f给出了两台不同打印机中提取的归一化纹理,可以看出,两台打印机的墨粉堆积纹理明显不同图4.d 中的打印墨粉堆积纹理较为细密,而图4. f中的墨粉堆积纹理较为粗糙。构造归一化纹理图时,子图片尺寸的选择会影响纹理特征的正确获得,一股大的纹理窗口有利于纹理特征的计算,因为它包含了更多的像素点,可以获得较准确的纹理特征,但是打印字符笔画的宽度限制了纹理窗口的最大可能宽度;如果窗口太小则无法捕捉影像目标的独特的纹理特征。所以,子图片尺寸GX4,8X8,16X16)是要根据实验结果进行选取的。本专利技术采用16X16是经过试验得到的较佳尺寸。纹理特征提取的方法很多,本专利技术特征提取和选择采用纹理分类性能较好的局部二进模式(LBP),灰度共生矩阵(GLCM),傅里叶频谱(FT),GABOR, WAVELET等技术提取归一化纹理图像的纹理特征。特征提取后可进行选择和特征变换来提高分类准确率。本专利技术基于主成分分析(PCA)和线性判别分析(LDA)的墨粉堆积纹理鉴别构造打印文件的墨粉堆积纹理图,提取纹理特征后,利用PCA和LDA方法进行特征选择。基于墨粉堆积纹理融合PCA+LDA特征分类识别的具体算法,实现步骤如下1、给定不同打印机生成的N份打印文件,经过图像采集,预处理和特征提取,得到墨粉堆积纹理特征的训练集f\,i = 1,2,…,N,先计算协方差矩阵,然后求其m(m彡N-1) 个最大特征值对应的特征向量WlPM,'",wr,-, C这m个特征向量构成PCA投影矩阵Tir 厂 peapeapca~\Kc= Im,…,Wi,…,wm」。2、利用PCA投影矩阵WD。a将训练集η维向量空间转换为降维的m维MEF空间并获4得最佳描述特征 MEFs。即 yi = (υ/,υΛ -,y;)1 = WpjOq-mi-m。),其中 i = 1,2, -,N03、计算由训练集最佳描述特征y1;…,y”…,yN构成的类内散布矩阵Sw*类间散布矩阵Sb,然后计算对应矩阵的k个最大特征值对应的特征向量Wlfld,···,『/",…,Wk"\ 由这k个最大特征值对应的特征向量构成Fisher线性鉴别(LDA)投影矩阵尸,…,fidfld-ΛWi,…,Wk」。4、利用LDA投影矩阵Wfld将MEF空间转换为降维的k维MDF空间,获得对应的最佳分类特征MDFs。即 =(z/,^、…,W = WfldVi,其中i = 1,2,"·,Ν。根据这些对应纹理图像训练集的最佳分类特征向量Z1,…,Zi,…,、组成c类打印文件墨粉纹理特征数据库。5、将某个待识别的墨粉堆积纹理特征χ进行PCA投影变换得到m维MEF空间中的最佳描述特征,y = (y” y2,…,ym)T = ffpcaT (x-m-m0)。6、对m维的最佳描述特征向量y进行LDA投影变换得到k维MDF空间中的最佳分类特征 Z = (zi; Z2, ···, Zk)T = WfldV07、利用欧氏距离分类器,计算待识别墨粉堆积纹理与训练集(特征数据库)中的所墨粉堆积纹理类的特征匹配距离,并与阈值比较得出鉴别结论。当两份打印文件特征匹配距离值小于阈值,则判为相同打印机打印生成;若特征匹配距离值大于阈值,则判为不同打印机打印生成。为避免已有数字取证方本文档来自技高网...

【技术保护点】
1.一种基于墨粉堆积纹理分析的打印文件鉴别方法,其特征在于:首先,利用高精度显微放大系统采集打印文件上的打印字符笔画图像;然后从打印笔画图像中提取墨粉堆积小块来构造归一化墨粉纹理图;对归一化墨粉堆积纹理图提取纹理特征;对提取的纹理特征利用主成分分析和线性判别分析进行模式分类,以判断两份打印文件是否为相同打印机打印生成。

【技术特征摘要】

【专利技术属性】
技术研发人员:邓伟徐家臻陈迪
申请(专利权)人:华中师范大学
类型:发明
国别省市:83

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1