一种彩色激光打印文档中黄色斑点阵列信息提取方法技术

技术编号:3976558 阅读:488 留言:0更新日期:2012-04-11 18:40
一种彩色激光打印文档中黄色斑点阵列信息提取方法,属于信号与信息处理技术领域。其特征是利用某些彩色激光打印机的打印文档存在与打印机型号一一对应的黄色斑点信息。通过对黄色斑点进行连通区域的标记,确定连通区域的质心,并对质心图像进行倾斜校正,提取黄色斑点栅格信息,最后通过迭代比较获得打印文档中单个周期的黄色斑点信息。本发明专利技术的效果和益处是帮助刑侦司法部门从彩色激光打印机打印的文档中自动提取出黄色斑点信息,对部分彩色激光打印机的来源进行准确的鉴别和取证。

【技术实现步骤摘要】

本专利技术属于信号与信息处理
,涉及到彩色激光打印文档中黄色斑点阵列 信息提取方法。
技术介绍
激光打印机的制造商很早就考虑到其高性能的办公设备会给伪造文件者提供 方便,于是在打印机输出文件中嵌入了供追查文件来源的水印信息。在电子先锋(EFF, Electronic Frontier Foundation)的 网 站 http://w2.eff.org/Privacy/printers/ docucolor/,2009. 9. 26上,报道了施乐彩色激光打印机在输出文档中嵌入规则的黄色斑点 阵列,如图1所示,以此记录文档的打印机型、打印时间等信息。刘宁、裴蕾、陈春涛等针对 彩色激光打印机的黄点嵌入机制给予了一些实验性研究工作的总结。图1(a)为实际扫描 的带有黄色斑点灰度图像,其尺寸要大于实际;图1(b)为人工绘制的带有黄色斑点灰度图 像,用以说明斑点阵列的编码格式。EFF统计了 18个厂商的209种型号的彩色打印机,具体如表1所示。其中141种 型号含有能够追踪来源的黄色斑点,57种型号不含有,剩余的11种型号未知。能够看出,有 67%的彩色激光打印机嵌入了黄色斑点阵列信息,其它没有嵌入黄色斑点阵列的打印机可 能采用了其它未知的技术嵌入了水印。对于含有黄色斑点的彩色打印文档,通过提取黄点阵列信息准确的找到其来源打 印机型号。但是,占据市场上份额非常大的黑白激光打印机和喷墨打印机是不可能嵌入“黄 色”的墨点水印的。所以这种可靠且简易的方法存在很大的局限性。目前国内有些文献针对于实际刑事案件的需要,对上述黄色斑点阵列信息进行了 相关的研究工作。具体包括刘宁,裴雷收集了 11种不同品牌和型号的电子成像技术的14 台机器(包括彩色激光打印机、彩色模拟复印机、彩色数码复印机)制作的文件,对这些文 件是否有黄点阵列进行了研究,并用人工的方式对有黄点阵列的文件进行了信息提取。陈 春涛,裴雷对施乐DocuColor系列彩色激光打印机的隐写点阵进行了详尽的分析,阐述了 点阵解码的方法,并给出了一个利用Excel获取打印机信息的方法。李江春利用专业设备 VSC25000文检仪等对待检文档进行黄点阵列的检验。表1各品牌彩色激光打印机是否嵌入黄色斑点型号统计表 上述方法均是依靠人工手动提取黄色斑点阵列信息。依靠人工提取黄色斑点阵列息存在成本高、准确率较低、提取效率较低的缺点,
技术实现思路
本专利技术要解决的技术问题是如何自动提取彩色激光打印机的黄色斑点阵列信息, 以弥补目前依靠手动提取的不足。本专利技术旨在实现从彩色激光打印文档中,提取出黄色斑 点阵列信息,以帮助实现追踪文档的打印机来源。本专利技术的技术方案如下1.算法的具体框图对文档图像使用算法提取出黄色斑点阵列,算法具体的框图如图2所示。针对文档图像,首先要检测黄色斑点的质心,然后对质心阵列进行行向和列向倾 斜校正,使用频谱分析方法获得阵列的栅格信息,从而得到全体斑点阵列,最后对全体阵列 各周期求平均值得到单周期的斑点阵列。2.检测黄色斑点区域的质心黄色斑点区域的质心提取过程根据打印文档内容而不相同。对于纯白色文档图像,在RGB三个通道中分别进行基于阈值的二值化处理,选取 阈值为0. 9,得到三幅二值图像Ig,Ib。通过Iyd = Ir and Ig and Ib得到黄色斑点二 值图像。对于纯淡蓝色文档图像,将图像从RGB色彩空间转换至HSV色彩空间,对H分量进 行基于阈值的二值化,选取阈值为0. 5,得到二值图像Ih。实验发现存在很多单像素噪声斑 点,所以需要滤除所有面积为1的连通区域,得到斑点二值图像Iyd。将斑点二值图像Iyd标记连通区域,并提取各连通区域质心。生成另一幅二值图 像,此图像在斑点区域的质心处为1,其他区域均为0,称为斑点质心图像。实验中得到的斑点二值图像和斑点质心图像分别如图3(a)和图3(b)所示。为便 于观察,对斑点质心图像3(b)中的质心进行了放大处理。3.对斑点质心阵列进行行向和列向倾斜校正文档扫描过程中不可避免的存在倾斜角度,需要进行倾斜校正。针对斑点质心图 像,采用经典的行列投影方法进行倾斜校正。斑点质心图像中仅含有单像素点,通过最大化行列投影向量中0元素的个数确定 最佳旋转角度。由于平行线畸变为相交线失真的存在,由行和列投影向量确定的最佳旋转 角度往往并不相等,取两者的均值也并不能明显改善倾斜校正效果。针对上述问题,实验中对行列坐标分别进行旋转。根据行投影向量确定最佳旋转 角度,每次进行图像旋转对行坐标进行处理时,列坐标保持不变;而对列坐标进行处理时, 行坐标保持不变。旋转角度步进为仅使坐标产生单像素变化的角度,搜索范围在实验中视 情况确定。搜索最优旋转角度的示例如图4所示,其中列、行向最优旋转角度分别在第55 和43个步进角度处出现。4.提取斑点阵列栅格信息使用频谱分析方法获得黄色斑点阵列的栅格步长信息。对倾斜校正斑点质心图像 的行、列投影向量进行傅立叶变换,其幅度谱中峰值频率所对应的时域值代表了行、列向栅D N格步长。步长R使用公式& = y—进行计算,其中N为离散傅立叶变换的点数,f_为基频7 max频率值。所谓的基频就是指在傅立叶变换幅度谱中具有最大幅值的频率。举例说明如图5 所示,5(a)为质心在行投影向量中的累积数值,图5(b)为傅里叶变换幅度,其中峰值点所 对应的数字频率为183,得到对应的行向栅格步长为Rmw = 3300/183 = 18个像素。利用此 方法得到相应的列向栅格步长R。。”依据栅格步长,对图像中的质心进行对齐。首先按照先行后列的顺序寻找质心点, 将第一个黄点称为基准点,行列坐标分别为x和y,然后以该基准点为中心,以Rraw和Rral 为长和宽取其栅格块,以此栅格块大小为基础,在图像上按照先行后列的顺序无重叠的移 动,假设移动到第m行,第n列个栅格块,当有黄点出现在栅格块中时,将其行坐标修改为 x+(m-l)XRraw,列坐标改为y+fc-DXR^。循环直至所有质心均处理完毕。这种对齐操作 使属于同一行(列)质心的行(列)坐标统一为相同的值。针对对齐的质心图像,标记栅格信息。寻找列投影向量中不为零的元素,其坐标再 加上半个列栅格步长即是行栅格坐标,所有的列栅格坐标构成列栅格信息;对行投影向量 进行同样处理得到行栅格信息。标记栅格的质心图像如图3(c)所示。55.获得全体斑点阵列在获得栅格信息后,通过判断栅格间的方块图像中是否存在斑点来确定该栅格处 的是否含有斑点。得到页面图像整体的斑点阵列,1号打印机部分斑点阵列如图6所示。由 图6中可知,黄色斑点阵列在行和列方向均存在以周期进行循环的状况,图中在行方向存 在三个周期,在列方向存在两个周期。观察可知,单个周期中有时存在误码。6.获取单周期的黄点阵列信息首先要求出阵列周期所包含栅格的行数L和列数W,采用迭代比较的算法,在行方 向上以lXw为栅格大小的周期无重叠的移动并与所覆盖的栅格信息比较,计算其与所经 历栅格信息的重叠率,其中w = 1,2,3…,在行方向移动栅格求W与1的选择无关,因此本算 法里1 = 20,由于全体斑点阵列中存在误码,w从1开始迭代,直至总重叠率大于等于90%, 所得到的w为所求的周期列数W,同理求出周期行数L,图6中,本文档来自技高网
...

【技术保护点】
一种彩色激光打印文档中黄色斑点阵列信息提取方法,其特征是利用部分彩色激光打印机的打印文档存在与打印机型号一一对应的黄色斑点信息,通过对黄色斑点进行连通区域的标记,确定连通区域的质心,并对质心图像进行倾斜校正,提取黄色斑点栅格信息,最后通过迭代比较获得打印文档中单个周期的黄色斑点信息。

【技术特征摘要】

【专利技术属性】
技术研发人员:孔祥维吴玉宝
申请(专利权)人:大连理工大学
类型:发明
国别省市:91[中国|大连]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1