当前位置: 首页 > 专利查询>南京大学专利>正文

一种基于傅里叶残差值的打印文件的鉴别方法技术

技术编号:16819666 阅读:40 留言:0更新日期:2017-12-16 13:18
本发明专利技术公开了一种基于傅里叶残差值的打印文档鉴别方法,解决打印文档之间没有相同字符或者相同字符较少的情况下的鉴别问题。具体方法是:获取一张打印文档的文档图像;提取文档图像的文本行,找到最大的打印区域;提取文档图像的傅里叶残差图,在残差图上提取灰度,熵的统计特征,对这些特征利用分类器进行分类。基于傅里叶残差值的打印文档鉴别方法,可以很好的区分不同打印机之间的打印特性,同时,也不需要打印文档之间有太多相同字符,提高了打印文档鉴别方法的适用范围和准确率。

A method of identifying print files based on Fourier residual value

The invention discloses a printed document identification method based on Fourier residual value, which solves the problem of identification between printed documents without the same characters or fewer characters. The specific method is: document image to obtain a printed document; extracting text lines of the document image, find the maximum print area; extraction Fourier residual graph of the document image, extracting gray in the residual graph, statistical characteristic entropy, these features are classified by the classifier. The printed document identification method based on Fourier residual value can well distinguish the printing characteristics between different printers. At the same time, there is no need to print too many identical characters between documents, which improves the application scope and accuracy of printed document identification methods.

【技术实现步骤摘要】
一种基于傅里叶残差值的打印文件的鉴别方法
本专利技术涉及打印文件的源机认定技术的领域,尤其涉及基于傅里叶残差值的打印文件的鉴别方法。
技术介绍
由于打印机在生产时的参数配置差异以及日常使用中的损耗情况的不同,因此,打印出的文档也不相同,这是打印文档机源认定技术的基础,所谓打印文档的鉴别,就是判断两份打印文档是否来自同一台打印机。随着计算机技术的发展和打印机的普及,打印文档取代手写文件作为承载信息的媒介已经成为一种趋势。与此同时,对于打印文件的修改、伪造等犯罪也正在兴起。有越来越多的工作投入到对打印文档的鉴别上。目前打印文档识别技术中,有的运用小波分析的方法提取单个字符的频域特征做训练样本,使用分类器进行单字符识别。有的基于纹理信息,利用Gabor滤波器提取字符特征进行识别。其识别率很高,但它的维数高,计算量大。但是这些方法都限制在对打印的字符的识别,无法达到打印文档内容无关的识别,因此提出一种打印文档内容无关的鉴别方法是很有必要的。打印文档字符的傅里叶残差信息承载了其打印机的特性,可利用这些残差信息鉴别两份打印文件是否来自同一打印文件。同时通过对这些残差信息统计建模,以解决打印文档内本文档来自技高网...
一种基于傅里叶残差值的打印文件的鉴别方法

【技术保护点】
一种基于傅里叶残差值的打印文档鉴别方法,其特征在于,包括以下步骤:步骤1,获取一张打印文档的文档图像;步骤2,提取文档图像的文本行,找到最大的打印区域;步骤3,提取文档图像的傅里叶残差图,具体方法是:步骤31,将文档图像转化为灰度图,记为Igray(x,y),其中(x,y)代表文档图像的像素点;步骤32,对灰度图做傅里叶变换转换到频率域,记为F(u,v),其中(u,v)代表频率域空间坐标:

【技术特征摘要】
1.一种基于傅里叶残差值的打印文档鉴别方法,其特征在于,包括以下步骤:步骤1,获取一张打印文档的文档图像;步骤2,提取文档图像的文本行,找到最大的打印区域;步骤3,提取文档图像的傅里叶残差图,具体方法是:步骤31,将文档图像转化为灰度图,记为Igray(x,y),其中(x,y)代表文档图像的像素点;步骤32,对灰度图做傅里叶变换转换到频率域,记为F(u,v),其中(u,v)代表频率域空间坐标:式中,j为复数的虚部单位;步骤33,对傅里叶图在频率域做拉普拉斯滤波:G(u,v)=-(u2+v2)F(u,v),其中,G(u,v)为傅里叶-拉普拉斯滤波增强后的图像;步骤34,重建灰度图像IRG(x,y)和拉普拉斯滤波后的图像IRFL(x,y),将两个图像取绝对差,得到残差图像Ires(x,y):Ires(x,y)=IRG(x,y)-IRFL(x,y)步骤4,对承载打印机特性的残差图提取灰度,熵的统计特征:步骤41,提取残差图像的灰度特征,设残差图一共有M行N列,将每一行,每一列的均值分别记为和步骤42,将每一行,每一列的均值分别与残差图中的每一列,每一行计算自相关系数,记为prow,pcol,:式中,Ires(i,.)为残差图第i行的像素值,Ires(.,j)为残差图第j列的像素值;步骤43,在均值和自相关系数的基础上提取统计特征,一共14个统计特征,分别为的方差,偏度和峰度,记为prow、pcol的均值方差,偏度和峰度,记为σprow,σpcol,γ1prow,γ1pcol,γ2prow,γ2pcol:

【专利技术属性】
技术研发人员:路通王振
申请(专利权)人:南京大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1