基于图像物理度量指标的激光打印文件量化检验方法技术

技术编号:23315623 阅读:20 留言:0更新日期:2020-02-11 17:59
本发明专利技术属于公安技术文件检验鉴定领域,尤其涉及一种基于图像物理度量指标的激光打印文件量化检验方法,包括(1)基于灰度特征的量化检验;(2)基于面积特征的量化检验;(3)基于连通性特征的量化检验;(4)基于边缘特征的量化检验;(5)利用随机森林算法对打印机进行区分,通过随机森林算法程序,对打印机的测量数据进行运算,得出结果。本发明专利技术准确率高,可对不同品牌打印机进行有效区分,且能得到理想的区分结果,同时得出相同字、相同偏旁及相同笔画数特征参数的区分度排序,为实际办案过程的特征选取提供参考依据。

A quantitative inspection method of laser printing documents based on physical metrics of images

【技术实现步骤摘要】
基于图像物理度量指标的激光打印文件量化检验方法
本专利技术属于公安技术文件检验鉴定领域,尤其涉及一种基于图像物理度量指标的激光打印文件量化检验方法。
技术介绍
2002年,JohnOliver等利用ImageXpert软件对根据线宽、粗糙度、点圆度和喷墨卫星滴数等特征对打印文件进行区分。作者以字母“i”为研究对象,选择不同品牌的印刷机具的印刷文件进行分析,对于喷墨打印文件,通过测量线条粗糙度、点的圆度以及字符周围喷溅的墨迹数量和面积等,得到三种不同品牌打印文件之间的区别。对于激光打印和静电复印文件,通过图像的清晰度、正反图像的面积比的测量来显示不同品牌印刷机具的区别。2013年,梁政等利用ImageXpert软件对理光MP4000BP激光打印复印一体机的打印文件和复印文件进行灰度特征值的测量,结果表明两种文件的灰度值的平均值和95%置信区间存有明显的差异,且这种差异较为稳定:打印件的平均值约为50,而复印件约为53;打印件的95%置信区间介于50和51.5之间,而复印件的置信区间介于52.5与54之间。2015年,牟小彬等对市场上9个主流品牌共18种型号的激光打印机打印文件,运用ImageXpert软件对连通性、灰度值以及面积三个特征的116项测量参数进行整幅测量,并对测量结果运用决策树C4.5算法进行分类。结果表明,使用15项参数组合,能够将18台不同型号激光打印机3600页打印样本中3596页正确分类,正确率为99.8%。2013年,韩星周等对激光连续打印文件特征变化进行了研究,利用ImageXpert软件对HPLASERJETPROM1136打印复印一体机1个硒鼓至墨粉打印完的2100页文件进行分析,实验收集42组210张样本为研究对象,主要研究“。”特征变化趋势,通过对11个灰度特征值进行测量,发现4个特征值属于较为稳定的特征,为激光打印文件的同台打印机鉴别的量化研究提供了思路和基础。上述研究有的是针对喷墨打印机的,有的是针对同一台一体机的打印件和复印件之间的区分,有的是针对同一台一体机的不同时间段打印文件之间的区分,牟小彬的研究成果虽然涉及不同品牌激光打印机打印文件之间的区分,但是选取几个参数对整幅文件进行测量,采用的数学算法是决策树算法。基于图像物理度量指标的激光打印文件量化检验方法不仅对整幅文件进行测量对字符也进行测量分析,采用的数学算法是随机森林算法。由于经济的发展和社会的不断进步,当今世界已经进入信息技术时代,办公设备的种类也越来越多,其中激光打印机是应用范围比较广泛的办公设备之一,随之而来的与打印文件相关的刑事案件、经济纠纷等出现的越来越多,犯罪嫌疑人通过伪造、变造打印文件以达到违法犯罪的目的。因此,在文件检验领域,打印文件检验成为一个新兴的、重要的研究课题。打印文件检验主要应用在:判定文件的具体形成方式;对涉案打印设备进行种属鉴别和同一认定;打印文件是否存在换页和添加打印的变造事实等。目前,从检验鉴定的技术方法来说,对打印文件进行检验的主要检验方法分为两类:一是采用现代仪器分析技术对墨粉、墨水等打印材料的成分进行分析,二是对印刷文件的图文进行形态学层面的比对分析。两类检验方法都带有一定的局限性,对文件检验技术人员有着较高的素质要求,这也使得打印文件检验成为文件检验领域的一大难题。
技术实现思路
本专利技术旨在克服现有技术的不足之处而提供一种操作简单,准确率高,可对不同品牌打印机进行有效区分,且能得到理想的区分结果,同时得出相同字、相同偏旁及相同笔画数特征参数的区分度排序,为实际办案过程的特征选取提供参考依据的基于图像物理度量指标的激光打印文件量化检验方法。为解决上述技术问题,本专利技术是这样实现的:基于图像物理度量指标的激光打印文件量化检验方法,包括如下步骤:(1)基于灰度特征的量化检验,其中包括相同字的灰度特征测量分析、相同偏旁的灰度特征测量分析及相同笔画数的灰度特征测量分析;(2)基于面积特征的量化检验,对相同字符、相同偏旁、相同笔画数且字形相近字符的面积特征参数进行测量,并将测量数据绘制成散点图,进行统计分析得到均值、置信区间相关统计量;(3)基于连通性特征的量化检验,对相同字符、相同偏旁、相同笔画数且字形相近字符的连通性特征进行测量分析,并将测量数据绘制成散点图,进行统计分析得到均值、标准差、置信区间相关统计量;(4)基于边缘特征的量化检验,对相同字符、相同偏旁、相同笔画数且字形相近字符的边缘/线条特征参数进行测量,并将测量数据绘制成散点图,进行统计分析得到均值、标准差、置信区间相关统计量;(5)利用随机森林算法对打印机进行区分,通过随机森林算法程序,对打印机的测量数据进行运算,得出结果。作为一种优选方案,本专利技术所述步骤(1)中,相同字的灰度特征测量分析是选择待检验材料中的相同单字作为测量分析对象,对灰度特征参数进行测量,得到测量数据的散点图并对数据进行统计分析得到均值、置信区间相关统计量。进一步地,本专利技术所述步骤(1)中,相同字的灰度特征测量分析中,利用IX系统对14个灰度特征参数进行测量,通过Excel软件得到测量数据的散点图,利用SPSS软件对数据进行统计分析得到均值、置信区间相关统计量。进一步地,本专利技术所述步骤(1)中,选取待检验材料的相同偏旁进行测量分析是对测量后的数据制作散点图,然后对测量数据进行统计分析,计算其均值、标准差和置信区间。进一步地,本专利技术所述步骤(1)中,选取待检验材料的相同偏旁进行测量分析,对测量后的数据先是利用Excel软件制作散点图,然后利用SPSS软件对测量数据进行统计分析,计算其均值、标准差和置信区间。进一步地,本专利技术所述步骤(1)中,相同笔画数的灰度特征测量分析是通过挑选字符形态接近的汉字进行测量。进一步地,本专利技术所述步骤(1)中,少笔画主要选择2画、3画及4画中的常用汉字进行了测量;多笔画主要选择11画、12画及13画中的常用汉字进行了测量。进一步地,本专利技术所述步骤(5)中,对待检验材料的特征参数进行随机森林算法编程处理,得到对应特征区分度强弱的排序以及分类准确率结果,得出特征区分度的强弱。进一步地,本专利技术所述步骤(5)中,对待检验材料的33个特征参数进行随机森林算法编程处理,得到33个特征区分度强弱的排序以及分类准确率结果,选择位于前30%的特征参数作为区分度较强的特征,也就是排序前十的特征参数,计算前十个特征中的四大特征所包含的参数的数量,得出四大特征区分度的强弱。本专利技术通过构建随机森林模型对不同品牌的打印机进行区分,能得到理想的区分结果,准确率在90%以上,有的区分结果达到100%。同时,得出相同字、相同偏旁、相同笔画数的特征参数的区分度排序,从而为实际办案过程中的特征选取提供了参考依据。本专利技术基于图像物理度量指标的激光打印文件量化检验方法是根据ISO/IEC13660标准中对印刷图像测量内容的定义进行测量评价,选取面积特征、灰度特征、线条/边缘特征以及连通性特征对激光打印文件的单个字本文档来自技高网
...

【技术保护点】
1.基于图像物理度量指标的激光打印文件量化检验方法,其特征在于,包括如下步骤:/n(1)基于灰度特征的量化检验,其中包括相同字的灰度特征测量分析、相同偏旁的灰度特征测量分析及相同笔画数的灰度特征测量分析;/n(2)基于面积特征的量化检验,对相同字符、相同偏旁、相同笔画数且字形相近字符的面积特征参数进行测量,并将测量数据绘制成散点图,进行统计分析得到均值、置信区间相关统计量;/n(3)基于连通性特征的量化检验,对相同字符、相同偏旁、相同笔画数且字形相近字符的连通性特征进行测量分析,并将测量数据绘制成散点图,进行统计分析得到均值、标准差、置信区间相关统计量;/n(4)基于边缘特征的量化检验,对相同字符、相同偏旁、相同笔画数且字形相近字符的边缘/线条特征参数进行测量,并将测量数据绘制成散点图,进行统计分析得到均值、标准差、置信区间相关统计量;/n(5)利用随机森林算法对打印机进行区分,通过随机森林算法程序,对打印机的测量数据进行运算,得出结果。/n

【技术特征摘要】
1.基于图像物理度量指标的激光打印文件量化检验方法,其特征在于,包括如下步骤:
(1)基于灰度特征的量化检验,其中包括相同字的灰度特征测量分析、相同偏旁的灰度特征测量分析及相同笔画数的灰度特征测量分析;
(2)基于面积特征的量化检验,对相同字符、相同偏旁、相同笔画数且字形相近字符的面积特征参数进行测量,并将测量数据绘制成散点图,进行统计分析得到均值、置信区间相关统计量;
(3)基于连通性特征的量化检验,对相同字符、相同偏旁、相同笔画数且字形相近字符的连通性特征进行测量分析,并将测量数据绘制成散点图,进行统计分析得到均值、标准差、置信区间相关统计量;
(4)基于边缘特征的量化检验,对相同字符、相同偏旁、相同笔画数且字形相近字符的边缘/线条特征参数进行测量,并将测量数据绘制成散点图,进行统计分析得到均值、标准差、置信区间相关统计量;
(5)利用随机森林算法对打印机进行区分,通过随机森林算法程序,对打印机的测量数据进行运算,得出结果。


2.根据权利要求1所述基于图像物理度量指标的激光打印文件量化检验方法,其特征在于:所述步骤(1)中,相同字的灰度特征测量分析是选择待检验材料中的相同单字作为测量分析对象,对灰度特征参数进行测量,得到测量数据的散点图并对数据进行统计分析得到均值、置信区间相关统计量。


3.根据权利要求2所述基于图像物理度量指标的激光打印文件量化检验方法,其特征在于:所述步骤(1)中,相同字的灰度特征测量分析中,利用IX系统对14个灰度特征参数进行测量,通过Excel软件得到测量数据的散点图,利用SPSS软件对数据进行统计分析得到均值、置信区间相关统计量。


4.根据权利要求3所述基于图像物理...

【专利技术属性】
技术研发人员:李彪屈音璇秦静
申请(专利权)人:中国刑事警察学院
类型:发明
国别省市:辽宁;21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1