一种书刊印刷检错系统及其方法技术方案

技术编号:38027838 阅读:9 留言:0更新日期:2023-06-30 10:54
本发明专利技术涉及书刊印刷检错技术领域,且公开了一种书刊印刷检错系统及其方法,包括目标对象信息采集模块、数据预处理模块、文本检错模块、图像检错模块、格式检错模块、目标对象整体分析模块、综合评价模块以及人机交互模块,通过设有目标对象整体分析模块与综合评价模块,通过文本错误率计算公式得出文本错误率,通过格式差异率计算公式得出格式错误率,再结合图像差异率得出目标对象的整体合格情况,多标准衡量书刊印刷错误率情况,并对多个目标对象进行整体分析,从而得出印刷整体合格情况,根据批次合格率对设备性能进行初步评估,避免因设备本身原因降低印刷质量从而造成损失。备本身原因降低印刷质量从而造成损失。备本身原因降低印刷质量从而造成损失。

【技术实现步骤摘要】
一种书刊印刷检错系统及其方法


[0001]本专利技术涉及书刊印刷检错
,更具体地涉及一种书刊印刷检错系统及其方法。

技术介绍

[0002]印刷的数字化问题已成为国内外相关理论与技术的研究关注热点,它可以广泛应用于机关、图书馆、档案馆、资料馆等相关行业的使用,具有很大的实用性,基于图像处理与模式识别理论的光学字符识别技术,已经实现了印刷文字的自动输入,通常在印刷书刊前,为了确保输出的正确性,会对印刷的书刊进行检查处理。
[0003]但是现有的印刷检错大部分只针对文字总分进行检错,未对书刊中的图像以及格式问题进行检错,而类书刊中存在诸多图像元素,无法对图像元素进行检错,同时未注重对书刊格式问题的检错,因而检错覆盖面较窄,大多通过人工方式进行检错,效率较低,同时,未通过对书刊的检错结果进行进一步分析,未基于书刊的检错结果来判断机器是否需要进行维护保养或维修,以确保后续印刷工作的正常进行,无法避免因设备本身原因降低印刷质量,造成损失。

技术实现思路

[0004]为了克服现有技术的上述缺陷,本专利技术提供了一种书刊印刷检错系统及其方法,以解决上述
技术介绍
中存在的问题。
[0005]本专利技术提供如下技术方案:一种书刊印刷检错系统,包括:目标对象信息采集模块:通过采集n个目标对象的文本信息、图像信息以及格式信息,所述目标对象为待打印的书刊;数据预处理模块:用于对采集的单个目标对象信息数据进行清洗降噪与分类,提取出文本数据与图像数据,所述单个目标对象为单本书刊;文本检错模块:通过自然语言处理对数据预处理模块的文本数据进行分词处理,并与样本数据进行对比,对错误处进行标记;图像检错模块:通过细粒度识别对数据预处理模块的图像数据进行差异对比,通过余弦相似度计算公式计算得出图像差异率β;格式检错模块:通过对数据预处理模块中文本数据的各个部分进行定位,提取各部分的格式信息,与样本数据进行比对;目标对象整体分析模块:包括文本分析警示单元、格式分析警示单元以及合格标准检测单元,通过分析文本检错模块、图像检错模块以及格式检错模块的数据,判断该目标对象是否达到印刷合格标准;综合评价模块:通过目标对象整体分析模块中合格标准检测单元的判断结果对n个目标对象的整体合格率进行分析,通过总体合格率计算公式计算得出批次合格率ω,并与标准值进行对比,对设备性能进行初步评估。
[0006]优选的,所述文本分析警示单元通过文本错误率计算公式计算得出文本错误率α,所述格式分析警示单元通过格式差异计算公式计算得出格式错误率γ,所述合格标准检测单元通过对文本错误率α、格式错误率γ以及图像差异率β进行综合分析,判断目标对象是否达到印刷合格标准。
[0007]优选的,所述余弦相似度公式为:,其中,H
i
为图像的颜色向量,H1为样本图像的颜色标准向量,,其中,h(x
ij
)为像素x
ij
的出现频率,,其中,x
ij
为图像中某一特定颜色,s(x
ij
)为该像素的个数。
[0008]优选的,所述文本错误率计算公式为:,其中,c为文本检错模块对错误处进行标记的数量,z为目标文本的全部字数。
[0009]优选的,所述格式差异计算公式为:,其中,,其中,A为样本格式,B为目标对象的格式,w
i
为样本格式A的格式特征字符串,c
j
为目标对象的格式特征字符串,m为样本格式特征字符串的数量,n为目标对象的格式特征字符串的数量。
[0010]优选的,所述总体合格率计算公式为:,其中,η为合格标准检测单元判定为合格的目标对象数量。
[0011]一种书刊印刷检错方法,用于实施上述任一所述的一种书刊印刷检错系统,其特征在于:包括以下步骤:步骤S11:目标对象信息采集:采集n个目标对象的文本信息、图像信息以及格式信息;步骤S12:数据预处理:对采集的单个目标对象信息数据进行清洗降噪与分类,提取出文本数据与图像数据;步骤S13:文本检错:通过自然语言处理对步骤S12中的文本数据进行分词处理,并与样本数据进行对比,对错误处进行标记;步骤S14:图像检错:通过细粒度识别对步骤S12中的图像数据进行差异对比,通过余弦相似度计算公式计算得出图像差异率β;步骤S15:格式检错:通过对步骤S12中文本数据的各个部分进行定位,提取各部分的格式信息,与样本数据进行比对;步骤S16:对目标对象进行整体分析:通过分析步骤S13、步骤S14以及步骤S15中的数据,判断该目标对象是否达到印刷合格标准;步骤S17:通过步骤S16中的判断结果对n个目标对象的整体合格率进行分析,通过总体合格率计算公式计算得出批次合格率ω,并与标准值进行对比,对设备性能进行初步
评估;步骤S18:对步骤S16与步骤S17的数据进行结果显示与反馈。
[0012]本专利技术的技术效果和优点:本专利技术通过设有目标对象整体分析模块与综合评价模块,有利于通过文本错误率计算公式得出文本错误率,通过格式差异率计算公式得出格式错误率,再结合图像差异率得出目标对象的整体合格情况,多标准衡量书刊印刷错误率情况,并对多个目标对象进行整体分析,从而得出印刷整体合格情况,根据批次合格率对设备性能进行初步评估,利用检错结果进一步分析,以此来判定设备是否需要进行维护保养或更换,确保后续印刷工作的正常进行,避免因设备本身原因降低印刷质量从而造成损失。
附图说明
[0013]图1为本专利技术的一种书刊印刷检错系统结构图。
[0014]图2为本专利技术的一种书刊印刷检错方法流程图。
具体实施方式
[0015]下面将结合本专利技术中的附图,对本专利技术中的技术方案进行清楚、完整地描述,另外,在以下的实施方式中记载的各结构的形态只不过是例示,本专利技术所涉及的一种书刊印刷检错系统及其方法并不限定于在以下的实施方式中记载的各结构,在本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施方式都属于本专利技术保护的范围。
[0016]本专利技术提供了一种书刊印刷检错系统,包括样本库、目标对象信息采集模块、数据预处理模块、文本检错模块、图像检错模块、格式检错模块、目标对象整体分析模块、综合评价模块以及人机交互模块;所述目标对象采集模块对目标对象数据信息进行采集后将数据传输至数据预处理模块,所述数据预处理模块对数据进行预处理后传输至文本检错模块、图像检错模块以及格式检错模块,所述文本检错模块对文本数据进行检错并将数据传输至目标对象整体分析模块,所述图像检错模块对图像数据进行检错并将数据传输至目标对象整体分析模块,所述格式检错模块对格式数据进行检错并将数据传输至目标对象整体分析模块,所述目标对象整体分析模块对上述数据进行分析,将分析后的数据传输至综合评价模块,所述综合评价模块对目标对象整体分析模块的多个数据进行分析后传输至人机交互模块。
[0017]所述样本库用于储存目标对象的样本数据,作为后续对目标对象进行检错比对的基础数据;所述目标对象信息采集模块用于通过采集n个目标对象的文本信息、图本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种书刊印刷检错系统,其特征在于:包括:目标对象信息采集模块:通过采集n个目标对象的文本信息、图像信息以及格式信息,所述目标对象为待打印的书刊;数据预处理模块:用于对采集的单个目标对象信息数据进行清洗降噪与分类,提取出文本数据与图像数据,所述单个目标对象为单本书刊;文本检错模块:通过自然语言处理对数据预处理模块的文本数据进行分词处理,并与样本数据进行对比,对错误处进行标记;图像检错模块:通过细粒度识别对数据预处理模块的图像数据进行差异对比,通过余弦相似度计算公式计算得出图像差异率β;格式检错模块:通过对数据预处理模块中文本数据的各个部分进行定位,提取各部分的格式信息,与样本数据进行比对;目标对象整体分析模块:包括文本分析警示单元、格式分析警示单元以及合格标准检测单元,通过分析文本检错模块、图像检错模块以及格式检错模块的数据,判断该目标对象是否达到印刷合格标准;综合评价模块:通过目标对象整体分析模块中合格标准检测单元的判断结果对n个目标对象的整体合格率进行分析,通过总体合格率计算公式计算得出批次合格率ω,并与标准值进行对比,对设备性能进行初步评估。2.根据权利要求1所述的一种书刊印刷检错系统,其特征在于:所述文本分析警示单元通过文本错误率计算公式计算得出文本错误率α,所述格式分析警示单元通过格式差异计算公式计算得出格式错误率γ,所述合格标准检测单元通过对文本错误率α、格式错误率γ以及图像差异率β进行综合分析,判断目标对象是否达到印刷合格标准。3.根据权利要求1所述的一种书刊印刷检错系统,其特征在于:所述余弦相似度公式为:,其中,H
i
为图像的颜色向量,H1为样本图像的颜色标准向量,,其中,h(x
ij
)为像素x
ij
的出现频率,,其中,x
ij
为图像中某一特定颜色,s(x
ij
)为该像素的个数。...

【专利技术属性】
技术研发人员:邵志成李海丽姚伟吕越千
申请(专利权)人:山东成信彩印有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1