一种用于出版印刷设备的文字排版图像识别系统技术方案

技术编号:38758015 阅读:7 留言:0更新日期:2023-09-10 09:43
本发明专利技术公开了一种用于出版印刷设备的文字排版图像识别系统,具体涉及图像识别技术领域,包括包括:输入模块、图像预处理模块、特征提取模块、模板匹配模块、内容识别模块、错误检测模块以及识别修正模块,本发明专利技术利用模板匹配模块可以将提取的特征与预设的文字模板进行匹配,确定文字的位置和排版信息,可以快速准确地定位文字,可以检测识别过程中可能出现的错误,通过比对识别结果与原始图像或预设模板进行校验,减少错误率,并根据错误类型和模式,提供相应的修正策略和方法,自动修正或建议修正错误,实现了高精度的文字排版图像识别,能够准确提取文字的排版信息和内容,检测和修正识别过程中的错误,满足出版印刷设备的需求。满足出版印刷设备的需求。满足出版印刷设备的需求。

【技术实现步骤摘要】
一种用于出版印刷设备的文字排版图像识别系统


[0001]本专利技术涉及图像识别
,更具体地说,本专利技术涉及一种用于出版印刷设备的文字排版图像识别系统。

技术介绍

[0002]现有的文字排版图像识别系统,根据文字特征和图像特征,将对应的文字内容和和排版样式进行提取,可以自动化地处理大量的文字图像,减少人工操作的工作量,提高处理速度和效率,相比于手动排版,文字识别系统可以快速准确地识别和处理文字,节省大量时间和人力资源,具有提高效率、提高准确性、实现自动化排版、灵活性和可定制性、跨平台和易于集成等优点,目前被广泛运用。
[0003]然而上述技术仍存在不足,上述技术在使用过程中,对识别出的排版样式以及内容准确程度有限,缺少检测与错误修正的功能,无法对识别出的结果进行准确性的验证,也无法对识别错误的结果进行修正,导致目前文字排版图像识别系统准确率不高,在实际使用时存在一定的限制,在进行识别时,没有利用成熟的训练模型进行匹配,导致排版识别结果存在误差,识别准确度低。

技术实现思路

[0004]为了克服现有技术的上述缺陷,本专利技术的提供一种用于出版印刷设备的文字排版图像识别系统,通过训练排版模型,计算模型与识别结果的匹配程度,找出最相似的排版模型,并进行内容识别错误结果检测,对错误检测进行修正,以解决上述
技术介绍
中提出的问题。
[0005]为实现上述目的,本专利技术提供如下技术方案:包括:数据库、输入模块、图像预处理模块、特征提取模块、模板匹配模块、内容识别模块、错误检测模块以及识别修正模块。
[0006]输入模块:用于接收数据库发送的待识别的出版印刷设备文字排版图像,并将图像传输至图像预处理模块;图像预处理模块:用于对输入图像进行去噪、分割和增强以及角点检测的预处理操作,并将处理后的图像传输至特征提取模块;特征提取模块:用于通过深度学习技术,提取输入图像的特征数据,并将提取到的特征数据传输至模板匹配模块;模板匹配模块:用于系统将提取的特征与预设的文字模板进行匹配,计算出提取的图像特征数据与文字模板的余弦相似度,并使用最大相似度匹配的方法来确定最佳匹配结果,并将匹配结果传输至内容识别模块;内容识别模块:用于系统根据模板匹配结果,对文字内容进行识别和提取,并将提取到的数据传输至数据库;错误检测模块:提供系统的维护功能,用于对识别出的文字进行错误检测,并计算出系统的错误识别概率指数,判断错误识别概率指数是否超出预设值,超出预设值时,系统
下发指令至识别修正模块;识别修正模块:提供系统的维护功能,进行错误识别修正,并生成修正结果,反馈给用户。
[0007]优选的,输入模块用于接收数据库发送的待识别的出版印刷设备文字排版图像,所述输入模块具体包括:设备扫描单元:通过扫描仪、相机以及其他图像采集设备获取待识别的出版印刷设备文字排版图像;图像获取单元:系统连接扫描设备,接收待识别的文字排版图像,并对图像进行存储以及传输至图像预处理模块。
[0008]优选的,图像预处理模块用于对输入图像进行去噪、分割和增强以及角点检测的预处理操作,所述图像预处理模块具体包括:去噪单元:使用去噪算法对输入图像进行降噪处理,去除图像中的噪声干扰;分割单元:根据图像的特点和排版结构,利用连通区域分析将图像分割成文字区域和非文字区域;形态学处理单元:使用形态学操作对文字区域进行进一步处理,去除不必要的细节或填充缺失的部分;统一尺寸单元:利用缩放、裁剪以及填充技术对文字区域进行尺寸统一处理,使其具有相同的大小和比例。
[0009]优选的,特征提取模块用于通过深度学习技术,提取输入图像的特征数据,所述特征提取模块具体包括:训练集收集单元:收集包含不同字体、字号、行间距和段落结构的图像数据,并进行标注;模型选择与训练单元:根据任务的要求,选择适合的深度学习模型,使用准备好的训练数据集对深度学习模型进行训练,通过反向传播算法不断调整模型的参数,更好地提取图像的特征;特征提取单元:将待提取特征的图像输入到已经训练好的深度学习模型中,通过前向传播算法,将图像数据从输入层传递到输出层,同时在每一层中提取图像的特征,提取到的特征数据具体包括:字体型号、字号大小、行间距、段落结构、文字与页面相比的偏斜角度、字符间距、字符形状、字符笔画数、字符颜色编号、图像面积、文字面积、文字方向:包括水平方向、垂直方向以及斜向以及文字边界框坐标。
[0010]优选的,模板匹配模块用于系统将提取的特征与预设的文字模板进行匹配,计算出提取的图像特征数据与文字模板的余弦相似度,并使用最大相似度匹配的方法来确定最佳匹配结果,所述模板匹配模块具体包括:特征表示单元:将文本排版属性表示为向量形式,使用独热编码、词袋模型的方法将每个属性转换为数值表示,建立图像特征值:,A1,A2,
……
A
m
分别代表图像文字排版的特征值,,B1,B2,
……
B
m
分别代表预设文字模板的排版特征值;余弦相似度计算单元:将图像文字排版特征值和模板文字排版特征值进行向量
化,,,计算它们之间的余弦相似度,余弦相似度的计算公式为:;相似度匹配单元:选取具有最大相似度的文字模板作为最佳匹配结果。
[0011]优选的,内容识别模块用于系统根据模板匹配结果,对文字内容进行识别和提取,所述内容识别模块具体包括:文字分割单元:根据模板匹配模块的结果,将图像中的文字区域进行分割,得到单个文字的图像;文字识别单元:使用文字识别算法对每个文字图像进行识别;文字提取单元:根据识别结果,提取出每个文字的内容,将识别结果转换为文字字符。
[0012]优选的,错误检测模块提供系统的维护功能,用于对识别出的文字进行错误检测,并计算出系统的错误识别指数,判断错误识别指数是否超出预设值,所述错误检测模块具体包括:准备标注数据单元:通过人工标注以及其他数据来源准备包含正确的文字内容的标注数据;对比和标记单元:使用编程语言提供的字符串操作函数和循环结构对文字识别结果和标注数据从头到尾逐个字符或单词地进行对比,根据比对结果,检测出文字识别中的错误,并进行标记;分析单元:根据文字识别算法生成的置信度分数k
n
,对识别结果进行分析,根据文字识别的上下文信息,对识别结果进行进一步分析;错误识别指数计算单元:根据总识别m
n
、漏识别q
n
、错识别w
n
、多识别个数e
n
、文档的结构r
n
、语法规则t
n
、语义关系y
n
,计算识别的错误识别指数:;识别行为质量指数计算单元:根据识别结果与识别样品的比较结果,统计识别过程中识别页数差值a
n
、字数差值s
n
、图像数差值d
n
、表格数差值f
n
、并根据这些数据计算此次识别的识别行为质量指数:;识别可信度计算单元:根据上述错误识别指数以及识别行为质量指数计算此次识别结果的识别可信度:;数值判本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于出版印刷设备的文字排版图像识别系统,其特征在于:包括:数据库:用于向输入模块发送各种出版印刷设备文字排版图和接收内容识别模块提取到的数据;输入模块:用于接收待识别的出版印刷设备文字排版图像,并将图像传输至图像预处理模块;图像预处理模块:用于对输入图像进行去噪、分割和增强以及角点检测的预处理操作,并将处理后的图像传输至特征提取模块;特征提取模块:用于通过深度学习技术,提取输入图像的特征数据,并将提取到的特征数据传输至模板匹配模块;模板匹配模块:用于系统将提取的特征与预设的文字模板进行匹配,计算出提取的图像特征数据与文字模板的余弦相似度,并使用最大相似度匹配的方法来确定最佳匹配结果,并将匹配结果传输至内容识别模块;内容识别模块:用于系统根据模板匹配结果,对文字内容进行识别和提取,并将提取到的数据传输至错误检测模块;错误检测模块:用于对识别出的文字进行错误检测,并计算出系统的错误识别概率指数、识别行为质量指数以及识别可信度,判断识别可信度是否小于预设值,小于预设值时,系统下发指令至识别修正模块;识别修正模块:用于提供系统的维护功能,进行错误识别修正以及识别行为修正,并生成修正结果,反馈给用户。2.根据权利要求1所述的一种用于出版印刷设备的文字排版图像识别系统,其特征在于:所述输入模块用于接收待识别的出版印刷设备文字排版图像,所述输入模块具体包括:设备扫描单元:通过扫描仪、相机以及其他图像采集设备获取待识别的出版印刷设备文字排版图像;图像获取单元:系统连接扫描设备,接收待识别的文字排版图像,并对图像进行存储以及传输至图像预处理模块。3.根据权利要求1所述的一种用于出版印刷设备的文字排版图像识别系统,其特征在于:所述图像预处理模块用于对输入图像进行去噪、分割和增强以及角点检测的预处理操作,所述图像预处理模块具体包括:去噪单元:使用去噪算法对输入图像进行降噪处理,去除图像中的噪声干扰;分割单元:根据图像的特点和排版结构,利用连通区域分析将图像分割成文字区域和非文字区域;形态学处理单元:使用形态学操作对文字区域进行处理,填充缺失的部分;统一尺寸单元:利用缩放、裁剪以及填充技术对文字区域进行尺寸统一处理,使其具有相同的大小和比例。4.根据权利要求1所述的一种用于出版印刷设备的文字排版图像识别系统,其特征在于:所述特征提取模块用于通过深度学习技术,提取输入图像的特征数据,所述特征提取模块具体包括:训练集收集单元:收集包含不同字体、字号、行间距和段落结构的图像数据,并进行标注;
模型选择与训练单元:根据任务的要求,选择适合的深度学习模型,使用准备好的训练数据集对深度学习模型进行训练,通过反向传播算法不断调整模型的参数,更好地提取图像的特征;特征提取单元:将待提取特征的图像输入到已经训练好的深度学习模型中,通过前向传播算法,将图像数据从输入层传递到输出层,同时在每一层中提取图像的特征,提取到的特征数据具体包括:字体型号、字号大小、行间距、段落结构、文字与页面相比的偏斜角度、字符间距、字符形状、字符笔画数、字符颜色编号、图像面积、文字面积、文字方向:包括水平方向、垂直方向以及斜向以及文字边界框坐标。5.根据权利要求1所述的一种用于出版印刷设备的文字排版图像识别系统,其特征在于:所述模板匹配模块用于系统将提取的特征与预设的文字模板进行匹配,计算出提取的图像特征数据与文字模板的余弦相似度,并使用最大相似度匹配的方法来确定最佳匹配结果,所述模板匹配模块具体包括:特征表示单元:将文本排版属性表示为向量形式...

【专利技术属性】
技术研发人员:邵志成李海丽邱永凯路然
申请(专利权)人:山东成信彩印有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1