一种用于出版印刷设备的文字排版图像识别系统技术方案

技术编号：38758015 阅读：7 留言：0更新日期：2023-09-10 09:43

本发明专利技术公开了一种用于出版印刷设备的文字排版图像识别系统，具体涉及图像识别技术领域，包括包括：输入模块、图像预处理模块、特征提取模块、模板匹配模块、内容识别模块、错误检测模块以及识别修正模块，本发明专利技术利用模板匹配模块可以将提取的特征与预设的文字模板进行匹配，确定文字的位置和排版信息，可以快速准确地定位文字，可以检测识别过程中可能出现的错误，通过比对识别结果与原始图像或预设模板进行校验，减少错误率，并根据错误类型和模式，提供相应的修正策略和方法，自动修正或建议修正错误，实现了高精度的文字排版图像识别，能够准确提取文字的排版信息和内容，检测和修正识别过程中的错误，满足出版印刷设备的需求。满足出版印刷设备的需求。满足出版印刷设备的需求。

全部详细技术资料下载

【技术实现步骤摘要】
一种用于出版印刷设备的文字排版图像识别系统

[0001]本专利技术涉及图像识别
，更具体地说，本专利技术涉及一种用于出版印刷设备的文字排版图像识别系统。

技术介绍

[0002]现有的文字排版图像识别系统，根据文字特征和图像特征，将对应的文字内容和和排版样式进行提取，可以自动化地处理大量的文字图像，减少人工操作的工作量，提高处理速度和效率，相比于手动排版，文字识别系统可以快速准确地识别和处理文字，节省大量时间和人力资源，具有提高效率、提高准确性、实现自动化排版、灵活性和可定制性、跨平台和易于集成等优点，目前被广泛运用。
[0003]然而上述技术仍存在不足，上述技术在使用过程中，对识别出的排版样式以及内容准确程度有限，缺少检测与错误修正的功能，无法对识别出的结果进行准确性的验证，也无法对识别错误的结果进行修正，导致目前文字排版图像识别系统准确率不高，在实际使用时存在一定的限制，在进行识别时，没有利用成熟的训练模型进行匹配，导致排版识别结果存在误差，识别准确度低。

技术实现思路

[0004]为了克服现有技术的上述缺陷，本专利技术的提供一种用于出版印刷设备的文字排版图像识别系统，通过训练排版模型，计算模型与识别结果的匹配程度，找出最相似的排版模型，并进行内容识别错误结果检测，对错误检测进行修正，以解决上述
技术介绍
中提出的问题。
[0005]为实现上述目的，本专利技术提供如下技术方案：包括：数据库、输入模块、图像预处理模块、特征提取模块、模板匹配模块、内容识别模块、错误检测模块以及识别修正...

【技术保护点】

【技术特征摘要】
1.一种用于出版印刷设备的文字排版图像识别系统，其特征在于：包括：数据库：用于向输入模块发送各种出版印刷设备文字排版图和接收内容识别模块提取到的数据；输入模块：用于接收待识别的出版印刷设备文字排版图像，并将图像传输至图像预处理模块；图像预处理模块：用于对输入图像进行去噪、分割和增强以及角点检测的预处理操作，并将处理后的图像传输至特征提取模块；特征提取模块：用于通过深度学习技术，提取输入图像的特征数据，并将提取到的特征数据传输至模板匹配模块；模板匹配模块：用于系统将提取的特征与预设的文字模板进行匹配，计算出提取的图像特征数据与文字模板的余弦相似度，并使用最大相似度匹配的方法来确定最佳匹配结果，并将匹配结果传输至内容识别模块；内容识别模块：用于系统根据模板匹配结果，对文字内容进行识别和提取，并将提取到的数据传输至错误检测模块；错误检测模块：用于对识别出的文字进行错误检测，并计算出系统的错误识别概率指数、识别行为质量指数以及识别可信度，判断识别可信度是否小于预设值，小于预设值时，系统下发指令至识别修正模块；识别修正模块：用于提供系统的维护功能，进行错误识别修正以及识别行为修正，并生成修正结果，反馈给用户。2.根据权利要求1所述的一种用于出版印刷设备的文字排版图像识别系统，其特征在于：所述输入模块用于接收待识别的出版印刷设备文字排版图像，所述输入模块具体包括：设备扫描单元：通过扫描仪、相机以及其他图像采集设备获取待识别的出版印刷设备文字排版图像；图像获取单元：系统连接扫描设备，接收待识别的文字排版图像，并对图像进行存储以及传输至图像预处理模块。3.根据权利要求1所述的一种用于出版印刷设备的文字排版图像识别系统，其特征在于：所述图像预处理模块用于对输入图像进行去噪、分割和增强以及角点检测的预处理操作，所述图像预处理模块具体包括：去噪单元：使用去噪算法对输入图像进行降噪处理，去除图像中的噪声干扰；分割单元：根据图像的特点和排版结构，利用连通区域分析将图像分割成文字区域和非文字区域；形态学处理单元：使用形态学操作对文字区域进行处理，填充缺失的部分；统一尺寸单元：利用缩放、裁剪以及填充技术对文字区域进行尺寸统一处理，使其具有相同的大小和比例。4.根据权利要求1所述的一种用于出版印刷设备的文字排版图像识别系统，其特征在于：所述特征提取模块用于通过深度学习技术，提取输入图像的特征数据，所述特征提取模块具体包括：训练集收集单元：收集包含不同字体、字号、行间距和段落结构的图像数据，并进行标注；
模型选择与训练单元：根据任务的要求，选择适合的深度学习模型，使用准备好的训练数据集对深度学习模型进行训练，通过反向传播算法不断调整模型的参数，更好地提取图像的特征；特征提取单元：将待提取特征的图像输入到已经训练好的深度学习模型中，通过前向传播算法，将图像数据从输入层传递到输出层，同时在每一层中提取图像的特征，提取到的特征数据具体包括：字体型号、字号大小、行间距、段落结构、文字与页面相比的偏斜角度、字符间距、字符形状、字符笔画数、字符颜色编号、图像面积、文字面积、文字方向：包括水平方向、垂直方向以及斜向以及文字边界框坐标。5.根据权利要求1所述的一种用于出版印刷设备的文字排版图像识别系统，其特征在于：所述模板匹配模块用于系统将提取的特征与预设的文字模板进行匹配，计算出提取的图像特征数据与文字模板的余弦相似度，并使用最大相似度匹配的方法来确定最佳匹配结果，所述模板匹配模块具体包括：特征表示单元：将文本排版属性表示为向量形式...

【专利技术属性】
技术研发人员：邵志成，李海丽，邱永凯，路然，
申请(专利权)人：山东成信彩印有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人