一种大尺寸复杂pdf工程图纸文本检测与识别方法技术

技术编号：34900114 阅读：19 留言：0更新日期：2022-09-10 14:03

本发明专利技术提供了一种大尺寸复杂pdf工程图纸文本检测与识别方法，包括以下步骤：步骤S1：预处理pdf工程图纸，生成对应的高分辨率图像；步骤S2：将高分辨率图像切割为若干低分辨率的子图，并根据位置记录子图对应顺序；步骤S3：进行第一次子图文本检测，初步定位子图中的文本区域范围，输出范围对应的位置坐标；步骤S4：将子图中的文本区域位置坐标映射到原大图中，去除其中的重复数据，并根据去重后的位置坐标获取对应文本区域图像；步骤S5：进行第二次文本检测，精确定位文本区域中的文本，并裁剪对应的文本块；步骤S6：对文本块进行文本识别，提取文本块中的文本内容，以及对应的坐标位置。本发明专利技术提供的方法提高了复杂图纸的文本识别准确率。率。率。

全部详细技术资料下载

【技术实现步骤摘要】
一种大尺寸复杂pdf工程图纸文本检测与识别方法

[0001]本专利技术涉及核电厂文本图纸管理
，尤其涉及一种大尺寸复杂pdf工程图纸文本检测与识别方法。

技术介绍

[0002]在工程领域，常常需要建立图纸与其文本内容之间的关系，以便快速查询图纸中物料编码、元器件编号等信息及其对应的图纸。以往此类工作大多基于人工手段实现，效率较低下，在大量图纸的文本数据处理情况下人力资源的成本极为高昂。因此，需要一种自动识别图纸文本内容的方法代替人工，完成大批量pdf图纸的文本提取，以此降低人工成本的同时提高工程图纸的文本提取效率。
[0003]当前针对图纸的文本识别一般需要两个步骤：文本检测、文本识别。文本检测目的在于检测出图纸中的文本区域，实现文本在图像中的定位，并输出对应文本区域的位置坐标信息；文本识别目的在于，针对图纸中的文本区域，输出对应的文本。
[0004]可见，现有的图纸文本提取手段存在成本高昂、效率低下以及图纸内容复杂等问题。

技术实现思路

[0005]本专利技术的目的在于克服现有技术中所述的缺陷，从而提供一种成本低廉、效率高的大尺寸复杂pdf工程图纸文本检测与识别方法。
[0006]为了实现上述目的，本专利技术提供如下技术方案：
[0007]一种大尺寸复杂pdf工程图纸文本检测与识别方法，包括以下步骤：
[0008]步骤S1：预处理pdf工程图纸，生成对应的高分辨率图像；
[0009]步骤S2：将高分辨率图像切割为若干低分辨率的子图，并根据位置记录...

【技术保护点】

【技术特征摘要】
1.一种大尺寸复杂pdf工程图纸文本检测与识别方法，其特征在于，包括以下步骤：步骤S1：预处理pdf工程图纸，生成对应的高分辨率图像；步骤S2：将高分辨率图像切割为若干低分辨率的子图，并根据位置记录子图对应顺序；步骤S3：进行第一次子图文本检测，初步定位子图中的文本区域范围，输出范围对应的位置坐标；步骤S4：将子图中的文本区域位置坐标映射到原大图中，去除其中的重复数据，并根据去重后的位置坐标获取对应文本区域图像；步骤S5：进行第二次文本检测，精确定位文本区域中的文本，并裁剪对应的文本块；步骤S6：对文本块进行文本识别，提取文本块中的文本内容，以及对应的坐标位置。2.根据权利要求1所述的大尺寸复杂pdf工程图纸文本检测与识别方法，其特征在于，步骤S2中，通过使用滑动窗口裁剪，将高分辨率图像切割为若干低分辨率的子图。3.根据权利要求1所述的大尺寸复杂pdf工程图纸文本检测与...

【专利技术属性】
技术研发人员：姚昊，潘炼，伍吉泽，李武平，沈祯杰，刘忠良，李清，熊伟，张永兴，李强，
申请(专利权)人：中核核电运行管理有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人