PDF图纸文字识别方法、系统以及设备技术方案

技术编号：24855327 阅读：25 留言：0更新日期：2020-07-10 19:08

本发明专利技术提供了一种PDF图纸文字识别方法、系统以及设备，该PDF图纸文字识别方法包括以下步骤：基于深度学习执行光学字符识别步骤；定制化识别和通用识别步骤；以及移动设备低质量图像识别步骤；其中，该基于深度学习执行光学字符识别步骤包括步骤：检测场景中有文字的区域并对区域中的文字进行识别，其中基于CTPN、Seglink、TextBoxes、FTSN、Pixellink以及CRAFT算法执行文本检测；其中基于CNN、CRNN算法进行文字的识别；其中，该定制化识别步骤包括以下步骤：根据PDF中表格文字或者PDF中框架内容识别PDF图纸类型；根据结构化特征提取区域内的内容；以及提取关键区域，通过深度神经网络识别区域中的文字或提取关键文字。

全部详细技术资料下载

【技术实现步骤摘要】
PDF图纸文字识别方法、系统以及设备
本专利技术涉及图像处理领域，尤其涉及一种PDF图纸文字识别方法、系统以及设备。
技术介绍
人工智能在数据、算法和计算能力方面取得了飞速发展，在全球经济数字化转型的大背景下迎来了新一轮的发展浪。此次人工智能浪潮的影响力远超之前，其中最显著的特点是影响力从专业领域扩散到了大众化领域。PDF高精度识别作为当今市场颇为成熟的技术，基于传统OCR和深度学习的方法也应用于各行各业。银行票据的识别、PDF表格识别和工业图纸识别都是已经被应用广泛且成熟的技术。针对格式化、模板化的PDF的识别在精度上和速度上都取得了令人瞩目的成效，从而提高了各行业从业人员的工作效率和能力。传统的PDF识别基本固定形式的PDF，对PDF质量有一定要求。而随着智能手机的普及，对于个人手机拍摄的低质量PDF图像，传统方法并没有很好的解决方案。而当下大多数PDF识别都是整张识别，并没有提供针对特殊区域的提取和识别。针对一些结构化的PDF图纸，提取用户感兴趣的区域(POI)并解析其中的内容也是本方案的一个特色。
技术实现思路
本专利技术的目的在于提供一种PDF图纸文字识别方法、系统以及设备，提供了定制化和通用场景等多种识别方案，并且基于深度学习最近的OCR算法和相应的图像处理技术，能提供用户识别低质量图像的解决方案。本专利技术的另一目的在于提供一种PDF图纸文字识别方法、系统以及设备，能够针对工业图纸、票据、个人设备拍摄图像等各类场景的识别，并解决不同用户的不同需求。r>为了实现上述至少一个专利技术目的，本专利技术提供了一种PDF图纸文字识别方法，所述PDF图纸文字识别方法包括以下步骤：基于深度学习执行光学字符识别步骤；定制化识别和通用识别步骤；以及移动设备低质量图像识别步骤；其中，所述基于深度学习执行光学字符识别步骤包括步骤：检测场景中有文字的区域并对区域中的文字进行识别，其中基于CTPN、Seglink、TextBoxes、FTSN、Pixellink以及CRAFT算法执行文本检测；其中基于CNN、CRNN算法进行文字的识别；其中，所述定制化识别步骤包括以下步骤：根据PDF中表格文字或者PDF中框架内容识别PDF图纸类型；根据结构化特征提取区域内的内容；以及提取关键区域，通过深度神经网络识别区域中的文字或提取关键文字。在一些实施例中，其中所述定制化识别步骤的所述提取关键区域步骤还包括以下步骤：根据POI比例大小提取关键区域；利用霍夫变换、角点检测提取所有框架；根据文字的模糊匹配和精确匹配提取关键区域；根据区域的边缘特性提取关键区域；以及根据区域中文字特性提取关键区域。在一些实施例中，其中所述定制化识别步骤的所述提取关键区域步骤中，根据区域的形状或对称或角度或边缘颗粒度的边缘特性提取关键区域，其中根据区域中文字的字体或大小或文字类型的特性提取关键区域。在一些实施例中，其中所述移动设备低质量图像识别步骤还包括以下步骤：对图像执行滤波处理；对图像执行图像增强处理；对图像执行图像边缘化锐化处理；对图像执行图像纹理分析处理；对图像执行图像分割处理；对图像执行几何形态分析处理；对图像执行图像匹配处理；以及对图像执行形态学处理。在一些实施例中，其中所述对图像执行滤波处理步骤中为对图像执行图像平滑以及图像降噪处理；其中所述对图像执行图像纹理分析处理为对对图像执行去骨架以及连通性处理；其中所述对图像执行图像匹配处理步骤为对图像执行模板匹配以及搜索匹配处理；其中所述对图像执行形态学处理步骤为对图像执行膨胀、服饰以及开闭操作处理。根据本专利技术的另一方面，还提供了一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时执行所述的PDF图纸文字识别方法的步骤。根据本专利技术的另一方面，还提供了一种PDF图纸文字识别设备，所述PDF图纸文字识别设备包括：软件应用程序、用于存储软件应用程序的存储器，以及用于执行该软件应用程序处理器；其中所述软件应用程序的各程序相对应地执行所述的PDF图纸文字识别方法中的步骤。根据本专利技术的另一方面，还提供了一种PDF图纸文字识别系统，所述PDF图纸文字识别系统包括光学字符识别单元、定制化识别和通用识别单元以及移动设备低质量图像识别单元，其中所述光学字符识别单元包括文本检测模块以及文字识别模块，其中所述文本检测模块被配置为：检测场景中有文字的区域，基于CTPN、Seglink、TextBoxes、FTSN、Pixellink以及CRAFT算法执行文本检测；其中所述文字识别模块被配置为：对检测出的区域中的文字进行识别，基于CRNN、CNN算法进行文字的识别；其中所述定制化识别和通用识别单元设置有定制化识别模块，所述定制化识别模块被配置为结构化特征提取区域内的内容，并通过深度神经网络识别区域中的文字或提取关键文字；其中所述移动设备低质量图像识别单元被配置为：对识别的图像进行滤波处理、图像增强处理、图像边缘化锐化处理、图像纹理分析处理、图像分割处理、几何形态分析处理、图像匹配处理以及形态学处理在一些实施例中，其中所述关键区域提取模块进一步包括POI比例提取模块、霍夫变换角点检测提取模块、文字模糊和精确匹配提取模块、区域边缘特性提取模块以及区域文字特性提取模块；其中所述POI比例提取模块被配置为根据POI比例大小提取关键区域；所述霍夫变换角点检测提取模块被配置为利用霍夫变换、角点检测提取所有框架；所述文字模糊和精确匹配提取模块被配置为根据文字的模糊匹配和精确匹配提取关键区域；所述区域边缘特性提取模块被配置为根据区域的边缘特性提取关键区域；所述区域文字特性提取模块被配置为根据区域中文字特性提取关键区域。在一些实施例中，其中所述区域边缘特性提取模块的区域的边缘特性为形状、对称、角度和边缘颗粒度，其中所述区域文字特性提取模块的区域中文字特性为字体、大小和文字类型。附图说明图1是根据本专利技术的一个实施例的一种PDF图纸文字识别方法的步骤流程图。图2是根据本专利技术的一个实施例的一种PDF图纸文字识别系统的结构示意图。具体实施方式以下描述用于揭露本专利技术以使本领域技术人员能够实现本专利技术。以下描述中的优选实施例只作为举例，本领域技术人员可以想到其他显而易见的变型。在以下描述中界定的本专利技术的基本原理可以应用于其他实施方案、变形方案、改进方案、等同方案以及没有背离本专利技术的精神和范围的其他技术方案。可以理解的是，术语“一”应理解为“至少一”或“一个或多个”，即在一个实施例中，一个元件的数量可以为一个，而在另外的实施例中，该元件的数量可以为多个，术语“一”不能理解为对数量的限制。本专利技术为涉及计算机程序的专利技术。如图1所示为基于本专利技术的一种PDF图纸文字识别方法的流程图，阐述了为解决本专利技术提出的问题，以计算机程序处理流程为基础，通过计算机执行按上述流程编制的计算机程序，对计算机本文档来自技高网...

【技术保护点】
1.一种PDF图纸文字识别方法，其特征在于，所述PDF图纸文字识别方法包括以下步骤：/n基于深度学习执行光学字符识别步骤；定制化识别和通用识别步骤；以及移动设备低质量图像识别步骤；/n其中，所述基于深度学习执行光学字符识别步骤包括步骤：检测场景中有文字的区域并对区域中的文字进行识别，其中基于CTPN、Seglink、TextBoxes、FTSN、Pixellink以及CRAFT算法执行文本检测；其中基于CNN、CRNN算法进行文字的识别；/n其中，所述定制化识别步骤包括以下步骤：根据PDF中表格文字或者PDF中框架内容识别PDF图纸类型；根据结构化特征提取区域内的内容；以及提取关键区域，通过深度神经网络识别区域中的文字或提取关键文字。/n

【技术特征摘要】
1.一种PDF图纸文字识别方法，其特征在于，所述PDF图纸文字识别方法包括以下步骤：
基于深度学习执行光学字符识别步骤；定制化识别和通用识别步骤；以及移动设备低质量图像识别步骤；
其中，所述基于深度学习执行光学字符识别步骤包括步骤：检测场景中有文字的区域并对区域中的文字进行识别，其中基于CTPN、Seglink、TextBoxes、FTSN、Pixellink以及CRAFT算法执行文本检测；其中基于CNN、CRNN算法进行文字的识别；
其中，所述定制化识别步骤包括以下步骤：根据PDF中表格文字或者PDF中框架内容识别PDF图纸类型；根据结构化特征提取区域内的内容；以及提取关键区域，通过深度神经网络识别区域中的文字或提取关键文字。

2.如权利要求1所述的PDF图纸文字识别方法，其中所述定制化识别步骤的所述提取关键区域步骤还包括以下步骤：
根据POI比例大小提取关键区域；
利用霍夫变换、角点检测提取所有框架；
根据文字的模糊匹配和精确匹配提取关键区域；
根据区域的边缘特性提取关键区域；以及
根据区域中文字特性提取关键区域。

3.如权利要求2所述的PDF图纸文字识别方法，其中所述定制化识别步骤的所述提取关键区域步骤中，根据区域的形状或对称或角度或边缘颗粒度的边缘特性提取关键区域，其中根据区域中文字的字体或大小或文字类型的特性提取关键区域。

4.如权利要求1所述的PDF图纸文字识别方法，其中所述移动设备低质量图像识别步骤还包括以下步骤：
对图像执行滤波处理；
对图像执行图像增强处理；
对图像执行图像边缘化锐化处理；
对图像执行图像纹理分析处理；
对图像执行图像分割处理；
对图像执行几何形态分析处理；
对图像执行图像匹配处理；以及
对图像执行形态学处理。

5.如权利要求4所述的PDF图纸文字识别方法，其中所述对图像执行滤波处理步骤中为对图像执行图像平滑以及图像降噪处理；其中所述对图像执行图像纹理分析处理为对对图像执行去骨架以及连通性处理；其中所述对图像执行图像匹配处理步骤为对图像执行模板匹配以及搜索匹配处理；其中所述对图像执行形态学处理步骤为对图像执行膨胀、服饰以及开闭操作处理。

6.一种计算机可读存...

【专利技术属性】
技术研发人员：张东锋，曾雏鹏，李俊波，
申请(专利权)人：深圳新致软件有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人