制表信息提取处理方法、装置、计算机设备和存储介质制造方法及图纸

技术编号：30549477 阅读：28 留言：0更新日期：2021-10-30 13:29

本申请涉及人工智能技术领域，提供了一种制表信息提取处理方法、装置、计算机设备和存储介质。本申请能够减少对文档图像中单个字符和过短的字符串的漏定，提高对文档图像中制表信息提取的准确性。该方法包括：获取携带制表文本的文档图像，然后将文档图像输入基于梯级特征金字塔网络构建的文本检测网络，获取文本检测网络输出的对制表文本在该文档图像上的位置检测结果，其中该梯级特征金字塔网络中各梯级网络用于提取文档图像的各尺度特征，然后根据位置检测结果利用文本识别网络识别制表文本的文本内容，最后根据文本内容获取制表信息。息。息。

全部详细技术资料下载

【技术实现步骤摘要】
制表信息提取处理方法、装置、计算机设备和存储介质

[0001]本申请涉及人工智能
，特别是涉及一种制表信息提取处理方法、装置、计算机设备和存储介质。

技术介绍

[0002]OCR(Optical Character Recognition)，中文为光学字符识别，是将打字、手写、或印刷的文本的图像电子或机械转换为机器编码的文本，无论是来自扫描的文档、文档的照片还是场景的照片或叠加在图像上的字幕文本，因而使用OCR技术可以替代人工来提取如PDF文档等文件中的关键信息，并且生成需要的如excel等格式的表格，这样可以大大提高办公作业效率。
[0003]OCR主要包含文本检测和文本识别两个步骤；其中，文本检测主要分为基于回归的文本检测模型和基于分割的文本检测模型两大类，基于回归的文本检测模型可以是如TextBoxes、TextBoxes++、SegLink、RRD、RRPN、R2CNN和CTPN等等，基于分割的文本检测模型可以是如PseNet、PANNet、DBNet、CRAFT等等；文本识别主要基于CRNN框架实现，...

【技术保护点】

【技术特征摘要】
1.一种制表信息提取处理方法，其特征在于，所述方法包括：获取携带制表文本的文档图像；将所述文档图像输入基于梯级特征金字塔网络构建的文本检测网络，获取所述文本检测网络输出的对所述制表文本在所述文档图像上的位置检测结果；所述梯级特征金字塔网络中各梯级网络用于提取所述文档图像的各尺度特征；根据所述位置检测结果，利用文本识别网络识别所述制表文本的文本内容；根据所述文本内容，获取制表信息。2.根据权利要求1所述的方法，其特征在于，所述文本检测网络包括梯级特征金字塔网络和拼接层；所述梯级特征金字塔网络包括多个梯级网络，各梯级网络用于提取所述文档图像的各尺度特征并传递至所述拼接层进行拼接。3.根据权利要求2所述的方法，其特征在于，所述文本检测网络的骨干网络采用ResNet网络；所述拼接层对所述各尺度特征的拼接结果经过DBNet网络的后处理操作得到所述位置检测结果。4.根据权利要求1所述的方法，其特征在于，所述根据所述位置检测结果，利用文本识别网络识别所述制表文本的文本内容，包括：将所述文档图像中与所述位置检测结果对应的文档图像区域输入所述文本识别网络，获取所述文本识别网络输出的所述制表文本的文本内容。5.根据权利要求4所述的方法，其特征在于，所述文本识别网络包括依次连接的ResNet网络、RNN网络和CTC解码网络。6.根据权利要求1所述的方法，其特征在于，所述根据所述文本内容，获...

【专利技术属性】
技术研发人员：于洋，姚旭峰，余蓓，沈小勇，吕江波，贾佳亚，
申请(专利权)人：上海思谋科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人