文档识别方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:27879765 阅读:25 留言:0更新日期:2021-03-31 01:12
本申请涉及一种文档识别方法,其中,该文档识别方法包括:获取第一文档图像,所述第一文档图像由初始文档图像降低分辨率得到;基于所述第一文档图像获取第一文本图像位置信息,所述第一文本图像位置信息表示待识别文本图像在所述第一文档图像中的位置;获取所述初始文档图像中与所述第一文本图像位置信息对应的第二文本图像;对所述第二文本图像进行识别,获取文本内容,进而得到文档识别结果。通过本申请,解决了文档识别速度较慢的技术问题,实现了快速识别文本内容的技术效果。

【技术实现步骤摘要】
文档识别方法、装置、计算机设备和存储介质
本申请涉及图像处理领域,特别是涉及文档识别方法、装置、计算机设备和存储介质。
技术介绍
世界正在飞速趋于数字化,数字化文档的使用正在代替纸质文档迅速增长,随着扫描文档技术的迅猛发展,对文档进行智能识别并从中提取有用的数据成为了一个备受关注的研究问题。其中,表格作为一种高效的数据组织和展现形式,是文档页面中最重要的数据对象之一。此外,基于一些特殊需要,许多电子文档还含有内部水印,这给文档文字识别带来了一定挑战。因此,准确高效识别含表格与水印的文档内容,一直是该领域研究者关注的研究问题。目前针对相关技术中文档识别速度较慢,尚未提出有效的解决方案。
技术实现思路
本申请实施例提供了一种文档识别方法、装置、计算机设备和存储介质,以至少解决相关技术中文档识别速度较慢的问题。第一方面,本申请实施例提供了一种文档识别方法,包括:获取第一文档图像,所述第一文档图像由初始文档图像降低分辨率得到;基于所述第一文档图像获取第一文本图像位置信息,所述第一文本图像位置信息表示待识别文本图像在所述第一文档图像中的位置;获取所述初始文档图像中与所述第一文本图像位置信息对应的第二文本图像;对所述第二文本图像进行识别,获取文本内容,进而得到文档识别结果。在其中一个实施例中,所述基于所述第一文档图像获取第一文本图像位置信息包括:对所述第一文档图像进行二值化处理,得到与所述第一文档图像对应的二值图像;对所述二值图像进行形态学处理,得到包含表格线的掩膜图像,所述形态学处理至少包括膨胀和腐蚀;根据所述掩膜图像,获取表格结构信息,所述表格结构信息包括单元格在所述第一文档图像中的位置和尺寸;基于所述表格结构信息以及所述第一文档图像获取所述第一文本图像位置信息。在其中一个实施例中,所述基于所述第一文档图像获取第一文本图像位置信息包括:获取与所述第一文档图像对应的掩膜图像;根据所述掩膜图像,获取所述掩膜图像父轮廓区域内的横竖线交点数量;若所述交点数量大于或等于预设交点数量,则以所述父轮廓区域作为表格区域;对所述表格区域进行子轮廓检测,将所述子轮廓作为单元格;根据所述单元格得到所述表格结构信息;基于所述表格结构信息以及所述第一文档图像获取所述第一文本图像位置信息。在其中一个实施例中,所述基于所述第一文档图像获取第一文本图像位置信息包括:根据所述第一文档图像获取表格结构信息,所述表格结构信息包括单元格在所述第一文档图像中的位置和尺寸;根据所述表格结构信息去除所述第一文档图像中的表格线并获取单元格图像;将所述单元格图像进行投影定位,获取所述第一文本图像位置信息。在其中一个实施例中,所述将所述单元格图像进行投影定位包括:将所述单元格图像进行水平方向像素投影,获取所述第一文本图像在竖直方向上的位置信息;将所述第一文本图像进行竖直方向的像素投影并采用二分法确定所述第一文本图像在水平方向上的位置信息;根据所述第一文本图像在竖直方向的位置信息以及所述第一文本在水平方向上的位置信息,获得所述第一文本图像位置信息。在其中一个实施例中,所述对所述第一文本图像进行竖直方向的像素投影并采用二分法确定所述第一文本图像在水平方向上的位置信息包括:标记所述第一文本图像的第一起始位置和第一末尾位置;自所述第一起始位置和所述第一末尾位置的中间位置开始,采用二分法向靠近所述第一起始位置的方向查找水平起始位置,若当前位置的像素投影值为第一预设值,且当前位置靠近所述第一起始位置方向的预设距离的像素投影值为第二预设值,则以所述当前位置为所述水平起始位置,所述水平起始位置为所述第一文本图像在水平方向上的起始位置;自所述第一起始位置和所述第一末尾位置的中间位置开始,采用二分法向远离所述第一末尾位置的方向查找水平末尾位置,若当前位置的像素投影值为第一预设值,且当前位置靠近所述第一末尾位置方向的预设距离的像素投影值为第二预设值,则以所述当前位置为所述水平末尾位置,所述水平末尾位置为所述第一文本图像在水平方向上的末尾位置。在其中一个实施例中,所述对所述第二文本图像进行识别包括:获取半灰度阈值;若所述第二文本图像中的原始像素点的当前灰度值小于等于所述半灰度阈值,则半灰度化处理后的所述原始像素点的灰度值不变;若所述第二文本图像中的所述原始像素点的当前灰度值大于所述半灰度阈值,则半灰度化处理后的所述原始像素点的灰度值变为预设灰度值;将经过半灰度化处理后的所述第二文本图像输入识别网络进行识别。第二方面,本申请实施例提供了一种文档识别方法,包括:文档获取模块:用于获取第一文档图像,所述第一文档图像由初始文档图像降低分辨率得到;文本定位模块:用于基于所述第一文档图像获取第一文本图像位置信息,所述第一文本图像位置信息表示待识别文本图像在所述第一文档图像中的位置;文本转换模块:用于获取所述初始文档图像中与所述第一文本图像位置信息对应的第二文本图像;文本识别模块:用于对所述第二文本图像进行识别,获取文本内容,进而得到文档识别结果。第三方面,本申请实施例提供了一种计算机设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述第一方面所述的文档识别方法。第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述第一方面所述的文档识别方法。相比于相关技术,本申请实施例提供的文档识别方法,通过获取第一文档图像,所述第一文档图像由初始文档图像降低分辨率得到;基于所述第一文档图像获取第一文本图像位置信息,所述第一文本图像位置信息表示待识别文本图像在所述第一文档图像中的位置;获取所述初始文档图像中与所述第一文本图像位置信息对应的第二文本图像;对所述第二文本图像进行识别,获取文本内容,进而得到文档识别结果,解决了文档识别速度较慢的问题,实现了快速识别文档内容的技术效果。本申请的一个或多个实施例的细节在以下附图和描述中提出,以使本申请的其他特征、目的和优点更加简明易懂。附图说明此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:图1是本申请实施例的文档识别方法的流程图;图2是根据本申请实施例的文档识别方法的表格倾斜示意图;图3是根据本申请实施例的文档识别方法的第一文本图像示意图;图4-a是根据本申请实施例的文档识别方法的识别效果示意图;图4-b是根据本申请另一实施例的文档识别方法的识别效果示意图;图4-c是根据本申请另一实施例的文档识别方法的识别效果示意图;图4-d是根据本申请另一实施例的文档识别方法的识别效果示意图;图5是根据本申请实施例的文档识别装置的结构框图;图6为根据本申请实施例的计算机设备的硬件结构示意图。具体实施方式为了使本申请的目的、技术方案及优点更加清楚本文档来自技高网...

【技术保护点】
1.一种文档识别方法,其特征在于,包括:/n获取第一文档图像,所述第一文档图像由初始文档图像降低分辨率得到;/n基于所述第一文档图像获取第一文本图像位置信息,所述第一文本图像位置信息表示待识别文本图像在所述第一文档图像中的位置;/n获取所述初始文档图像中与所述第一文本图像位置信息对应的第二文本图像;/n对所述第二文本图像进行识别,获取文本内容,进而得到文档识别结果。/n

【技术特征摘要】
1.一种文档识别方法,其特征在于,包括:
获取第一文档图像,所述第一文档图像由初始文档图像降低分辨率得到;
基于所述第一文档图像获取第一文本图像位置信息,所述第一文本图像位置信息表示待识别文本图像在所述第一文档图像中的位置;
获取所述初始文档图像中与所述第一文本图像位置信息对应的第二文本图像;
对所述第二文本图像进行识别,获取文本内容,进而得到文档识别结果。


2.根据权利要求1所述的文档识别方法,其特征在于,所述基于所述第一文档图像获取第一文本图像位置信息包括:
对所述第一文档图像进行二值化处理,得到与所述第一文档图像对应的二值图像;
对所述二值图像进行形态学处理,得到包含表格线的掩膜图像,所述形态学处理至少包括膨胀和腐蚀;
根据所述掩膜图像,获取表格结构信息,所述表格结构信息包括单元格在所述第一文档图像中的位置和尺寸;
基于所述表格结构信息以及所述第一文档图像获取所述第一文本图像位置信息。


3.根据权利要求1所述的文档识别方法,其特征在于,所述基于所述第一文档图像获取第一文本图像位置信息包括:
获取与所述第一文档图像对应的掩膜图像;
根据所述掩膜图像,获取所述掩膜图像父轮廓区域内的横竖线交点数量;
若所述交点数量大于或等于预设交点数量,则以所述父轮廓区域作为表格区域;
对所述表格区域进行子轮廓检测,将所述子轮廓作为单元格;
根据所述单元格得到所述表格结构信息;
基于所述表格结构信息以及所述第一文档图像获取所述第一文本图像位置信息。


4.根据权利要求1所述的文档识别方法,其特征在于,所述基于所述第一文档图像获取第一文本图像位置信息包括:
根据所述第一文档图像获取表格结构信息,所述表格结构信息包括单元格在所述第一文档图像中的位置和尺寸;
根据所述表格结构信息去除所述第一文档图像中的表格线并获取单元格图像;
将所述单元格图像进行投影定位,获取所述第一文本图像位置信息。


5.根据权利要求4所述的文档识别方法,其特征在于,所述将所述单元格图像进行投影定位包括:
将所述单元格图像进行水平方向像素投影,获取所述第一文本图像在竖直方向上的位置信息;
将所述第一文本图像进行竖直方向的像素投影并采用二分法确定所述第一文本图像在水平方向上的位置信息;
根据所述第一文本图像在竖直方向的位置信息以及所述第一文本在水平方向上的位置信息,获得所述第一文本图像位置...

【专利技术属性】
技术研发人员:李亚红陈媛媛
申请(专利权)人:浙江大华技术股份有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1