文本图像版面分析方法、装置、电子设备及存储介质制造方法及图纸

技术编号:34954429 阅读:40 留言:0更新日期:2022-09-17 12:32
本申请实施例提供了一种文本图像版面分析方法、装置、电子设备及存储介质。文本图像版面分析方法包括:利用解析模型中的特征提取网络,提取待处理文本图像的特征信息;利用解析模型中的区域生成网络,基于待处理文本图像的特征信息,获取待处理文本图像中包含的各版面区域的位置和类型;利用解析模型中的特征对齐网络,基于待处理文本图像的特征信息和各版面区域的位置,获取各版面区域的特征信息;针对预设类型的每个版面区域,利用解析模型中当前版面区域的类型对应的内容解析网络,基于当前版面区域的特征信息,解析得到当前版面区域的解析结果。本申请实施例能够提升解析结果的准确性,版面分析过程更加简洁高效。版面分析过程更加简洁高效。版面分析过程更加简洁高效。

【技术实现步骤摘要】
文本图像版面分析方法、装置、电子设备及存储介质


[0001]本申请涉及图像处理
,特别是涉及一种文本图像版面分析方法、装置、电子设备及存储介质。

技术介绍

[0002]文本图像的版面分析是指对文本图像上不同版面区域进行识别和解析,以便进行后续的OCR(Optical Character Recognition,光学字符识别)处理,文本图像的版面分析在版面还原中具有重要的应用。
[0003]现有技术中,对于文本图像的版面分析方式,是针对不同类型的版面区域,采用独立的区域检测算法和区域解析算法进行分析。比如,文本区域需要采用文本区域检测算法及文本区域解析算法进行分析,表格区域需要采用表格区域检测算法及表格区域解析算法进行分析,等等。
[0004]但是,上述独立的区域检测算法及区域解析算法,由于没有利用区域的全局协同信息从而导致解析效果较差,并且处理过程复杂、效率低下。

技术实现思路

[0005]鉴于上述问题,本申请实施例提出了一种文本图像版面分析方法、装置、电子设备及存储介质,用以提高文本图像版面分析的准确性和本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种文本图像版面分析方法,其特征在于,所述方法包括:利用解析模型中的特征提取网络,提取待处理文本图像的特征信息;利用所述解析模型中的区域生成网络,基于所述待处理文本图像的特征信息,获取所述待处理文本图像中包含的各版面区域的位置和类型;利用所述解析模型中的特征对齐网络,基于所述待处理文本图像的特征信息和所述各版面区域的位置,获取所述各版面区域的特征信息;针对预设类型的每个版面区域,利用所述解析模型中当前版面区域的类型对应的内容解析网络,基于当前版面区域的特征信息,解析得到当前版面区域的解析结果。2.根据权利要求1所述的方法,其特征在于,所述解析模型通过如下方式进行训练:利用待训练解析模型中的特征提取网络,提取样本文本图像的特征信息;利用所述待训练解析模型中的区域生成网络,基于所述样本文本图像的特征信息,获取所述样本文本图像中包含的各样本版面区域的位置和类型;利用所述待训练解析模型中的特征对齐网络,基于所述样本文本图像的特征信息和各样本版面区域的位置,获取所述各样本版面区域的特征信息;针对预设类型的每个样本版面区域,利用所述待训练解析模型中当前样本版面区域的类型对应的内容解析网络,基于当前样本版面区域的特征信息,解析得到当前样本版面区域的解析结果;计算模型损失函数,基于所述模型损失函数确定是否训练完成。3.根据权利要求2所述的方法,其特征在于,计算模型损失函数包括:计算所述区域生成网络的损失函数和各内容解析网络的损失函数;基于所述区域生成网络的损失函数和各内容解析网络的损失函数,计算所述模型损失函数。4.根据权利要求3所述的方法,其特征在于,基于所述区域生成网络的损失函数和各内容解析网络的损失函数,计算所述模型损失函数,包括:对所述区域生成网络的损失函数和各内容解析网络的损失函数进行加权计算,得到所述模型损失函数。5.根据权利要求1所述的方法,其特征在于,所述预设类型包括以下至少一种:表格区域、文本区域、公式区域。6.一种文本图像版面分析装置,其特征在于,所述装置包括:提取模块,用于利用解析模型中的特征提取网络,提取待处理文本图像的特征信息...

【专利技术属性】
技术研发人员:高大帅李健陈明武卫东
申请(专利权)人:北京捷通鸿泰科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1