版面数据合成方法、设备及存储介质技术

技术编号:26304888 阅读:31 留言:0更新日期:2020-11-10 20:01
本发明专利技术公开了一种版面数据合成方法、设备及存储介质。该方法包括:将获取的纯文本图像进行自适应二值化处理,得到纯文本二值化图像。基于纯文本二值化图像,获取纯文本图像中文字区域的像素坐标和像素值。对纯文本二值化图像进行行列分割处理,得到文本行的坐标、文本分栏的数量以及文本分栏的坐标。基于文本行的坐标、文本分栏的数量、文本分栏的坐标以及包含至少一个插入数据的插入数据库,确定至少一个待插入数据以及各待插入数据的坐标。基于背景数据库中目标背景图像、文字区域的像素坐标和像素值以及至少一个待插入数据和各待插入数据的坐标,合成版面数据。本发明专利技术实现了合成版面数据。

【技术实现步骤摘要】
版面数据合成方法、设备及存储介质
本专利技术实施例涉及数据处理
,尤其涉及一种版面数据合成方法、设备及存储介质。
技术介绍
随着大数据时代的到来以及计算机硬件的发展,深度学习模型在各个领域得到了广泛应用,例如,人脸识别领域、智能驾驶领域以及光学字符识别(OpticalCharacterRecognition,OCR)领域等。随着OCR技术的发展,OCR已经广泛应用于文档的自动处理中,大大提高了文档的复现效率。其中,OCR系统的一个重要步骤是文档的布局分析,虽然文档中主要包含文本,但缺乏文档的布局信息,也无法对文档进行正确的重建。目前,OCR技术中文档布局分析技术较多使用深度学习,而深度学习属于数据驱动型,其依赖大量具有标注信息的版面数据,该标注信息为版面数据对应图像中每个像素的像素类别。但是,开源的该版面数据较少,且多是外文数据,因此,亟需一种可以合成具有标注信息的版面数据的方法。
技术实现思路
本专利技术提供一种版面数据合成方法、设备及存储介质,以实现合成版面数据。第一方面,本专利技术实施例提供了一种版面数据本文档来自技高网...

【技术保护点】
1.一种版面数据合成方法,其特征在于,包括:/n将获取的纯文本图像进行自适应二值化处理,得到纯文本二值化图像;/n基于所述纯文本二值化图像,获取所述纯文本图像中文字区域的像素坐标和像素值;/n对所述纯文本二值化图像进行行列分割处理,得到文本行的坐标、文本分栏的数量以及所述文本分栏的坐标;/n基于所述文本行的坐标、文本分栏的数量、所述文本分栏的坐标以及包含至少一个插入数据的插入数据库,确定至少一个待插入数据以及各所述待插入数据的坐标;/n基于背景数据库中目标背景图像、所述文字区域的像素坐标和像素值以及至少一个待插入数据和各所述待插入数据的坐标,合成版面数据,所述版面数据具有标签,所述标签用于指示...

【技术特征摘要】
1.一种版面数据合成方法,其特征在于,包括:
将获取的纯文本图像进行自适应二值化处理,得到纯文本二值化图像;
基于所述纯文本二值化图像,获取所述纯文本图像中文字区域的像素坐标和像素值;
对所述纯文本二值化图像进行行列分割处理,得到文本行的坐标、文本分栏的数量以及所述文本分栏的坐标;
基于所述文本行的坐标、文本分栏的数量、所述文本分栏的坐标以及包含至少一个插入数据的插入数据库,确定至少一个待插入数据以及各所述待插入数据的坐标;
基于背景数据库中目标背景图像、所述文字区域的像素坐标和像素值以及至少一个待插入数据和各所述待插入数据的坐标,合成版面数据,所述版面数据具有标签,所述标签用于指示所述版面数据对应图像中每个像素的像素类别。


2.根据权利要求1所述的方法,其特征在于,所述基于所述文本行的坐标、文本分栏的数量、所述文本分栏的坐标以及包含至少一个插入数据的插入数据库,确定至少一个待插入数据以及各所述待插入数据的坐标,包括:
确定所述文本分栏的数量至少为1时,针对每个文本分栏,根据所述文本分栏的坐标以及各所述文本行的坐标,确定所述文本分栏中所包括文本行的文本属性信息,其中所述文本属性信息包括:所述文本分栏中所包括文本行的行数以及所述文本分栏中所包括文本行的行宽度值和行高度值;
确定待插入数据的预设数量,选取所述插入数据库中一个插入数据作为当前待插入数据;
根据所述当前待插入数据的宽高属性值及所述文本属性信息,确定所述当前待插入数据的坐标;
返回执行新的当前待插入数据的选定操作,直至被选定的所述插入数据的数量与所述预设数量相等。


3.根据权利要求2所述的方法,其特征在于,所述根据所述当前待插入数据的宽高属性值及所述文本属性信息,确定所述当前待插入数据的坐标,包括:
按照预设比例将所述宽高属性值中的宽度值以及所述宽高属性值中高度值缩放,所述预设比例为所述宽高属性值中的宽度值与所述文本属性信息内所包括文本行的行宽度值的比值;
根据所述文本属性信息内所包括文本行的行高度值,确定所述当前待插入数据的占行数;
获取所述当前待插入数据所对应的文本分栏已占行数,所述文本分栏已占行数是基于上一待插入数据的占行数以及目标起始行确定;
如果预备占行数小于或等于所述文本属性信息内所包括文本行的行数,则确定所述当前待插入数据的目标起始行,所述目标起始行大于所述文本分栏已占行数,基于所述当前待插入数据的...

【专利技术属性】
技术研发人员:万林张百灵周炬马成龙
申请(专利权)人:苏州开心盒子软件有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1