一种表格生成方法及电子设备技术

技术编号:36893166 阅读:12 留言:0更新日期:2023-03-15 22:08
本申请提供一种表格生成方法及电子设备,涉及计算机视觉领域,方法包括:获取配置的至少一个表格模板的表格属性信息,表格属性信息包含各单元格的第一属性信息和第一位置信息;确定每个表格模板中待填充的各文本的第二属性信息,基于该表格模板的各单元格的第一位置信息确定各文本在表格模板中的第二位置信息,以及基于相应文本的第二属性信息调整所在单元格的第一属性信息;基于调整后的每个表格模板的表格属性信息、待填充的各个文本以及所述各个文本的第二属性信息和第二位置信息,生成相应的表格。本申请可快速生成样式多样的表格,进而基于该表格生成的表格图像可以满足模型训练的需求。型训练的需求。型训练的需求。

【技术实现步骤摘要】
一种表格生成方法及电子设备


[0001]本申请涉及计算机视觉
,尤其涉及一种表格生成方法及电子设备。

技术介绍

[0002]表格作为一种组织整理数据的手段,在日常通讯交流、科学研究以及数据分析等活动中发挥着重要作用。利用表格,将杂乱无章的数据按照某种逻辑结构组织起来,能提升人们获取、操作数据的效率,同时,将表格内容通过图片等可视化形式呈现,有利于人们更好地理解表格内容。
[0003]在计算机视觉领域,表格图像识别是OCR(optical character recognition,文字识别)中的一项关键任务。目前,表格图像识别主要采用深度学习方法,而深度学习方法依赖于大量的训练数据(表格图像)对表格图像识别模型进行训练,以达到较好的泛化效果。
[0004]为了便于获取大量训练数据,需要自动生成表格,进而生成表格图像。但是,目前的表格自动生成方法中,通常基于设定样式生成表格,导致生成表格的样式相对单一,不能满足表格图像识别模型训练的需求。

技术实现思路

[0005]本申请提供了一种表格生成方法及电子设备,用以提升生成表格的样式多样性,以使基于该表格生成的表格图像满足表格图像识别模型的训练需求。
[0006]第一方面,本申请实施例提供一种表格生成方法,包括:
[0007]获取配置的至少一个表格模板各自的表格属性信息,所述表格属性信息至少包含各个单元格的第一属性信息和第一位置信息;
[0008]针对每个表格模板,确定待填充的各个文本以及所述各个文本的第二属性信息,基于所述表格模板的各个单元格的第一位置信息,确定所述各个文本在所述表格模板中的第二位置信息,以及基于相应文本的第二属性信息调整所在单元格的第一属性信息;
[0009]基于调整后的每个表格模板的表格属性信息、待填充的各个文本以及所述各个文本的第二属性信息和第二位置信息,生成相应的表格。
[0010]在一些可能的实施例中,每个表格模板的表格属性信息,通过以下任意一种方式获得:
[0011]从预设的候选表格模板集中选择一个候选表格模板,基于选择的候选表格模板的表格属性信息,获得所述表格模板的表格属性信息;
[0012]随机生成表格模板的表格属性信息。
[0013]在一些可能的实施例中,所述确定待填充的各个文本的属性信息,包括:
[0014]获取所述表格模板对应的预设文字库,从所述预设文字库中随机选择待填充的各个文本;
[0015]基于配置的所述表格模板对应的文本属性信息,确定所述各个文本的第二属性信息。
[0016]在一些可能的实施例中,每个文本的第二属性信息至少包括所述文本在相应的单元格中的分布信息;
[0017]所述基于所述表格模板的各个单元格的第一位置信息,确定所述各个文本在所述表格模板中的第二位置信息,包括:
[0018]针对所述各个文本中的每个文本,执行以下操作:
[0019]从所述表格模板中的各个单元格中,随机选择所述文本对应的目标单元格;
[0020]基于选择的目标单元格的第一位置信息,结合所述文本在所述目标单元格中的分布信息,确定所述文本在所述目标单元格中的相对位置信息,基于所述相对位置信息获得确定所述文本在所述表格模板中的第二位置信息。
[0021]在一些可能的实施例中,每个单元格的第一属性信息至少包括单元格的尺寸信息,每个文本的第二属性信息还包括字数、字号;所述基于相应文本的第二属性信息调整所在单元格的第一属性信息,包括:
[0022]针对所述各个文本中的每个文本,执行以下操作:
[0023]若确定所述文本的字数及字号,与所述文本所在单元格的尺寸信息不匹配,则基于所述文本的字数及字号,调整所述文本所在单元格的尺寸信息;或者
[0024]若确定所述文本的字数及字号,与所述文本所在单元格的尺寸信息不匹配,则基于所述文本的字数及字号,将所述文本所在单元格与相邻单元格进行合并。
[0025]在一些可能的实施例中,所述方法还包括:
[0026]确定背景画布的颜色属性信息,基于所述颜色属性信息生成背景画布;
[0027]将生成的至少一个表格分别置于所述背景画布的相应位置,获得表格图像。
[0028]在一些可能的实施例中,所述背景画布的颜色属性信息通过以下任意一种方式确定:
[0029]从预设的图像集合中选择一个图像,基于选择的图像的颜色属性信息获得所述背景画布的颜色属性信息;
[0030]随机生成背景画布的颜色属性信息。
[0031]在一些可能的实施例中,所述将生成的各个表格分别置于所述背景画布的相应位置,包括:
[0032]获取配置的各个表格各自与所述背景画布的相对位置关系;
[0033]针对生成的每个表格,基于所述表格与所述背景画布的相对位置关系,将生成的表格置于所述背景画布的相应位置。
[0034]在一些可能的实施例中,所述获得表格图像之后,还包括:
[0035]将所述表格图像进行至少一次增强处理,获得至少一个处理后的表格图像;
[0036]其中,每次增强处理包括以下一种或多种操作:亮度变换、对比度变换、角度旋转、图像缩放、倾斜变形。
[0037]第二方面,本申请实施例提供一种表格生成装置,包括:
[0038]模板获取模块,用于获取配置的至少一个表格模板各自的表格属性信息,所述表格属性信息至少包含各个单元格的第一属性信息和第一位置信息;
[0039]自适应调整模块,用于针对每个表格模板,确定待填充的各个文本以及所述各个文本的第二属性信息,基于所述表格模板的各个单元格的第一位置信息,确定所述各个文
本在所述表格模板中的第二位置信息,以及基于相应文本的第二属性信息调整所在单元格的第一属性信息;
[0040]表格生成模块,用于基于调整后的每个表格模板的表格属性信息、待填充的各个文本以及所述各个文本的第二属性信息和第二位置信息,生成相应的表格。
[0041]在一些可能的实施例中,所述装置还包括模板配置模块,用于通过以下任意一种方式获得配置的每个表格模板的表格属性信息:
[0042]从预设的候选表格模板集中选择一个候选表格模板,基于选择的候选表格模板的表格属性信息,获得所述表格模板的表格属性信息;
[0043]随机生成表格模板的表格属性信息。
[0044]在一些可能的实施例中,所述基于所述表格模板的各个单元格的第一位置信息,确定所述各个文本在所述表格模板中的第二位置信息时,所述自适应调整模块还用于:
[0045]针对所述各个文本中的每个文本,执行以下操作:
[0046]从所述表格模板中的各个单元格中,随机选择所述文本对应的目标单元格;
[0047]基于选择的目标单元格的第一位置信息,结合所述文本在所述目标单元格中的分布信息,确定所述文本在所述目标单元格中的相对位置信息,基于所述相对位置信息获得确定所述文本在所述表格模板中的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种表格生成方法,其特征在于,包括:获取配置的至少一个表格模板的表格属性信息,所述表格属性信息至少包含各个单元格的第一属性信息和第一位置信息;针对每个表格模板,确定待填充的各个文本以及所述各个文本的第二属性信息,基于所述表格模板的各个单元格的第一位置信息,确定所述各个文本在所述表格模板中的第二位置信息,以及基于相应文本的第二属性信息调整所在单元格的第一属性信息;基于调整后的每个表格模板的表格属性信息、待填充的各个文本以及所述各个文本的第二属性信息和第二位置信息,生成相应的表格。2.根据权利要求1所述的方法,其特征在于,每个表格模板的表格属性信息,通过以下任意一种方式获得:从预设的候选表格模板集中选择一个候选表格模板,基于选择的候选表格模板的表格属性信息,获得所述表格模板的表格属性信息;随机生成表格模板的表格属性信息。3.根据权利要求1所述的方法,其特征在于,所述确定待填充的各个文本的属性信息,包括:获取所述表格模板对应的预设文字库,从所述预设文字库中随机选择待填充的各个文本;基于配置的所述表格模板对应的文本属性信息,确定所述各个文本的第二属性信息。4.根据权利要求1至3任一项所述的方法,其特征在于,每个文本的第二属性信息至少包括所述文本在相应的单元格中的分布信息;所述基于所述表格模板的各个单元格的第一位置信息,确定所述各个文本在所述表格模板中的第二位置信息,包括:针对所述各个文本中的每个文本,执行以下操作:从所述表格模板中的各个单元格中,随机选择所述文本对应的目标单元格;基于选择的目标单元格的第一位置信息,结合所述文本在所述目标单元格中的分布信息,确定所述文本在所述目标单元格中的相对位置信息,基于所述相对位置信息获得所述文本在所述表格模板中的第二位置信息。5.根据权利要求4所述的方法,其特征在于,每个单元格的第一属性信息至少...

【专利技术属性】
技术研发人员:赵玲玲张睿程文渊
申请(专利权)人:上海弘玑信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1