表格生成方法、装置、电子设备以及存储介质制造方法及图纸

技术编号:38017587 阅读:9 留言:0更新日期:2023-06-30 10:44
本公开公开了一种表格生成方法、装置、电子设备以及存储介质,涉及计算机技术领域,尤其涉及光学字符识别技术领域。具体实现方案为:获取文本内容信息和目标页面的布局信息,目标页面的布局信息包括页面参数信息、单元格布局信息和文字布局信息。根据页面参数信息、单元格布局信息和文字布局信息,得到单元格坐标信息。根据文字布局信息和单元格坐标信息,得到文字坐标信息。根据单元格坐标信息、文字坐标信息和文本内容信息,生成目标表格和与目标表格对应的标注数据。标表格对应的标注数据。标表格对应的标注数据。

【技术实现步骤摘要】
表格生成方法、装置、电子设备以及存储介质


[0001]本公开涉及计算机
,尤其涉及光学字符识别
,具体涉及一种表格生成方法、装置、电子设备以及存储介质。

技术介绍

[0002]光学字符识别技术是指对文本资料进行扫描后对图像文件进行分析处理,获取文字及版面信息的过程。
[0003]随着光学字符识别技术的发展,可以利用训练好的表格结构化模型,对表格图像中的文本数据进行识别和提取。在训练表格结构化模型的过程中,需要大量的样本表格图像和样本表格图像的标注数据。

技术实现思路

[0004]本公开提供了一种用于表格生成方法、装置、电子设备以及存储介质。
[0005]根据本公开的一方面,提供了一种表格生成方法,包括:
[0006]获取文本内容信息和目标页面的布局信息,目标页面的布局信息包括页面参数信息、单元格布局信息和文字布局信息。根据页面参数信息、单元格布局信息和文字布局信息,得到单元格坐标信息。根据文字布局信息和单元格坐标信息,得到文字坐标信息。根据单元格坐标信息、文字坐标信息和文本内容信息,生成目标表格和与目标表格对应的标注数据。
[0007]根据本公开的另一方面,提供了一种表格生成装置,包括:第一获取模块、第一获得模块、第二获得模块和生成模块。其中,第一获取模块,用于获取文本内容信息和目标页面的布局信息,目标页面的布局信息包括页面参数信息、单元格布局信息和文字布局信息。第一获得模块,用于根据页面参数信息、单元格布局信息和文字布局信息,得到单元格坐标信息。第二获得模块,用于根据文字布局信息和单元格坐标信息,得到文字坐标信息。生成模块,用于根据单元格坐标信息、文字坐标信息和文本内容信息,生成目标表格和与目标表格对应的标注数据。
[0008]根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上所述的方法。
[0009]根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行如上所述的方法。
[0010]根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现如上所述的方法。
[0011]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0012]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0013]图1示意性示出了根据本公开实施例的可以应用表格生成方法及装置的示例性系统架构;
[0014]图2示意性示出了根据本公开实施例的表格生成方法的流程图;
[0015]图3示意性示出了根据本公开实施例的生成单元格坐标信息的示意图;
[0016]图4示意性示出了根据本公开实施例的表格中的单元格示意图;
[0017]图5示意性示出了根据本公开实施例的根据文字排布方式确定的文字在单元格中的展示效果示意图;
[0018]图6示意性示出了根据本公开一些实施例的表格示意图;
[0019]图7示意性示出了根据本公开一些实施例的带有边框线的表格示意图;
[0020]图8示意性示出了根据本公开一些实施例的带有印章的表格示意图;
[0021]图9示意性示出了根据本公开一些实施例的经过滤波处理的表格示意图;
[0022]图10示意性示出了根据本公开实施例的表格生成装置的框图;以及
[0023]图11示意性示出了根据本公开实施例的适于实现表格生成方法的电子设备的框图。
具体实施方式
[0024]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0025]在利用光学识别技术对表格图像进行识别和信息提取的过程中,不仅需要识别表格图像中的文字,还需要识别表格结构,并对识别结果进行行列信息的结构化处理。
[0026]因此,在训练用于识别表格图像的文字及表格结构的模型之前,需要采集大量的样本表格图像,并对样本表格图像中的文字及表格结构进行标注得到标注数据,利用样本表格图像和标注数据对模型进行训练。
[0027]但是,在相关技术中,采用人工标注的方式得到标注数据,不仅标注效率较低且标注结果的准确率也较低,尤其对于金融领域中的表格图像,例如:资产负债表、现金流量表、利润表等,这些表格图像中表格结构较为复杂,采用人工标注的方式对表格图像中的数据进行标注时,存在较大的困难。直接影响了模型训练的效果。
[0028]有鉴于此,本公开实施例提供了一种表格生成方法,包括:
[0029]获取文本内容信息和目标页面的布局信息,目标页面的布局信息包括页面参数信息、单元格布局信息和文字布局信息。根据页面参数信息、单元格布局信息和文字布局信息,得到单元格坐标信息。根据文字布局信息和单元格坐标信息,得到文字坐标信息。根据单元格坐标信息、文字坐标信息和文本内容信息,生成目标表格和与目标表格对应的标注数据。可以生成应用于金融
中的结构复杂的表格,并且在生成表格的同时自动生成与表格对应的标注数据,无需再进行人工标注。
[0030]图1示意性示出了根据本公开实施例的可以应用表格生成方法及装置的示例性系
统架构。
[0031]需要注意的是,图1所示仅为可以应用本公开实施例的系统架构的示例,以帮助本领域技术人员理解本公开的
技术实现思路
,但并不意味着本公开实施例不可以用于其他设备、系统、环境或场景。例如,在另一实施例中,可以应用表格生成方法及装置的示例性系统架构可以包括终端设备,但终端设备可以无需与服务器进行交互,即可实现本公开实施例提供的表格生成方法及装置。
[0032]如图1所示,根据该实施例的系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线和/或无线通信链路等等。
[0033]用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如知识阅读类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端和/或社交平台软件等(仅为示例)。
[0034]终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种表格生成方法,包括:获取文本内容信息和目标页面的布局信息,所述目标页面的布局信息包括页面参数信息、单元格布局信息和文字布局信息;根据所述页面参数信息、所述单元格布局信息和所述文字布局信息,得到单元格坐标信息;根据所述文字布局信息和所述单元格坐标信息,得到文字坐标信息;以及根据所述单元格坐标信息、所述文字坐标信息和所述文本内容信息,生成目标表格和与所述目标表格对应的标注数据。2.根据权利要求1所述的方法,其中,所述单元格布局信息包括单元格的尺寸比例信息和单元格之间的相对位置关系信息;所述页面参数信息和所述单元格布局信息,得到单元格坐标信息,包括:根据所述页面参数信息和所述单元格的尺寸比例信息,得到最小单元格尺寸信息;根据所述最小单元格尺寸信息和所述相对位置关系信息,得到单元格尺寸信息;以及根据所述单元格尺寸信息、所述页面参数信息和所述文字布局信息,得到所述单元格坐标信息。3.根据权利要求2所述的方法,其中,所述文字布局信息包括文字在单元格内的换行标识信息,所述根据所述单元格尺寸信息、所述页面参数信息和所述文字布局信息,得到所述单元格坐标信息,包括:识别所述换行标识信息,得到文字在所述单元格内的排布行数信息;根据所述单元格尺寸信息和所述页面参数信息,得到单元格在所述目标页面上的排布位置信息;以及根据所述排布位置信息和所述排布行数信息,得到所述单元格坐标信息。4.根据权利要求3所述的方法,其中,所述根据所述排布位置信息和所述排布行数信息,得到所述单元格坐标信息,包括:根据所述排布位置信息,得到位于同一行的多个目标单元格;根据所述排布行数信息,得到所述多个目标单元格的高度信息;以及根据所述排布位置信息和所述高度信息,得到所述单元格坐标信息。5.根据权利要求4所述的方法,其中,所述根据所述排布行数信息,得到所述多个目标单元格的高度信息,包括:将所述多个目标单元格的排布行数信息进行排序,得到排序结果;以及根据所述排序结果,得到所述高度信息。6.根据权利要求1所述的方法,其中,所述文字布局信息包括文字在单元格内的排布方式信息、文字尺寸信息和文字在单元格内的换行标识信息,所述根据所述文字布局信息和所述单元格坐标信息,得到文字坐标信息,包括:根据所述排布方式信息,确定目标策略;根据所述换行标识信息,得到文字在所述单元格内的排布行数信息;以及基于所述目标策略,根据所述单元格坐标信息、所述文字尺寸信息、所述排布方式信息和所述排布行数信息,得到所述文字坐标信息。7.根据权利要求6所述的方法,其中,所述文字尺寸信息包括文字高度信息和文字宽度
信息,所述基于所述目标策略,根据所述单元格坐标信息、所述文字尺寸信息、所述排布方式信息和所述排布行数信息,得到所述文字坐标信息,包括:根据所述单元格坐标信息、所述文字宽度信息和所述排布方式信息,得到文字横坐标信息;基于所述目标策略,根据所述单元格坐标信息、所述文字高度信息和所述排布行数信息,得到文字纵坐标信息;以及根据所述文字横坐标信息和所述文字纵坐标信息,得到所述文字坐标信息。8.根据权利要求7所述的方法,其中,所述根据所述单元格坐标信息、所述文字宽度信息和所述排布方式信息,得到文字横坐标信息,包括:根据所述排布方式信息,确定文字在水平方向上的偏移参数信息;以及根据所述偏移参数信息、所述文字宽度信息和所述单元格坐标信息,得到所述文字横坐标信息。9.根据权利要求8所述的方法,其中,所述单元格坐标信息包括左顶点坐标信息和右顶点坐标信息,所述根据所述偏移参数信息、所述文字宽度信息和所述单元格坐标信息,得到所述文字横坐标信息,包括:根据所述左顶点坐标信息和所述右顶点坐标信息,得到单元格宽度信息;在确定所述排布方式信息为居中对齐的情况下,根据所述左顶点坐标信息、所述单元格宽度信息和所述文字宽度信息,得到所述文字横坐标信息;在确定所述排布方式信息为左侧对齐的情况下,根据所述左顶点坐标信息和所述偏移参数信息,得到所述文字横坐标信息;以及在确定所述排布方式信息为右侧对齐的情况下,根据所述右顶点坐标信息、所述文字宽度信息和所述偏移参...

【专利技术属性】
技术研发人员:韩光耀许海洋岳洪达王艺苏磊陈禹燊段博坤章良杰李治平
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1