电子表格的生成方法、装置、电子设备及存储介质制造方法及图纸

技术编号:35795288 阅读:26 留言:0更新日期:2022-12-01 14:46
本公开涉及信息处理技术领域,尤其涉及一种电子表格的生成方法、装置、电子设备及存储介质,所述生成方法包括:获取带有目标表格的待处理图像;确定所述待处理图像对应的图像特征序列以及文本特征序列;将所述图像特征序列与所述文本特征序列进行特征融合,得到融合特征序列;将所述融合特征序列转换为电子表格排布序列;根据所述电子表格排布序列,生成所述目标表格对应的电子表格。本公开实施例在电子表格在生成过程中考虑到了目标表格在整体上的图像级特征以及目标表格的文本级特征,可提高电子表格的生成准确率。此外,本公开实施例采用了端到端的数据处理结构,有利于缩短了电子表格的生成时长、降低了对其进行优化维护的难度。难度。难度。

【技术实现步骤摘要】
电子表格的生成方法、装置、电子设备及存储介质


[0001]本公开涉及信息处理
,尤其涉及一种电子表格的生成方法、装置、电子设备及存储介质。

技术介绍

[0002]随着各类行业的发展,越来越多的用户会利用表格统计获得的各类数据,而鉴于一些无法直接获取电子表格的情况(例如:表格为手写表格、仅有表格的纸质版本),如何更好地将表格重建为编辑更为方便的电子表格,是本领域技术人员亟需解决的技术问题。

技术实现思路

[0003]本公开提出了一种电子表格的生成技术方案。
[0004]根据本公开的一方面,提供了一种电子表格的生成方法,所述生成方法包括:获取带有目标表格的待处理图像;确定所述待处理图像对应的图像特征序列以及文本特征序列;其中,图像特征序列用以表示待处理图像的图像特征的序列,文本特征序列用以表示待处理图像中目标表格的文本信息的文本特征的序列;将所述图像特征序列与所述文本特征序列进行特征融合,得到融合特征序列;将所述融合特征序列转换为电子表格排布序列;其中,所述电子表格排布序列用以表示电子表格中单元格的排布情况;根据所述电子表格排布序列,生成所述目标表格对应的电子表格。
[0005]在一种可能的实施方式中,所述确定所述待处理图像对应的图像特征序列,包括:将所述待处理图像分割为多个区域图像;确定每个区域图像对应的图像特征;将所述每个区域图像对应的图像特征进行排列,作为所述待处理图像对应的图像特征序列。
[0006]在一种可能的实施方式中,所述确定所述待处理图像对应的文本特征序列,包括:确定所述待处理图像中包括文本信息的多个文本框;确定每个文本框对应的文本特征;将所述每个文本框对应的文本特征进行排列,作为所述待处理图像对应的文本特征序列。
[0007]在一种可能的实施方式中,所述确定每个文本框对应的文本特征,包括:将每个文本框对应的文本框坐标、每个文本框中文本信息对应的语义特征、每个文本框对应的视觉特征中的至少一项,作为每个文本框对应的文本特征。
[0008]在一种可能的实施方式中,所述每个文本框对应的文本特征包括所述每个文本框对应的文本框坐标;所述根据所述电子表格排布序列,生成所述目标表格对应的电子表格,包括:根据所述电子表格排布序列,确定电子表格中每个单元格对应的单元格坐标;根据每个所述单元格坐标、每个所述文本框坐标,确定所述每个单元格对应的文本信息;根据每个单元格对应的单元格坐标、每个单元格对应的文本信息,生成所述目标表格对应的电子表格。
[0009]在一种可能的实施方式中,所述根据每个所述单元格坐标、每个所述文本框坐标,确定所述每个单元格对应的文本信息,包括:根据每个所述单元格坐标,确定每个所述单元格坐标对应的第一多边形;根据每个所述文本框坐标,确定每个所述文本框坐标对应的第
二多边形;针对每个第一多边形,确定与所述每个第一多边形重合程度最高的第二多边形,并在所述重合程度最高的第二多边形对应的重合程度大于预设值的情况下,将重合程度最高的第二多边形对应的文本信息作为所述每个第一多边形对应的单元格的文本信息。
[0010]在一种可能的实施方式中,所述根据每个所述单元格坐标、每个所述文本框坐标,确定所述每个单元格对应的文本信息,还包括:在所述重合程度最高的第二多边形对应的重合程度小于或等于预设值的情况下,将所述每个第一多边形对应的单元格作为待编辑单元格;所述生成方法还包括:响应于针对所述待编辑单元格的输入文本,更新所述电子表格。
[0011]根据本公开的一方面,提供了一种电子表格的生成装置,所述生成装置包括:图像获取模块,用以获取带有目标表格的待处理图像;特征序列确定模块,用以确定所述待处理图像对应的图像特征序列以及文本特征序列;其中,图像特征序列用以表示待处理图像的图像特征的序列,文本特征序列用以表示待处理图像中目标表格的文本信息的文本特征的序列;特征融合模块,用以将所述图像特征序列与所述文本特征序列进行特征融合,得到融合特征序列;排布序列生成模块,用以将所述融合特征序列转换为电子表格排布序列;其中,所述电子表格排布序列用以表示电子表格中单元格的排布情况;电子表格生成模块,用以根据所述电子表格排布序列,生成所述目标表格对应的电子表格。
[0012]根据本公开的一方面,提供了一种电子设备,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为调用所述存储器存储的指令,以执行上述电子表格的生成方法。
[0013]根据本公开的一方面,提供了一种计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现上述电子表格的生成方法。
[0014]在本公开实施例中,可获取带有目标表格的待处理图像,而后确定所述待处理图像对应的图像特征序列以及文本特征序列,再将所述图像特征序列与所述文本特征序列进行特征融合,得到融合特征序列,而后将所述融合特征序列转换为电子表格排布序列,最终根据所述电子表格排布序列,生成所述目标表格对应的电子表格。本公开实施例通过将文本特征与图像特征进行融合的方式,使得电子表格在生成过程中不仅考虑到了目标表格在整体上的图像级特征,而且考虑到了目标表格的文本级特征,通过多模态特征融合的方式,可提高电子表格的生成准确率。此外,本公开实施例采用了端到端的数据处理结构,进而减少了后处理流程的复杂程度使得处理流程也更加简洁,有利于缩短了电子表格的生成时长、降低了对其进行优化维护的难度。
[0015]应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,而非限制本公开。根据下面参考附图对示例性实施例的详细说明,本公开的其它特征及方面将变得清楚。
附图说明
[0016]此处的附图被并入说明书中并构成本说明书的一部分,这些附图示出了符合本公开的实施例,并与说明书一起用于说明本公开的技术方案。
[0017]图1示出了根据本公开实施例提供的电子表格的生成方法的流程图。
[0018]图2示出了根据本公开实施例提供的电子表格的生成方法的参考示意图。
[0019]图3示出了根据本公开实施例提供的电子表格的生成装置的框图。
[0020]图4示出了根据本公开实施例提供的一种电子设备的框图。
具体实施方式
[0021]以下将参考附图详细说明本公开的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面,但是除非特别指出,不必按比例绘制附图。
[0022]在这里专用的词“示例性”意为“用作例子、实施例或说明性”。这里作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。
[0023]本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中术语“至少一种”表示多种中的任意一种或多种中的至少两种的任意组合,例如,包括A、B、C中的至少一种,可以表示包括从A、B和C构本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种电子表格的生成方法,其特征在于,所述生成方法包括:获取带有目标表格的待处理图像;确定所述待处理图像对应的图像特征序列以及文本特征序列;其中,图像特征序列用以表示待处理图像的图像特征的序列,文本特征序列用以表示待处理图像中目标表格的文本信息的文本特征的序列;将所述图像特征序列与所述文本特征序列进行特征融合,得到融合特征序列;将所述融合特征序列转换为电子表格排布序列;其中,所述电子表格排布序列用以表示电子表格中单元格的排布情况;根据所述电子表格排布序列,生成所述目标表格对应的电子表格。2.如权利要求1所述的生成方法,其特征在于,所述确定所述待处理图像对应的图像特征序列,包括:将所述待处理图像分割为多个区域图像;确定每个区域图像对应的图像特征;将所述每个区域图像对应的图像特征进行排列,作为所述待处理图像对应的图像特征序列。3.如权利要求1所述的生成方法,其特征在于,所述确定所述待处理图像对应的文本特征序列,包括:确定所述待处理图像中包括文本信息的多个文本框;确定每个文本框对应的文本特征;将所述每个文本框对应的文本特征进行排列,作为所述待处理图像对应的文本特征序列。4.如权利要求3所述的生成方法,其特征在于,所述确定每个文本框对应的文本特征,包括:将每个文本框对应的文本框坐标、每个文本框中文本信息对应的语义特征、每个文本框对应的视觉特征中的至少一项,作为每个文本框对应的文本特征。5.如权利要求4所述的生成方法,其特征在于,所述每个文本框对应的文本特征包括所述每个文本框对应的文本框坐标;所述根据所述电子表格排布序列,生成所述目标表格对应的电子表格,包括:根据所述电子表格排布序列,确定电子表格中每个单元格对应的单元格坐标;根据每个所述单元格坐标、每个所述文本框坐标,确定所述每个单元格对应的文本信息;根据每个单元格对应的单元格坐标、每个单元格对应的文本信息,生成所述目标表格对应的电子表格。6.如权利要求5所述的生成方法,其特征在于,所述根据每个所述单元格坐标、...

【专利技术属性】
技术研发人员:ꢀ七四专利代理机构
申请(专利权)人:摩尔线程智能科技北京有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1