一种表格数据处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号:32267381 阅读:34 留言:0更新日期:2022-02-12 19:30
本发明专利技术提供一种表格数据处理方法、装置、电子设备及存储介质。所述方法包括:识别表格结构,根据所述表格结构和表格中数据内容的相似度,将所述表格的区域进行拆分,生成多个子表格;对所述子表格的数据内容进行规范化处理,得到处理后的子表格。本发明专利技术根据表格结构和表格数据内容的相似度计算出是否需要拆分表格,并对拆分后的表格进行数据清洗,降低了人的参与度的同时保证了拆分后的表格数据完整性和可分析性。整性和可分析性。整性和可分析性。

【技术实现步骤摘要】
一种表格数据处理方法、装置、电子设备及存储介质


[0001]本专利技术涉及计算机
,尤其涉及一种表格数据处理方法、装置、电子设备及存储介质。

技术介绍

[0002]表格支持数据内容输入、输出和显示,可以帮助用户制作各种复杂的表格文档。然而,在表格中数据内容输入格式不统一的情况下,无法根据数据内容进行后续的引用、统计和计算等处理。
[0003]现有技术中,为了利用这些输入格式不统一的数据内容,需要人工对数据内容进行格式统一处理,然而这种人工处理数据内容的方式较为繁琐且效率低下。

技术实现思路

[0004]本专利技术提供一种表格数据处理方法、装置、电子设备及存储介质,用以解决现有技术中只能通过人工对表格的数据内容进行格式统一处理的问题。
[0005]本专利技术提供一种表格数据处理方法,包括:
[0006]识别表格结构,根据所述表格结构和表格中数据内容的相似度,将所述表格的区域进行拆分,生成多个子表格;
[0007]对所述子表格的数据内容进行规范化处理,得到处理后的子表格。r/>[0008]优本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种表格数据处理方法,其特征在于,包括:识别表格结构,根据所述表格结构和表格中数据内容的相似度,将所述表格的区域进行拆分,生成多个子表格;对所述子表格的数据内容进行规范化处理,得到处理后的子表格。2.根据权利要求1所述的表格数据处理方法,其特征在于,所述根据所述表格结构和表格中数据内容的相似度,将所述表格的区域进行拆分,生成多个子表格,包括:获取当前表格的第一字段构成和第一数据内容,以及在先表格的第二字段构成和第二数据内容;计算所述在先表格和所述当前表格的相似值;若所述相似值小于第一阈值,则将所述表格拆分为在先子表格和当前子表格。3.根据权利要求2所述的表格数据处理方法,其特征在于,所述计算所述在先表格和所述当前表格的相似值,包括:根据所述第一字段构成和所述第一数据内容确定所述当前表格的第一类型值,根据所述第二字段构成和所述第二数据内容确定所述在先表格的第二类型值;根据所述第一类型值和所述第二类型值,计算所述相似值。4.根据权利要求3所述的表格数据处理方法,其特征在于,所述根据所述第一类型值和所述第二类型值,计算所述相似值,包括:将所述第一类型值和所述第二类型值的比值作为所述相似值。5.根据权利要求1所述的表格数据处理方法,其特征在于,还包括:识别所述表格中的空白区域,若所述空白区域对应的空白行数/空白列数大于第二阈值,则将所述表格拆分为多个子表格。6.根据权利要求1所述的表格数据处理方法,其特征在于,所述对所述子表格的数据内容进行规范化处理,得到处理后的子表格,包括:根据所述子表格的行标题的数据字段,遍历所述子表格的全部数据内容,将每个数据内容列的数据内容以与所述子表格的行标题的数据字段对应的格式显示;或者,根据所述子表格的...

【专利技术属性】
技术研发人员:辛洋
申请(专利权)人:北京金山办公软件股份有限公司武汉金山办公软件有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1