一种电子表格数据的处理方法、装置、设备和存储介质制造方法及图纸

技术编号:34782129 阅读:16 留言:0更新日期:2022-09-03 19:39
本发明专利技术提供的电子表格数据的处理方法、装置、设备和存储介质,可以对用户导入的电子表格进行特征提取,得到表征电子表格特征的特征数据。然后在可配置模板库中查找和特征数据匹配的目标可配置模板,若在可配置模板库中未查找到目标可配置模板,则在原始模板库中查找和特征数据匹配的目标原始模板,原始模板库中存储有多个异构电子表格的原始模板。若在原始模板库中查找到目标原始模板,则基于目标原始模板和可配置模板库中可配置模板的对应关系,将电子表格的数据按照和目标原始模板相对应的可配置模板格式进行存储。无需用户手动进行数据格式的转换,大大减少了用户的工作量,提高了工作效率。了工作效率。了工作效率。

【技术实现步骤摘要】
一种电子表格数据的处理方法、装置、设备和存储介质


[0001]本专利技术涉及数据处理
,具体涉及一种电子表格数据的处理方法、装置、设备和存储介质。

技术介绍

[0002]异构电子表格是指在多个电子表格中,其存储的是同一类型的数据但是在列的数量、顺序和每一列的数据格式上有所差异。在企业、政府机构等社会组织的日常运营中,经常需要使用电子表格收集信息。通常上级机构会发布一个电子表格模板供下级机构使用,下级机构使用电子表格模板统计完数据后将表格传输给上级机构,由上级机构将表格数据归集到一起。对于一个架构比较稳定的机构,这种电子表格的使用方式可以满足信息收集的需求。然而,在实际工作中还存在一些特殊的情况,例如随着企业的兼并重整或者机构的调整划转,原来不同的部门被整合到一起,对于同一种类型的数据,在不同的部门中往往存在各自定义的异构电子表格模板。针对这种复杂的情况,往往需要按照新的格式重新录入原始数据,不仅过程费时费力,改造起来也非常的麻烦。

技术实现思路

[0003]为了解决现有技术存在的人工操作效率低、工作量大的问题,本专利技术提供了一种电子表格数据的处理方法、装置、设备和存储介质,其具有自动录入、省时省力等特点。
[0004]根据本专利技术具体实施方式提供的一种电子表格数据的处理方法,包括:
[0005]对用户导入的电子表格进行特征提取,得到表征所述电子表格特征的特征数据;
[0006]在可配置模板库中查找和所述特征数据匹配的目标可配置模板,所述可配置模板库中存储有多个可配置模板,一个所述可配置模板中至少包括表征同一数据类型的异构电子表格的特征数据;
[0007]若在所述可配置模板库中查找到所述目标可配置模板,则将所述电子表格的数据按照所述目标可配置模板的格式进行存储;
[0008]若在所述可配置模板库中未查找到所述目标可配置模板,则在原始模板库中查找和所述特征数据匹配的目标原始模板,所述原始模板库中存储有多个异构电子表格的原始模板,一个所述原始模板中至少包括表征一个原始异构电子表格特征的特征数据;
[0009]若在所述原始模板库中查找到所述目标原始模板,则基于所述目标原始模板和所述可配置模板库中可配置模板的对应关系,将所述电子表格的数据按照和所述目标原始模板相对应的可配置模板格式进行存储。
[0010]进一步地,所述对用户导入的电子表格进行特征提取,得到表征所述电子表格特征的特征数据,包括:
[0011]提取电子表格中的表格级特征和字段级特征,构成特征记录表,所述表格级特征至少包括电子表格中数据列的个数和列头间的排列顺序;所述字段级特征至少包括:列头名称和数据列的数据特征。
[0012]进一步地,所述电子表格数据的处理方法还包括:
[0013]若未在所述原始模板库中查找到所述目标原始模板,则在所述可配置模板库中查找包含所述电子表格的字段级特征的可配置模板,将所述电子表格作为新的原始模板,并将所述新的原始模板和查找到的可配置模板进行对应。
[0014]进一步地,所述若在所述原始模板库中查找到所述目标原始模板,则基于所述目标原始模板和所述可配置模板库中可配置模板的对应关系,将所述电子表格的数据存储至和所述目标原始模板相对应的可配置模板中,包括:
[0015]基于匹配规则对所述原始模板库中的原始模板和所述可配置模板库中可配置模板的进行匹配,得到所述原始模板和所述可配置模板之间的对应关系,所述匹配规则包括:第一匹配规则、第二匹配规则和第三匹配规则,其中,所述第一匹配规则为所述原始模板中的表格级特征和所述可配置模板中的表格级特征相同;所述第二匹配规则为:所述原始模板中的数据列的数据特征和所述可配置模板中的数据列的数据特征相同;所述第三匹配规则为:所述原始模板中的列头名称和所述可配置模板中的列头名称中的相同字符的占比大于预设数值,则将所述原始模板和所述可配置模板相对应;
[0016]将所述电子表格的数据存储至和所述目标原始模板相对应的可配置模板中。
[0017]进一步地,在所述对用户导入的电子表格进行特征提取前,所述方法还包括:对所述电子表格数据进行预处理,预处理过程包括:
[0018]将所述电子表格中的单元格数据转换为字符串,剔除所述字符串中所包含在预设字符集合中的字符。
[0019]进一步地,所述电子表格数据的处理方法还包括:
[0020]基于线程内存将所述目标可配置模板存储至用户的数据库中;
[0021]或,
[0022]基于线程内存将所述目标可配置模板将与所述目标原始模板相对应的可配置模板,存储至用户的数据库中。
[0023]进一步地,所述电子表格数据的处理方法还包括:
[0024]基于散列函数去除所述可配置模板和所述原始模板中的重复数据。
[0025]根据本专利技术具体实施方式提供的一种电子表格数据的处理装置,包括:
[0026]特征提取模块,用于对用户导入的电子表格进行特征提取,得到表征所述电子表格特征的特征数据;
[0027]第一匹配模块,用于在可配置模板库中查找和所述特征数据匹配的目标可配置模板,所述可配置模板库中存储有多个可配置模板,一个所述可配置模板中至少包括表征同一数据类型的异构电子表格的特征数据;
[0028]第一存储模块,用于若在所述可配置模板库中查找到所述目标可配置模板,则将所述电子表格的数据按照所述目标可配置模板的格式进行存储;
[0029]第二匹配模块,用于若在所述可配置模板库中未查找到所述目标可配置模板,则在原始模板库中查找和所述特征数据匹配的目标原始模板,所述原始模板库中存储有多个异构电子表格的原始模板,一个所述原始模板中至少包括表征一个原始异构电子表格特征的特征数据;以及
[0030]第二存储模块,用于若在所述原始模板库中查找到所述目标原始模板,则基于所
述目标原始模板和所述可配置模板库中可配置模板的对应关系,将所述电子表格的数据按照和所述目标原始模板相对应的可配置模板格式进行存储。
[0031]根据本专利技术具体实施方式提供的一种设备,包括:存储器和处理器;
[0032]所述存储器,用于存储程序;
[0033]所述处理器,用于执行所述程序,实现如上所述的电子表格数据的处理方法的各个步骤。
[0034]根据本专利技术具体实施方式提供的一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现如上所述的电子表格数据的处理方法的各个步骤。
[0035]本专利技术所提供的电子表格数据的处理方法,可以对用户导入的电子表格进行特征提取,得到表征电子表格特征的特征数据。然后在可配置模板库中查找和特征数据匹配的目标可配置模板,其中可配置模板库中存储有多个可配置模板,一个可配置模板中至少包括表征同一数据类型的异构电子表格的特征数据。若在可配置模板库中查找到目标可配置模板,则将电子表格的数据按照所述目标可配置模板的格式进行存储。若在可配置模板库中未查找到目标可配置模板,则在原始模本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种电子表格数据的处理方法,其特征在于,包括:对用户导入的电子表格进行特征提取,得到表征所述电子表格特征的特征数据;在可配置模板库中查找和所述特征数据匹配的目标可配置模板,所述可配置模板库中存储有多个可配置模板,一个所述可配置模板中至少包括表征同一数据类型的异构电子表格的特征数据;若在所述可配置模板库中查找到所述目标可配置模板,则将所述电子表格的数据按照所述目标可配置模板的格式进行存储;若在所述可配置模板库中未查找到所述目标可配置模板,则在原始模板库中查找和所述特征数据匹配的目标原始模板,所述原始模板库中存储有多个异构电子表格的原始模板,一个所述原始模板中至少包括表征一个原始异构电子表格特征的特征数据;若在所述原始模板库中查找到所述目标原始模板,则基于所述目标原始模板和所述可配置模板库中可配置模板的对应关系,将所述电子表格的数据按照和所述目标原始模板相对应的可配置模板格式进行存储。2.根据权利要求1所述的方法,其特征在于,所述对用户导入的电子表格进行特征提取,得到表征所述电子表格特征的特征数据,包括:提取电子表格中的表格级特征和字段级特征,构成特征记录表,所述表格级特征至少包括电子表格中数据列的个数和列头间的排列顺序;所述字段级特征至少包括:列头名称和数据列的数据特征。3.根据权利要求2所述的方法,其特征在于,还包括:若未在所述原始模板库中查找到所述目标原始模板,则在所述可配置模板库中查找包含所述电子表格的字段级特征的可配置模板,将所述电子表格作为新的原始模板,并将所述新的原始模板和查找到的可配置模板进行对应。4.根据权利要求2所述的方法,其特征在于,所述若在所述原始模板库中查找到所述目标原始模板,则基于所述目标原始模板和所述可配置模板库中可配置模板的对应关系,将所述电子表格的数据存储至和所述目标原始模板相对应的可配置模板中,包括:基于匹配规则对所述原始模板库中的原始模板和所述可配置模板库中可配置模板的进行匹配,得到所述原始模板和所述可配置模板之间的对应关系,所述匹配规则包括:第一匹配规则、第二匹配规则和第三匹配规则,其中,所述第一匹配规则为所述原始模板中的表格级特征和所述可配置模板中的表格级特征相同;所述第二匹配规则为:所述原始模板中的数据列的数据特征和所述可配置模板中的数据列的数据特征相同;所述第三匹配规则为:所述原始模板中的...

【专利技术属性】
技术研发人员:杨超王永飞邢鹏张衡
申请(专利权)人:农银金融科技有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1