表格数据校验方法及装置制造方法及图纸

技术编号:37771897 阅读:20 留言:0更新日期:2023-06-06 13:37
本申请公开了一种表格数据校验方法及装置。其中,该方法包括:获取表格扫描图像,并识别表格扫描图像中的表格数据,其中,表格数据中包括多个行数据,每个行数据中包括多个字段和与每个字段对应的值;获取校验配置信息,其中,校验配置信息中至少包括多个待校验列的标识信息;对于每个行数据,对行数据中与校验配置信息对应的多个目标字段的值进行校验,其中,仅在多个目标字段的值均通过校验时,确定行数据通过校验,若存在任一目标字段的值未通过校验,则确定行数据未通过校验。本申请解决了相关技术中在将纸质表格整理为电子表格时,表格数据校验效率较低的技术问题。表格数据校验效率较低的技术问题。表格数据校验效率较低的技术问题。

【技术实现步骤摘要】
表格数据校验方法及装置


[0001]本申请涉及数据校验
,具体而言,涉及一种表格数据校验方法及装置。

技术介绍

[0002]当前为辅助办公自动化,提出将已有的纸质表格进行扫描或拍照,从而形成电子形式的表格图像,然后对表格进行识别以便进行后续处理。因而在图像识别领域中,正确识别图像中的表格及其内容有着重要意义。
[0003]表格数据校验在实际项目中是一项极其繁杂且容易出错的工作,在面对表格数量多或表格内容十分复杂时,会导致表格数据校验效率低下,且精确度不够高,从而使得表格中的异常数据未被及时发现,给个人或公司等造成损失。
[0004]针对上述的问题,目前尚未提出有效的解决方案。

技术实现思路

[0005]本申请实施例提供了一种表格数据校验方法及装置,以至少解决相关技术中在将纸质表格整理为电子表格时,表格数据校验效率较低的技术问题。
[0006]根据本申请实施例的一个方面,提供了一种表格数据校验方法,包括:获取表格扫描图像,并识别表格扫描图像中的表格数据,其中,表格数据中包括多个行数据,每个行数据中包括多个字段和与每个字段对应的值;获取校验配置信息,其中,校验配置信息中至少包括多个待校验列的标识信息;对于每个行数据,对行数据中与校验配置信息对应的多个目标字段的值进行校验,其中,仅在多个目标字段的值均通过校验时,确定行数据通过校验,若存在任一目标字段的值未通过校验,则确定行数据未通过校验。
[0007]可选地,获取表格扫描图像,并识别表格扫描图像中的表格数据,包括:获取图像采集设备采集的待校验表格的表格扫描图像;利用图像文字识别算法识别表格扫描图像中的表格数据。
[0008]可选地,获取校验配置信息,包括:从数据库中获取预设的校验配置信息,其中,校验配置信息中至少包括多个待校验列的标识信息,标识信息至少包括以下之一:待校验列序号、待校验字段名称。
[0009]可选地,在获取校验配置信息之后,方法还包括:确定各个待校验列的权重参数;依据权重参数从大到小对各个待校验列进行排序。
[0010]可选地,对行数据中与校验配置信息对应的多个目标字段的值进行校验,包括:依据各个待校验列的顺序确定多个目标字段的值的校验顺序,并依据校验顺序依次对各个目标字段的值进行校验;其中,对于每个目标字段的值,从数据库中检索目标字段的值以及与目标字段的值关联的其他字段的值;若检索到目标字段的值且检索到的其他字段的值与待校验的其他目标字段的值匹配时,确定目标字段的值通过校验;若未检索到目标字段的值或检索到的其他字段的值与待校验的其他目标字段的值不匹配时,确定目标字段的值未通过校验。
[0011]可选地,若在多个目标字段的值中,仅有一个第一目标字段的值未被检索到,其他第二目标字段的值均被检索到,且对于每个第二目标字段的值,从数据库中检索到的与第二目标字段的值关联的其他字段的值仅与第一目标字段的值不匹配时,基于检索到的与第二目标字段的值关联的其他字段的值修改第一目标字段的值。
[0012]可选地,对行数据中与校验配置信息对应的多个目标字段的值进行校验,包括:响应于人机交互界面中输入的校验开始指令,开始对行数据中与校验配置信息对应的多个目标字段的值进行校验;在校验过程中,在人机交互界面中实时显示正在校验的待校验列的标识信息,并实时显示预计校验剩余时间;在校验完成后,在人机交互界面中显示校验结果及校验时间信息,其中,校验时间信息中至少包括:校验开始时间、校验结束时间、校验所用时长。
[0013]根据本申请实施例的另一方面,还提供了一种表格数据校验装置,包括:识别模块,用于获取表格扫描图像,并识别表格扫描图像中的表格数据,其中,表格数据中包括多个行数据,每个行数据中包括多个字段和与每个字段对应的值;获取模块,用于获取校验配置信息,其中,校验配置信息中至少包括多个待校验列的标识信息;校验模块,用于对于每个行数据,对行数据中与校验配置信息对应的多个目标字段的值进行校验,其中,仅在多个目标字段的值均通过校验时,确定行数据通过校验,若存在任一目标字段的值未通过校验,则确定行数据未通过校验。
[0014]根据本申请实施例的另一方面,还提供了一种非易失性存储介质,该非易失性存储介质包括存储的程序,其中,非易失性存储介质所在设备通过运行该程序执行上述的表格数据校验装置。
[0015]根据本申请实施例的另一方面,还提供了一种电子设备,该电子设备包括:存储器和处理器,其中,存储器中存储有计算机程序,处理器被配置为通过计算机程序执行上述的表格数据校验装置。
[0016]在本申请实施例中,获取表格扫描图像,并识别表格扫描图像中的表格数据,其中,表格数据中包括多个行数据,每个行数据中包括多个字段和与每个字段对应的值;获取校验配置信息,其中,校验配置信息中至少包括多个待校验列的标识信息;对于每个行数据,对行数据中与校验配置信息对应的多个目标字段的值进行校验,其中,仅在多个目标字段的值均通过校验时,确定行数据通过校验,若存在任一目标字段的值未通过校验,则确定行数据未通过校验。其中,通过对表格扫描图像中的字段各每个字段对应的数值进行识别,可以提升后续数据校验的准确性;对每行数据中与校验配置信息对应的多个目标字段的值进行校验,从而提升数据校验的灵活性和校验效率,进而解决了相关技术中在将纸质表格整理为电子表格时,表格数据校验效率较低的技术问题。
附图说明
[0017]此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
[0018]图1是根据本申请实施例的一种可选的表格数据校验方法的流程图;
[0019]图2是根据本申请实施例的一种可选的房屋工作表格的示意图;
[0020]图3是根据本申请实施例的一种可选的校验开始确认界面的示意图;
[0021]图4是根据本申请实施例的一种可选的表格数据校验装置的结构示意图。
具体实施方式
[0022]为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
[0023]需要说明的是,本申请的说明书和权利要求书及附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种表格数据校验方法,其特征在于,包括:获取表格扫描图像,并识别所述表格扫描图像中的表格数据,其中,所述表格数据中包括多个行数据,每个所述行数据中包括多个字段和与每个所述字段对应的值;获取校验配置信息,其中,所述校验配置信息中至少包括多个待校验列的标识信息;对于每个所述行数据,对所述行数据中与所述校验配置信息对应的多个目标字段的值进行校验,其中,仅在所述多个目标字段的值均通过校验时,确定所述行数据通过校验,若存在任一所述目标字段的值未通过校验,则确定所述行数据未通过校验。2.根据权利要求1所述的方法,其特征在于,获取表格扫描图像,并识别所述表格扫描图像中的表格数据,包括:获取图像采集设备采集的待校验表格的所述表格扫描图像;利用图像文字识别算法识别所述表格扫描图像中的所述表格数据。3.根据权利要求1所述的方法,其特征在于,获取校验配置信息,包括:从数据库中获取预设的所述校验配置信息,其中,所述校验配置信息中至少包括多个所述待校验列的所述标识信息,所述标识信息至少包括以下之一:待校验列序号、待校验字段名称。4.根据权利要求1所述的方法,其特征在于,在获取校验配置信息之后,所述方法还包括:确定各个所述待校验列的权重参数;依据所述权重参数从大到小对各个所述待校验列进行排序。5.根据权利要求4所述的方法,其特征在于,对所述行数据中与所述校验配置信息对应的多个目标字段的值进行校验,包括:依据各个所述待校验列的顺序确定多个所述目标字段的值的校验顺序,并依据所述校验顺序依次对各个所述目标字段的值进行校验;其中,对于每个所述目标字段的值,从数据库中检索所述目标字段的值以及与所述目标字段的值关联的其他字段的值;若检索到所述目标字段的值且检索到的所述其他字段的值与待校验的其他所述目标字段的值匹配时,确定所述目标字段的值通过校验;若未检索到所述目标字段的值或检索到的所述其他字段的值与待校验的其他所述目标字段的值不匹配时,确定所述目标字段的值未通过校验。6.根据权利要求5所述的方法,其特征在于...

【专利技术属性】
技术研发人员:王文欣康健朔马宇王建军蔡婷
申请(专利权)人:中国电信股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1