数据检查方法、装置、计算机设备及可读存储介质制造方法及图纸

技术编号:38906406 阅读:9 留言:0更新日期:2023-09-22 14:24
本申请公开了一种数据检查方法、装置、计算机设备及可读存储介质,包括:确定目标数据模型;目标数据模型为需要检查的数据模型或需要检查的目标数据所关联的数据模型;基于预设的不同词汇对应的数据检查规则和/或自定义的不同数据模型中预设字段的数据检查规则,确定目标数据模型中需要检查的字段对应的数据检查规则;根据目标数据模型中需要检查的字段对应的数据检查规则,对需要检查的数据模型或目标数据中的数据进行合规性检查。如此,基于词汇的数据检查规则的设置,使得同一词汇的数据检查规则可在多个数据模型中应用,能够确保不同数据模型中同一字段的数据检查规则的一致性,简化用户对数据模型中字段的数据检查规则设置操作,操作便捷。操作便捷。操作便捷。

【技术实现步骤摘要】
数据检查方法、装置、计算机设备及可读存储介质


[0001]本专利技术涉及数据处理
,特别是涉及一种数据检查方法、装置、计算机设备及计算机可读存储介质。

技术介绍

[0002]随着企业数字化转型的推进,企业中越来越多的业务开始依托信息系统运营,企业的各业务系统中存储的数据成为企业的重要资产之一。如果数据不准确或不完整,将会严重影响企业的经营决策和业务运转,所以对业务系统中数据的合规性进行检查,以消除数据杂、乱、差现象,越来越成为企业管理中不可或缺的环节。
[0003]目前常用的数据检查方式有人工检查、规则检查、问题统计几类。其中,人工检查是通过人工方式,逐一检查数据中的问题;规则检查是通过预设数据检查规则,基于数据检查规则对数据进行检查;问题统计是通过收集、统计数据使用中出现的问题,对相应数据进行整改。
[0004]专利技术人在研究中发现现有基于规则检查的数据检查方式存在以下问题:数据检查规则只能在业务系统代码中写死,若数据检查规则或者业务需求本身发生变化,只能通过修改代码来改变数据检查规则,且一个数据检查规则专门针对一个业务表单(即数据库表)编写代码,表单间无法复用。

技术实现思路

[0005]本申请的目的在于提供一种数据检查方法、装置、计算机设备及计算机可读存储介质,能够确保不同数据模型中同一字段的数据检查规则的一致性,简化用户对数据模型中字段的数据检查规则设置操作,同时操作便捷。
[0006]为达到上述目的:
[0007]第一方面,本申请实施例提供了一种数据检查方法,所述方法包括:
[0008]确定目标数据模型;所述目标数据模型为需要检查的数据模型或需要检查的目标数据所关联的数据模型;
[0009]基于预设的不同词汇对应的数据检查规则和/或自定义的不同数据模型中预设字段的数据检查规则,确定所述目标数据模型中需要检查的字段对应的数据检查规则;
[0010]根据所述目标数据模型中需要检查的字段对应的数据检查规则,对所述需要检查的数据模型或所述目标数据中的数据进行合规性检查。
[0011]在一实施方式中,所述目标数据包括以下至少一种:待批量导入所述目标数据模型的数据集、待保存至所述目标数据模型中的至少一条数据。
[0012]在一实施方式中,所述基于预设的不同词汇对应的数据检查规则和/或自定义的不同数据模型中预设字段的数据检查规则,确定所述目标数据模型中需要检查的字段对应的数据检查规则,包括:
[0013]将所述目标数据模型中所有字段分别与预设的词汇库中所有词汇进行匹配,确定
需要检查的字段的关联词汇;所述需要检查的字段为与所述词汇库中任一词汇匹配的字段;
[0014]将预设的所述关联词汇对应的数据检查规则确定为所述目标数据模型中需要检查的字段对应的数据检查规则。
[0015]在一实施方式中,所述数据检查规则包括以下至少一种:数据格式规则、数据内容规则。
[0016]在一实施方式中,所述根据所述目标数据模型中需要检查的字段对应的数据检查规则,对所述需要检查的数据模型或所述目标数据中的数据进行合规性检查,包括:
[0017]对于所述需要检查的数据模型或所述目标数据中的各条数据,检查在每条数据中各第一字段对应的数据是否都对应符合所述第一字段对应的数据检查规则;所述第一字段为任一个需要检查的字段;
[0018]若是,则判定该条数据合格;
[0019]若否,则判定该条数据不合格。
[0020]在一实施方式中,所述基于预设的不同词汇对应的数据检查规则和/或自定义的不同数据模型中预设字段的数据检查规则,确定所述目标数据模型中需要检查的字段对应的数据检查规则,还包括:
[0021]响应于对所述目标数据模型中的第二字段配置有引用关系,根据所述引用关系从关联数据模型中获取所述第二字段对应的引用字段数据集;
[0022]设置所述第二字段对应的引用字段数据集为所述第二字段的引用关系规则,并将所述引用关系规则确定为所述目标数据模型中需要检查的字段对应的数据检查规则。
[0023]在一实施方式中,所述根据所述目标数据模型中需要检查的字段对应的数据检查规则,对所述需要检查的数据模型或所述目标数据中的数据进行合规性检查,包括:
[0024]对于所述需要检查的数据模型或所述目标数据中的各条数据,检测在每条数据中各所述第二字段对应的数据是否对应在所述第二字段对应的引用字段数据集中;
[0025]若是,则判定该条数据合格;
[0026]若否,则判定该条数据不合格。
[0027]在一实施方式中,还包括:
[0028]生成并输出数据检查报告;所述数据检查报告包括针对所述需要检查的数据模型或所述目标数据的检查结果,所述检查结果包括:总数据条数、合格数据条数、不合格数据条数、合格率、检查时间、不合格数据信息;所述合格率为合格数据条数相对于总数据条数的占比;所述不合格数据信息包括:不合格数据条标识、违规的字段、违规的字段对应的数据、违反的数据检查规则。
[0029]在一实施方式中,若需要检查的数据模型有多个,则所述数据检查报告还包括数据模型总量、合格数据模型数量、不合格数据模型数量、合格数据模型比例;合格数据模型比例为合格数据模型数量相对于数据模型总量的占比。
[0030]在一实施方式中,还包括:
[0031]响应于所述目标数据包括所述数据集,根据所述检查结果确定所述目标数据包含不合格数据时,中止对所述数据集的批量导入操作。
[0032]第二方面,本申请实施例提供了一种数据检查装置,包括:
[0033]确定模块,用于确定目标数据模型;所述目标数据模型为需要检查的数据模型或需要检查的目标数据所关联的数据模型;
[0034]处理模块,用于基于预设的不同词汇对应的数据检查规则和/或自定义的不同数据模型中预设字段的数据检查规则,确定所述目标数据模型中需要检查的字段对应的数据检查规则;
[0035]检查模块,用于根据所述目标数据模型中需要检查的字段对应的数据检查规则,对所述需要检查的数据模型或所述目标数据中的数据进行合规性检查。
[0036]在一实施方式中,所述目标数据包括以下至少一种:待批量导入所述目标数据模型的数据集、待保存至所述目标数据模型中的至少一条数据。
[0037]在一实施方式中,所述处理模块,具体用于:
[0038]将所述目标数据模型中所有字段分别与预设的词汇库中所有词汇进行匹配,确定需要检查的字段的关联词汇;所述需要检查的字段为与所述词汇库中任一词汇匹配的字段;
[0039]将预设的所述关联词汇对应的数据检查规则确定为所述目标数据模型中需要检查的字段对应的数据检查规则。
[0040]在一实施方式中,所述数据检查规则包括以下至少一种:数据格式规则、数据内容规则。
[0041]在一实施方式中,所述检查模块,具体用于:
[0042]对于所述需要检查的数据模型或所述目标数本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据检查方法,其特征在于,包括:确定目标数据模型;所述目标数据模型为需要检查的数据模型或需要检查的目标数据所关联的数据模型;基于预设的不同词汇对应的数据检查规则和/或自定义的不同数据模型中预设字段的数据检查规则,确定所述目标数据模型中需要检查的字段对应的数据检查规则;根据所述目标数据模型中需要检查的字段对应的数据检查规则,对所述需要检查的数据模型或所述目标数据中的数据进行合规性检查。2.根据权利要求1所述的方法,其特征在于,所述目标数据包括以下至少一种:待批量导入所述目标数据模型的数据集、待保存至所述目标数据模型中的至少一条数据。3.根据权利要求1所述的方法,其特征在于,所述基于预设的不同词汇对应的数据检查规则和/或自定义的不同数据模型中预设字段的数据检查规则,确定所述目标数据模型中需要检查的字段对应的数据检查规则,包括:将所述目标数据模型中所有字段分别与预设的词汇库中所有词汇进行匹配,确定需要检查的字段的关联词汇;所述需要检查的字段为与所述词汇库中任一词汇匹配的字段;将预设的所述关联词汇对应的数据检查规则确定为所述目标数据模型中需要检查的字段对应的数据检查规则。4.根据权利要求1所述的方法,其特征在于,所述数据检查规则包括以下至少一种:数据格式规则、数据内容规则。5.根据权利要求1所述的方法,其特征在于,所述根据所述目标数据模型中需要检查的字段对应的数据检查规则,对所述需要检查的数据模型或所述目标数据中的数据进行合规性检查,包括:对于所述需要检查的数据模型或所述目标数据中的各条数据,检查在每条数据中各第一字段对应的数据是否都对应符合所述第一字段对应的数据检查规则;所述第一字段为任一个需要检查的字段;若是,则判定该条数据合格;若否,则判定该条数据不合格。6.根据权利要求3所述的方法,其特征在于,所述基于预设的不同词汇对应的数据检查规则和/或自定义的不同数据模型中预设字段的数据检查规则,确定所述目标数据模型中需要检查的字段对应的数据检查规则,还包括:响应于对所述目标数据模型中的第二字段配置有引用关系,根据所述引用关系从关联数据模型中获取所述第二字段对应的引用字段数据集;设置所述第二字段对应的引用字段数据集为所述第二字段的引用关系规则,并将所述引用关系规则确定为所述目标数据模型中需要检查的字段对应的数据...

【专利技术属性】
技术研发人员:陈钰龙王晴王媛方健力易超
申请(专利权)人:中科云谷科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1