System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 数据质量检测方法、装置、设备及介质制造方法及图纸_技高网

数据质量检测方法、装置、设备及介质制造方法及图纸

技术编号:40289829 阅读:5 留言:0更新日期:2024-02-07 20:41
本公开提供了一种数据质量检测方法、装置、设备及介质,涉及计算机应用技术领域。该方法包括:获取用户输入的元数据;在规则数据库中查询第一规则实例,其中,规则数据库中存储有已创建的规则实例,第一规则实例的名称属性与元数据的名称属性之间的相似度大于预设阈值;在查询到第一规则实例的情况下,复制第一规则实例得到目标规则实例,应用目标规则实例对元数据的名称属性关联的实例数据进行质量检测;在未查询到第一规则实例的情况下,获取用户创建的第二规则实例,并将第二规则实例存储至规则实例数据库;运行第二规则实例对元数据的名称属性关联的实例数据进行质量检测。根据本公开实施例,能够自动匹配规则实例进行检测,减少人工操作,提升检测效率。

【技术实现步骤摘要】

本公开涉及计算机应用,尤其涉及一种数据质量检测方法、装置、设备及介质


技术介绍

1、随着大数据时代的到来,数据的重要性不言而喻,高质量的数据为准确、可靠的决策提供了基础,如果数据质量低劣,决策可能会出现错误或误导,导致不良后果。面对井喷式增长的数据量级,实现对数据质量的自动化检测迫在眉睫。

2、当前也提出了一些数据质量检测方案,但存在明显的局限性,主要体现在实现方式为基于sql(structured query language,结构化查询语言数据库)的处理方式,每个sql的配置只能满足一个业务规则的校验,部分实现方式中提出了sql模板的概念,但复用程度很低,人工参与度依旧很高,且场景覆盖程度较差,伴随着业务规则的增加和变更,检测规则的维护成本会很大,导致整个质量检测活动效率低下。

3、需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。


技术实现思路

1、本公开提供一种数据质量检测方法、装置、设备及介质,至少在一定程度上改善因数据检测规则实例复用程度很低,人工参与度依旧很高所导致的质量检测活动效率低下,检测规则的维护成本较大的问题。

2、本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。

3、根据本公开的一个方面,提供了一种数据质量检测方法,包括:

4、获取用户输入的元数据;

5、在规则数据库中查询第一规则实例,其中,规则数据库中存储有已创建的规则实例,第一规则实例的名称属性与元数据的名称属性之间的相似度大于预设阈值;

6、在查询到第一规则实例的情况下,复制第一规则实例得到目标规则实例,应用目标规则实例对元数据的名称属性关联的实例数据进行质量检测;

7、在未查询到第一规则实例的情况下,获取用户创建的第二规则实例,并将第二规则实例存储至规则数据库;

8、运行第二规则实例对元数据的名称属性关联的实例数据进行质量检测。

9、在本公开的一个实施例中,在未查询到第一规则实例的情况下,获取用户创建的第二规则实例,包括:

10、判断元数据对应的元模型是否有绑定的规则模板;

11、在有绑定的规则模板的情况下,获取用户针对绑定的规则模板输入的模板参数;

12、根据绑定的规则模板,以及用户针对绑定的规则模板输入的模板参数,得到第三规则实例;

13、在没有绑定的规则模板的情况下,获取用户创建的第二规则实例。

14、在本公开的一个实施例中,在没有绑定的规则模板的情况下,获取用户创建的第二规则实例,包括:

15、在没有绑定的规则模板的情况下,判断是否有可用模板;

16、在有可用模板的情况下,获取用户针对可用模板输入的模板参数;

17、根据可用模板,以及用户针对可用模板输入的模板参数,得到第四规则实例;

18、在没有可用模板的情况下,获取用户创建的第二规则实例。

19、在本公开的一个实施例中,规则数据库中的规则实例,包括表级别规则实例和字段级规则实例。

20、在本公开的一个实施例中,在规则数据库中查询第一规则实例,包括:

21、分别计算第一规则实例的名称属性与元数据中的名称属性之间的相似度;其中,名称属性为表名称或字段名称;

22、将相似度大于预设阈值的规则实例,作为第一规则实例。

23、在本公开的一个实施例中,获取用户输入的元数据之前,方法还包括:

24、新建规则模板,并为所述规则模板配置规则算法;

25、将规则模板,存储至规则数据库。

26、在本公开的一个实施例中,新建规则模板后,方法还包括:

27、将规则模板与元模型进行绑定。

28、根据本公开的另一个方面,提供一种数据质量检测装置,包括:

29、数据获取模块,用于获取用户输入的元数据;

30、实例查询模块,用于在规则数据库中查询第一规则实例,其中,规则数据库中存储有已创建的规则实例,第一规则实例的名称属性与元数据的名称属性之间的相似度大于预设阈值;

31、第一检测模块,用于在查询到第一规则实例的情况下,复制第一规则实例得到目标规则实例,应用目标规则实例对元数据的名称属性关联的实例数据进行质量检测;

32、实例创建模块,用于在未查询到第一规则实例的情况下,获取用户创建的第二规则实例,并将第二规则实例存储至规则数据库;

33、第二检测模块,用于运行第二规则实例对元数据的名称属性关联的实例数据进行质量检测。

34、根据本公开的又一个方面,提供一种电子设备,包括:存储器,用于存储指令;处理器,用于调用所述存储器中存储的指令,实现上述的数据质量检测方法。

35、根据本公开的又一个方面,提供一种计算机可读存储介质,其上存储有计算机指令,所述计算机指令被处理器执行时实现上述的数据质量检测方法。

36、根据本公开的又一个方面,提供一种计算机程序产品,计算机程序产品存储有指令,所述指令在由计算机执行时,使得计算机实施上述的数据质量检测方法。

37、根据本公开的又一个方面,提供一种芯片,包括至少一个处理器和接口;

38、接口,用于为至少一个处理器提供程序指令或者数据;

39、至少一个处理器用于执行程序指令,以实现上述的数据质量检测方法。

40、本公开实施例所提供的数据质量检测方法、装置、设备及介质,在用户输入元数据后,能够自动在规则数据库中查询第一规则实例,复制第一规则实例得到目标规则实例,应用目标规则实例对元数据的名称属性关联的实例数据进行质量检测,减少人工操作,自动匹配规则实例进行检测,提升检测效率。在未查询到第一规则实例的情况下,用户创建第二规则实例,并将第二规则实例存储至规则数据库,运行第二规则实例对元数据的名称属性关联的实例数据进行质量检测,其中,存储第二规则实例能够丰富规则数据库中的规则实例,便于后期进行自动匹配,从而提升规则维护效率。

41、应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。

本文档来自技高网...

【技术保护点】

1.一种数据质量检测方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,在未查询到第一规则实例的情况下,获取用户创建的第二规则实例,包括:

3.根据权利要求2所述的方法,其特征在于,在没有绑定的规则模板的情况下,获取用户创建的第二规则实例,包括:

4.根据权利要求1所述的方法,其特征在于,所述规则数据库中的规则实例,包括表级别规则实例和字段级规则实例。

5.根据权利要求4所述的方法,其特征在于,在规则数据库中查询第一规则实例,包括:

6.根据权利要求1所述的方法,其特征在于,获取用户输入的元数据之前,所述方法还包括:

7.根据权利要求6所述的方法,其特征在于,新建规则模板后,所述方法还包括:

8.一种数据质量检测装置,其特征在于,包括:

9.一种电子设备,其特征在于,包括:

10.一种计算机可读存储介质,其上存储有计算机指令,其特征在于,所述计算机指令被处理器执行时实现权利要求1-7中任意一项所述的数据质量检测方法。

【技术特征摘要】

1.一种数据质量检测方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,在未查询到第一规则实例的情况下,获取用户创建的第二规则实例,包括:

3.根据权利要求2所述的方法,其特征在于,在没有绑定的规则模板的情况下,获取用户创建的第二规则实例,包括:

4.根据权利要求1所述的方法,其特征在于,所述规则数据库中的规则实例,包括表级别规则实例和字段级规则实例。

5.根据权利要求4所述的方法,其特征在于,在规则数据库中...

【专利技术属性】
技术研发人员:王海鑫付斌郝猛祖翔
申请(专利权)人:中国电信股份有限公司技术创新中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1