System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 数据质量评估方法和装置、电子设备及存储介质制造方法及图纸_技高网

数据质量评估方法和装置、电子设备及存储介质制造方法及图纸

技术编号:40520897 阅读:7 留言:0更新日期:2024-03-01 13:39
本申请提供了一种数据质量评估方法和装置、电子设备及存储介质,属于金融科技技术领域,通过若目标评价指标为第一类别评价指标,则通过预设词根知识库与键数据进行词根比对得到目标词根集。通过预设关键词知识库对目标词根集进行词根筛选得到目标关键词。获取目标关键词的基准值数据,并根据基准值数据对目标值数据进行初步评分得到初步评分数据。获取第一评分数据和第二评分数据,第一评分数据、第二评分数据分别是数据生产端、数据消费端根据目标评价指标对保险数据进行评分得到。根据初步评分数据、第一评分数据和第二评分数据进行加权评分,得到目标评分数据。将目标评分数据发送给数据生产端,能够对保险数据进行准确的质量评估。

【技术实现步骤摘要】

本申请涉及金融科技,尤其涉及一种数据质量评估方法和装置、电子设备及存储介质


技术介绍

1、在保险领域,保险公司会基于保险数据进行数据分析、风险评估等数据处理任务。通过对保险数据进行数据分析,保险公司可以了解客户需求和市场情况,从而调整保险业务策略。高质量的保险业务数据能够保证数据分析、风险评估等数据处理任务的有效性和准确性,是数据处理的基础。因此,需要对保险数据进行数据质量评估,以确定保险数据的质量。如何进行数据质量评估,成为了亟待解决的问题。


技术实现思路

1、本申请实施例的主要目的在于提出一种数据质量评估方法和装置、电子设备及存储介质,旨在对保险数据进行数据质量评估。

2、为实现上述目的,本申请实施例的第一方面提出了一种数据质量评估方法,所述方法应用于数据质量管理端,所述方法包括:

3、从数据生产端获取保险数据;所述保险数据包括键数据和所述键数据的目标值数据;所述键数据为所述保险数据的保险指标项;所述目标值数据为所述保险指标项的指标值;

4、获取预设评价指标的至少一个指标,得到目标评价指标;所述预设评价指标包括第一类别评价指标;

5、若所述目标评价指标为所述第一类别评价指标,则通过预设词根知识库与所述键数据进行词根比对,得到目标词根集;

6、通过预设关键词知识库对所述目标词根集进行词根筛选,得到目标关键词;

7、获取所述目标关键词的基准值数据,并根据所述基准值数据对所述目标值数据进行初步评分,得到初步评分数据;

8、获取第一评分数据和第二评分数据;其中,所述第一评分数据是所述数据生产端根据所述目标评价指标对所述保险数据进行评分得到,所述第二评分数据是数据消费端根据所述目标评价指标对所述保险数据进行评分得到;

9、根据所述初步评分数据、所述第一评分数据和所述第二评分数据进行加权评分,得到目标评分数据;

10、将所述目标评分数据发送给所述数据生产端。

11、在一些实施例,所述获取所述目标关键词的基准值数据,根据所述基准值数据对所述目标值数据进行初步评分,得到初步评分数据,包括:

12、根据所述目标关键词对预设值域知识库进行值域知识查询,得到所述基准值数据;

13、计算所述基准值数据与所述目标值数据的相似度数据;

14、根据所述相似度数据对所述目标值数据进行有效性初步评分,得到所述初步评分数据。

15、在一些实施例,所述基准值数据包括数据安全等级,所述获取所述目标关键词的基准值数据,根据所述基准值数据对所述目标值数据进行初步评分,得到初步评分数据,包括:

16、获取所述目标词根集的第一安全等级和所述目标关键词的第二安全等级;

17、根据所述第一安全等级和所述第二安全等级进行安全等级选取,得到所述目标关键词的数据安全等级;

18、根据预设数据血缘关系对所述目标值数据进行数据流向分析,得到所述目标值数据的数据流向;

19、根据所述数据流向确定所述目标值数据的数据安全类型;

20、根据所述数据安全等级和所述数据安全类型对所述目标值数据进行安全性初步评分,得到所述初步评分数据。

21、在一些实施例,所述基准值数据包括数据定义、数据格式和数据映射关系,所述获取所述目标关键词的基准值数据,根据所述基准值数据对所述目标值数据进行初步评分,得到初步评分数据,包括:

22、获取所述目标关键词的数据定义、数据格式和数据映射关系;

23、根据所述数据定义对所述目标值数据进行定义一致性评分,得到定义一致性评分;

24、根据所述数据格式对所述目标值数据进行格式一致性评分,得到格式一致性评分;

25、根据所述数据映射关系对所述目标值数据进行映射一致性评分,得到映射关系一致性评分;

26、根据所述定义一致性评分、所述格式一致性评分和所述映射关系一致性评分对所述目标值数据进行一致性初步评分,得到所述初步评分数据。

27、在一些实施例,所述预设评价指标还包括第二类别评价指标,在所述获取预设评价指标的至少一个指标,得到目标评价指标之后,所述数据质量评估方法还包括:

28、若所述目标评价指标为所述第二类别评价指标,对所述目标值数据进行值字段缺失分析,得到值字段缺失数据;根据所述值字段缺失数据对所述目标值数据进行准确性初步评分,得到所述初步评分数据;

29、或者,

30、若所述目标评价指标为所述第二类别评价指标,对所述目标值数据进行注释字段缺失分析,得到注释字段缺失数据;根据所述注释字段缺失数据对所述目标值数据进行完整性初步评分,得到所述初步评分数据。

31、在一些实施例,所述预设评价指标还包括第二类别评价指标,在所述获取预设评价指标的至少一个指标,得到目标评价指标之后,所述数据质量评估方法还包括:

32、若所述目标评价指标为所述第二类别评价指标,获取所述目标值数据的数据更新时间;

33、根据所述数据更新时间和预设时间阈值对所述目标值数据进行及时性初步评分,得到所述初步评分数据。

34、在一些实施例,所述预设评价指标还包括第二类别评价指标,在所述获取预设评价指标的至少一个指标,得到目标评价指标之后,所述数据质量评估方法还包括:

35、若所述目标评价指标为所述第二类别评价指标,对所述目标值数据进行数据划分,得到第一目标值数据和第二目标值数据;

36、对所述第一目标值数据进行可解释性评分,得到第一解释性评分;

37、对所述第二目标值数据进行可解释性评分,得到第二解释性评分;

38、对所述第一解释性评分和所述第二解释性评分进行加权评分,得到所述初步评分数据。

39、为实现上述目的,本申请实施例的第二方面提出了一种数据质量评估装置,所述装置应用于数据质量管理端,所述装置包括:

40、保险数据获取模块,用于从数据生产端获取保险数据;所述保险数据包括键数据和所述键数据的目标值数据;所述键数据为所述保险数据的保险指标项;所述目标值数据为所述保险指标项的指标值;

41、指标获取模块,用于获取预设评价指标的至少一个指标,得到目标评价指标;所述预设评价指标包括第一类别评价指标;

42、词根比对模块,用于若所述目标评价指标为所述第一类别评价指标,则通过预设词根知识库与所述键数据进行词根比对,得到目标词根集;

43、词根筛选模块,用于通过预设关键词知识库对所述目标词根集进行词根筛选,得到目标关键词;

44、初步评分模块,用于获取所述目标关键词的基准值数据,并根据所述基准值数据对所述目标值数据进行初步评分,得到初步评分数据;

45、评分数据获取模块,用于获取第一评分数据和第二评分数据;其中,所述第一评分数据是所述数据生产端根据所述目标评价指标对所述保险数据本文档来自技高网...

【技术保护点】

1.数据质量评估方法,其特征在于,所述方法应用于数据质量管理端,所述方法包括:

2.根据权利要求1所述的数据质量评估方法,其特征在于,所述基准值数据包括数据安全等级,所述获取所述目标关键词的基准值数据,根据所述基准值数据对所述目标值数据进行初步评分,得到初步评分数据,包括:

3.根据权利要求1所述的数据质量评估方法,其特征在于,所述基准值数据包括数据定义、数据格式和数据映射关系,所述获取所述目标关键词的基准值数据,根据所述基准值数据对所述目标值数据进行初步评分,得到初步评分数据,包括:

4.根据权利要求1所述的数据质量评估方法,其特征在于,所述获取所述目标关键词的基准值数据,根据所述基准值数据对所述目标值数据进行初步评分,得到初步评分数据,包括:

5.根据权利要求1所述的数据质量评估方法,其特征在于,所述预设评价指标还包括第二类别评价指标,在所述获取预设评价指标的至少一个指标,得到目标评价指标之后,所述数据质量评估方法还包括:

6.根据权利要求1至5任一项所述的数据质量评估方法,其特征在于,所述预设评价指标还包括第二类别评价指标,在所述获取预设评价指标的至少一个指标,得到目标评价指标之后,所述数据质量评估方法还包括:

7.根据权利要求1至5任一项所述的数据质量评估方法,其特征在于,所述预设评价指标还包括第二类别评价指标,在所述获取预设评价指标的至少一个指标,得到目标评价指标之后,所述数据质量评估方法还包括:

8.数据质量评估装置,其特征在于,所述装置应用于数据质量管理端,所述装置包括:

9.电子设备,其特征在于,所述电子设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现权利要求1至7任一项所述的数据质量评估方法。

10.计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的数据质量评估方法。

...

【技术特征摘要】

1.数据质量评估方法,其特征在于,所述方法应用于数据质量管理端,所述方法包括:

2.根据权利要求1所述的数据质量评估方法,其特征在于,所述基准值数据包括数据安全等级,所述获取所述目标关键词的基准值数据,根据所述基准值数据对所述目标值数据进行初步评分,得到初步评分数据,包括:

3.根据权利要求1所述的数据质量评估方法,其特征在于,所述基准值数据包括数据定义、数据格式和数据映射关系,所述获取所述目标关键词的基准值数据,根据所述基准值数据对所述目标值数据进行初步评分,得到初步评分数据,包括:

4.根据权利要求1所述的数据质量评估方法,其特征在于,所述获取所述目标关键词的基准值数据,根据所述基准值数据对所述目标值数据进行初步评分,得到初步评分数据,包括:

5.根据权利要求1所述的数据质量评估方法,其特征在于,所述预设评价指标还包括第二类别评价指标,在所述获取预设评价指标的至少一个指标,得到目标评价指标之后,所述数据质量...

【专利技术属性】
技术研发人员:张阳
申请(专利权)人:中国平安人寿保险股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1