一种数据的价值评估方法、装置及设备制造方法及图纸

技术编号:36377609 阅读:10 留言:0更新日期:2023-01-18 09:38
本申请公开了一种数据的价值评估方法、装置及设备,可应用于用于人工智能领域以及大数据领域,根据数据的在业务系统中的应用次数和权重进行乘积累加计算,确定计算结果为第一加成值;获取数据在各个数据引用方式中的出现次数,根据各数据引用方式对应的出现次数和权重进行乘积累加计算,确定计算结果为第二加成值;计算第一加成值和第二加成值的和,确定为综合得分;根据所述综合得分和阈值确定数据的质量类别。如此,通过数据湖和数据仓数据分类分级的方式实现数据的识别,通过数据泵将价值不匹配数据进行虚拟存储模块存储和原数据链接,实现数据的统一管理和高效应用。实现数据的统一管理和高效应用。实现数据的统一管理和高效应用。

【技术实现步骤摘要】
一种数据的价值评估方法、装置及设备


[0001]本申请涉及计算机
,尤其涉及一种数据的价值评估方法、装置及设备。

技术介绍

[0002]随着互联网应用的进步大趋势,移动APP的不断成熟和发展,银行业务办理方式也出现了改变,逐渐由网点办理下放到移动APP等客户侧应用办理。在业务办理的过程中通常会产生大量数据,因此越来越多的数据被存储至数据湖和数据仓中。
[0003]但是两者之间具有较强的隔离性和数据冗余,增加了企业的管理难度。

技术实现思路

[0004]有鉴于此,本申请实施例提供了一种数据的价值评估方法、装置及设备,旨在对不同价值优先级的数据通过数据泵进行虚拟存储,减少相同数据的副本,实现数据的统一管理和高效应用。
[0005]第一方面,本申请实施例提供了一种数据的价值评估方法,包括:
[0006]根据数据的在业务系统中的应用次数和权重进行乘积累加计算,确定计算结果为第一加成值;
[0007]获取数据在各个数据引用方式中的出现次数,所述出现次数指数据在满足引用方式的特征要求的基础上,在该引用方式中出现的次数;
[0008]根据各数据引用方式对应的出现次数和权重进行乘积累加计算,
[0009]确定计算结果为第二加成值;
[0010]计算第一加成值和第二加成值的和,确定为综合得分;
[0011]根据所述综合得分和阈值确定数据的质量类别,所述质量类别包括高质量数据和低质量数据。
[0012]可选的,所述数据包括数据湖数据和数据仓数据,所述综合得分包括数据湖数据得分和数据仓数据得分,所述根据所述综合得分和阈值确定数据的质量类别包括:
[0013]响应于所述数据湖数据得分大于第一阈值,确定该数据湖数据为高质量数据,所述高质量数据适用于数据仓直接使用;
[0014]响应于数据仓数据小于第二阈值,确定该数据仓数据为低质量数据,所述低质量数据适用于数据湖直接使用。
[0015]可选的,所述根据所述综合得分和阈值确定数据的质量类别之后,还包括:
[0016]对数据进行虚拟存储生成模拟数据;
[0017]将所述模拟数据伪装成真实数据存储至数据湖或数据仓中。
[0018]可选的,所述根据所述综合得分和阈值确定数据的质量类别之后,还包括:
[0019]响应于获取到评估指令,对数据湖和数据仓中的数据价值进行评估;
[0020]响应于评估结果指示数据湖数据和数据仓数据中包含价值不匹配的数据,获取价值异常数据;
[0021]对虚拟存储空间中价值异常最小的数据进行替换,将所述价值异常数据加入到虚拟存储空间中。
[0022]可选的,所述对数据进行虚拟存储生成模拟数据之前,还包括:
[0023]对数据进行分类,将所述数据分为结构化数据和非结构化数据。
[0024]第二方面,本申请实施例提供了一种数据的价值评估方法装置,所述装置包括:
[0025]第一加成值确定模块,用于根据数据的在业务系统中的应用次数和权重进行乘积累加计算,确定计算结果为第一加成值;
[0026]次数获取模块,用于获取数据在各个数据引用方式中的出现次数,所述出现次数指数据在满足引用方式的特征要求的基础上,在该引用方式中出现的次数;
[0027]第二加成值确定模块,用于根据各数据引用方式对应的出现次数和权重进行乘积累加计算,确定计算结果为第二加成值;
[0028]综合得分确定模块,用于计算第一加成值和第二加成值的和,确定为综合得分;
[0029]质量类别确定模块,用于根据所述综合得分和阈值确定数据的质量类别,所述质量类别包括高质量数据和低质量数据。
[0030]可选的,所述装置还包括:
[0031]模拟数据生成模块,用于对数据进行虚拟存储生成模拟数据;
[0032]存储实施模块,用于将所述模拟数据伪装成真实数据存储至数据湖或数据仓中。
[0033]可选的,所述装置还包括:
[0034]数据价值评估模块,用于响应于获取到评估指令,对数据湖和数据仓中的数据价值进行评估;
[0035]价值异常数据获取模块,用于响应于评估结果指示数据湖数据和数据仓数据中包含价值不匹配的数据,获取价值异常数据;
[0036]替换实施模块,用于对虚拟存储空间中价值异常最小的数据进行替换,将所述价值异常数据加入到虚拟存储空间中。
[0037]可选的,所述装置还包括:
[0038]数据分类模块,用于对数据进行分类,将所述数据分为结构化数据和非结构化数据。
[0039]可选的,所述评分确定模块具体用于,响应于所述数据湖数据得分大于第一阈值,确定该数据湖数据为高质量数据,所述高质量数据适用于数据仓直接使用;响应于数据仓数据小于第二阈值,确定该数据仓数据为低质量数据,所述低质量数据适用于数据湖直接使用。
[0040]本申请第三方面提供一种计算机设备,包括:处理器、存储器、系统总线;
[0041]所述处理器以及所述存储器通过所述系统总线相连;
[0042]所述存储器用于存储一个或多个程序,所述一个或多个程序包括指令,所述指令当被所述处理器执行时使所述处理器执行权利要求1

5任一项所述的数据的价值评估方法。
[0043]本申请实施例提供了一种数据的价值评估方法、装置及设备,根据数据的在业务系统中的应用次数和权重进行乘积累加计算,确定计算结果为第一加成值;获取数据在各个数据引用方式中的出现次数,根据各数据引用方式对应的出现次数和权重进行乘积累加
计算,确定计算结果为第二加成值;计算第一加成值和第二加成值的和,确定为综合得分;根据所述综合得分和阈值确定数据的质量类别。如此,对数据湖和数据仓数据进行数据分类,根据应用价值评分进行分类分级,在数据得到分级的基础上,价值异常数据进行虚拟存储和关联,通过数据泵实现数据在数据湖和数据仓之间的流通,达到数据统一管理的目标。实现数据的高效便利管理。
附图说明
[0044]为更清楚地说明本实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0045]图1为本申请实施例提供的数据的价值评估方法的一种方法流程图;
[0046]图2为本申请实施例提供的数据的价值评估方法的一种方法流程图;
[0047]图3为本申请实施例提供的数据的价值评估方法装置的一种结构示意图。
具体实施方式
[0048]为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据的价值评估方法,其特征在于,包括:根据数据的在业务系统中的应用次数和权重进行乘积累加计算,确定计算结果为第一加成值;获取数据在各个数据引用方式中的出现次数,所述出现次数指数据在满足引用方式的特征要求的基础上,在该引用方式中出现的次数;根据各数据引用方式对应的出现次数和权重进行乘积累加计算,确定计算结果为第二加成值;计算第一加成值和第二加成值的和,确定为综合得分;根据所述综合得分和阈值确定数据的质量类别,所述质量类别包括高质量数据和低质量数据。2.根据权利要求1所述的方法,其特征在于,所述数据包括数据湖数据和数据仓数据,所述综合得分包括数据湖数据得分和数据仓数据得分,所述根据所述综合得分和阈值确定数据的质量类别包括:响应于所述数据湖数据得分大于第一阈值,确定该数据湖数据为高质量数据,所述高质量数据适用于数据仓直接使用;响应于数据仓数据小于第二阈值,确定该数据仓数据为低质量数据,所述低质量数据适用于数据湖直接使用。3.根据权利要求1所述的方法,其特征在于,所述根据所述综合得分和阈值确定数据的质量类别之后,还包括:对数据进行虚拟存储生成模拟数据;将所述模拟数据伪装成真实数据存储至数据湖或数据仓中。4.根据权利要求3所述的方法,其特征在于,所述根据所述综合得分和阈值确定数据的质量类别之后,还包括:响应于获取到评估指令,对数据湖和数据仓中的数据价值进行评估;响应于评估结果指示数据湖数据和数据仓数据中包含价值不匹配的数据,获取价值异常数据;对虚拟存储空间中价值异常最小的数据进行替换,将所述价值异常数据加入到虚拟存储空间中。5.根据权利要求3所述的方法,其特征在于,所述对数据进行虚拟存储生成模拟数据之前,还包括:对数据进行分类,将所述数据分为结构化数据和非结构化数据。6.一种数据的价值...

【专利技术属性】
技术研发人员:盛康
申请(专利权)人:中国银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1