基于全过程供应行为的数据可信度评估方法、介质及系统技术方案

技术编号:38387525 阅读:12 留言:0更新日期:2023-08-05 17:42
本发明专利技术涉及数据安全访问技术领域,尤其涉及一种基于全过程供应行为的数据可信度评估方法、计算机可读存储介质及系统。通过数据可信度评估系统调用数据关联的业务需求数量、数据样本级别和数据模型级别、数据使用和/或评价信息等数据信息,分别计算数据业务可信度、数据来源可信度和数据应用可信度,再以计算得到的三者各自的可信度数值和对应的分值权重的乘积相加,得到该数据总体可信度。该基于全过程供应行为的数据可信度评估方法整合数据需求、数据来源和数据应用,对数据产生、使用的全过程供应行为进行数据可信度评价,形成一套完整可信的评分方法,减轻用户在数据使用时的可信度顾虑,提升用户的数据使用满意度。提升用户的数据使用满意度。提升用户的数据使用满意度。

【技术实现步骤摘要】
基于全过程供应行为的数据可信度评估方法、介质及系统


[0001]本专利技术涉及数据安全
,尤其涉及一种基于全过程供应行为的数据可信度评估方法、计算机可读存储介质及系统。

技术介绍

[0002]提升数据的可信度,有利于促进企事业单位内部跨业务、部门直接的数据交流,实现跨行业的数据合作交换,完成数据的有效利用和数据价值的发掘,使各相关方合作能够互利互助,为企业增效、增值。构建一套可信的数据评分方法,能够消除用户对数据开发、使用等供应行为的顾虑,提升用户的信任度,打破数据孤岛,实现顺畅的数据合作的目的。
[0003]目前数据可信度评分方法存在着按照某个单一维度进行可信度打分的特点,如:基于数据源字段关联的关于来源数据的可信度评分方法,对参与数据合作的N个数据来源进行数据表字段的分析,找到各方不同数据源的表字段间的逻辑关联关系,对该关系设置评分指标的方式和方法,根据关联度的一些算法进行打分,最终按照打分的分值或等级进行可信度的认定;基于数据采集的数据可信度评价方法,对数据采集流程进行记录和跟踪,校验数据的一致性、及时性,检查数据血缘的准确程度,设置采集环节的各项评价参数,对数据采集行为的可信度进行评分,衡量数据在采集链路上的可信程度。
[0004]单一环节的可信度评分体系,能够为用户提供某个方面的可信参照,但缺乏对数据全过程供应行为的把握,不利于产生整体的数据印象,难以形成可信的体系,当前片面的、偏向技术测控的数据可信度评分方法未能满足数据应用的需求。

技术实现思路

[0005]专利技术人想到,现有技术基于数据源字段关联或者数据采集等维度的数据可信度评分方法存在着很大的片面性,只着重于数据行为的某个环节、某一方面的评价,忽略了重要的用户行为和关键业务需求,很难使用户、企业对数据的服务建立强的信任感。专利技术人认为数据的应用在有相应业务、技术的支持的前提下,还需要结合全流程的供应行为进行分析,以达到提升数据使用价值,增强数据合作与增值的目的。
[0006]为此,本专利技术所要解决的技术问题是提供一种基于全过程供应行为的数据可信度评估方法以及存储有被执行时实现该方法的计算机程序的计算机可读存储介质,该基于全过程供应行为的数据可信度评估方法能够给出整体性强的数据可信度评分方法。
[0007]为了解决上述技术问题,第一方面,本专利技术提供了一种基于全过程供应行为的数据可信度评估方法,数据的所述全过程供应行为包括数据需求、数据来源和数据应用,该数据可信度评估方法包括以下步骤:可信度获取步骤,分别获取数据业务可信度、数据来源可信度和数据应用可信度;所述数据业务可信度根据该数据关联的业务需求计算得到,该数据关联的业务需求越多和/或业务重要程度越高则数据业务可信度越大;
所述数据来源可信度根据数据样本级别和数据模型级别计算得到,数据样本级别和数据模型级别越高则所述数据来源可信度越大;所述数据应用可信度根据数据使用和/或评价信息计算得到,数据使用越频繁和/或数据评价越高,则所述数据应用可信度越大;数据总体可信度评估步骤,分别为数据业务可信度、数据来源可信度和数据应用可信度配置预设的分值权重,三者的分值权重相加总和为1,根据这三者分别计算得到的可信度数值和对应的分值权重的乘积相加,得到该数据总体可信度。
[0008]进一步地,所述数据需求、数据来源和数据应用三个全过程供应行为分别设有多个评价指标,所述可信度获取步骤中,对这三个全过程供应行为分别执行如下调整步骤:获取各个评价指标中相对于其它评价指标的重要程度,根据所述重要程度构建比重矩阵;确定该全过程供应行为的比重矩阵的最大特征值,作为该全过程供应行为的单位特征向量;以所述单位特征向量中各值作为对应评价指标的权重来计算该全过程供应行为的可信度。
[0009]进一步地,所述数据业务可信度的分值=基础分
×
重要程度系数;基础分根据数据关联的业务需求数量确认,若关联的业务需求数量小于预设阈值则配置较小的基础分,若关联的业务需求数量大于等于预设阈值则配置较大的基础分;各个业务需求分别预设有重要程度,重要程度越高则分值系数越大。
[0010]进一步地,所述数据来源可信度的分值=样本分+训练分;所述样本分根据预设的样本基础值和该数据的样本数与系统样本最大数的比值计算得到,所述样本分=样本基础值
×
(样本数/样本最大数)。
[0011]进一步地,所述数据应用可信度包括使用可信度、性能可信度、评价可信度和热度可信度中的多种。
[0012]进一步地,所述数据应用可信度根据数据使用信息计算得到,所述数据使用信息包括使用可信度和性能可信度;所述使用可信度根据数据订阅的数量和订阅的增量率计算得到;使用可信度分值=订阅数量分+增量率分;所述性能可信度根据数据调用的数量和调用的成功率计算得到;性能可信度分值=调用数量分+成功率分。
[0013]进一步地,所述数据应用可信度根据数据评价信息计算得到,所述数据评价信息包括评价可信度和热度可信度;所述评价可信度根据数据评价的数量和好评率计算得到;评价可信度分值=评价数量分+好评率分;所述热度可信度根据数据浏览的数量和浏览的增量率计算得到;热度可信度分值=浏览数量分+增量率分。
[0014]进一步地,各个可信度计算还包括等级计算,所述等级计算包括在0到1之间的多个预设的等级区间。
[0015]第二方面,还提供了一种计算机可读存储介质,其存储有计算机程序,计算机程序被处理器运行时能够实现上述基于全过程供应行为的数据可信度评估方法。
[0016]第三方面,还提供了一种基于全过程供应行为的数据可信度评估系统,包括处理器和处理器分别连接的:数据关联的业务需求库,用于调用数据关联的业务需求数量;数据
来源库,用于调用数据的数据样本级别和数据模型级别;数据应用信息库,用于调用数据使用和/或评价信息;还包括上述计算机可读存储介质,该计算机可读存储介质上的计算机程序可被处理器执行。
[0017]该基于全过程供应行为的数据可信度评估方法整合数据需求、数据来源和数据应用,对数据产生、使用的全过程供应行为的数据可信度评价,通过数据可信度评估系统调用数据关联的业务需求数量、数据样本级别和数据模型级别、数据使用和/或评价信息等数据信息,分别计算数据业务可信度、数据来源可信度和数据应用可信度,再以计算得到的三者各自的可信度数值和对应的分值权重的乘积相加,得到该数据总体可信度。从而实现从需求、生产、浏览、订阅、调用、评价的全过程供应行为中评价数据的可信度,通过业务可信、来源可信、使用可信、性能可信、评价可信、热度可信多种维度,形成一套完整可信的评分方法,减轻用户在数据使用时的可信度顾虑,提升用户的数据使用满意度。
附图说明
[0018]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍。
[0019]图1是该基于全过程供应行为的数据可信度评估方法的步骤流程图。
具体实施方式
[0020]以下结合具体实本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于全过程供应行为的数据可信度评估方法,其特征是,数据的所述全过程供应行为包括数据需求、数据来源和数据应用,该数据可信度评估方法包括以下步骤:可信度获取步骤,分别获取数据业务可信度、数据来源可信度和数据应用可信度;所述数据业务可信度根据该数据关联的业务需求计算得到,该数据关联的业务需求越多和/或业务重要程度越高则数据业务可信度越大;所述数据来源可信度根据数据样本级别和数据模型级别计算得到,数据样本级别和数据模型级别越高则所述数据来源可信度越大;所述数据应用可信度根据数据使用和/或评价信息计算得到,数据使用越频繁和/或数据评价越高,则所述数据应用可信度越大;数据总体可信度评估步骤,分别为数据业务可信度、数据来源可信度和数据应用可信度配置预设的分值权重,三者的分值权重相加总和为1,根据这三者分别计算得到的可信度数值和对应的分值权重的乘积相加,得到该数据总体可信度。2.如权利要求1所述的基于全过程供应行为的数据可信度评估方法,其特征是,所述数据需求、数据来源和数据应用三个全过程供应行为分别设有多个评价指标,所述可信度获取步骤中,对这三个全过程供应行为分别执行如下调整步骤:获取各个评价指标中相对于其它评价指标的重要程度,根据所述重要程度构建比重矩阵;确定该全过程供应行为的比重矩阵的最大特征值,作为该全过程供应行为的单位特征向量;以所述单位特征向量中各值作为对应评价指标的权重来计算该全过程供应行为的可信度。3.如权利要求1所述的基于全过程供应行为的数据可信度评估方法,其特征是,所述数据业务可信度的分值=基础分
×
重要程度系数;基础分根据数据关联的业务需求数量确认,若关联的业务需求数量小于预设阈值则配置较小的基础分,若关联的业务需求数量大于等于预设阈值则配置较大的基础分;各个业务需求分别预设有重要程度,重要程度越高则分值系数越大。4.如权利要求1所述的基于全过程供应行为的数据可信度评估方法,其特征是,所述数据来源可信度的分值=...

【专利技术属性】
技术研发人员:萧展辉甘莹冯志宏柯婷梁置铭
申请(专利权)人:南方电网数字平台科技广东有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1