数据资产的评价指标的确定方法及装置、设备及存储介质制造方法及图纸

技术编号:38227745 阅读:10 留言:0更新日期:2023-07-25 17:57
本发明专利技术实施例公开了一种数据资产的评价指标的确定方法及装置、设备及存储介质,通过上述方法,可以确定目标数据资产的至少三个维度的评价指标,例如目标价值指数、目标成本指数以及目标性价比,可以提高数据资产的评价指标的丰富度,提升数据资产的探查清晰度,为数据资产的管理或整改提供多维的评价指标,并且评价指标通过数据库的运维日志信息中目标数据资产的血缘关系网络信息、资源消耗信息以及活跃度信息分析得到,提高评价指标的真实度以及准确度,为后续降低存储介质的存储压力以及资源占用提供可靠参考,最后,在预设显示终端展示评价指标的可视化数据可以更加清晰直观将评价指标展示给用户查阅,进一步提高数据库的探查效率。的探查效率。的探查效率。

【技术实现步骤摘要】
数据资产的评价指标的确定方法及装置、设备及存储介质


[0001]本专利技术涉及数据处理
,尤其涉及一种数据资产的评价指标的确定方法及装置、设备及存储介质。

技术介绍

[0002]在移动互联网及云计算等技术的推动下,人们可获取并控制的数据日益丰富,我们已经进入了一个创造数据、获取数据、运用数据的数据时代。销售平台可以根据买家的浏览记录做出精准推送以提高销量,制造企业可以通过分析生产流水线数据对生产情况及时做出调整以提高生产效率,家居公司可以通过分析客户的生活习惯数据创造“智慧家庭”以提高生活服务质量,种种应用展示出数据在被有效的挖掘整合后可能产生巨大的价值。
[0003]企业层面数据仓库的数据量逐年增长,使得存储介质的数据存储压力也随之增加,一些没有必要继续存留的数据也会占用存储介质的资源,造成资源浪费,但由于不能清楚探查数据资产的可利用价值,无法对数据仓库进行有效的管理或整改,导致存储介质的存储压力增加和资源占用的问题不能有效解决。

技术实现思路

[0004]本专利技术的主要目的在于提供一种数据资产的评价指标的确定方法及装置、设备及存储介质,可以解决现有技术中的无法对数据仓库进行有效的管理或整改,导致存储介质的存储压力增加和资源占用的问题不能有效解决的问题。
[0005]为实现上述目的,本专利技术第一方面提供一种数据资产的评价指标的确定方法,所述方法包括:获取目标数据库的运维日志信息,所述目标数据库包括若干目标数据资产,所述运维日志信息至少包括各个所述目标数据资产的血缘关系网络信息、资源消耗信息以及活跃度信息,所述血缘关系网络信息用于反映所述目标数据资产的依赖关系;利用所述血缘关系网络信息以及活跃度信息进行价值评价,确定所述目标数据资产的目标价值指数;利用所述资源消耗信息进行成本评价,确定所述目标数据资产的目标成本指数;根据所述目标价值指数以及所述目标成本指数,确定所述目标数据资产的目标性价比;利用所述目标价值指数、目标成本指数以及目标性价比进行可视化处理,生成目标可视化提示数据,并将所述目标可视化提示数据输出至预设显示终端,所述预设显示终端用于接收并展示所述目标可视化提示数据,所述目标可视化提示数据用于反映目标评价指标的可视化数据,所述目标评价指标至少包括所述目标价值指数、目标成本指数以及目标性价比。
[0006]在一种可行实现方式中,所述根据所述目标价值指数以及所述目标成本指数,确定所述目标数据资产的目标性价比,包括:
确定所述目标价值指数以及所述目标成本指数之间的目标比值,所述目标性价比包括所述目标比值。
[0007]在一种可行实现方式中,所述利用所述血缘关系网络信息以及活跃度信息进行价值评价,确定所述目标数据资产的目标价值指数,包括:根据所述血缘关系网络信息进行影响力评价,确定所述目标数据资产的目标影响力指标;根据所述活跃度信息进行活跃度评价,确定所述目标数据资产的目标活跃度指标;根据所述目标影响力指标以及所述目标活跃度指标,确定所述目标数据资产的目标价值指数。
[0008]在一种可行实现方式中,所述活跃度信息至少包括所述目标数据资产的目标访问量数据,所述目标访问量数据至少包括访问类型与访问量的对应关系,所述目标评价指标还包括所述目标数据资产的价值等级,所述价值等级用于反映所述目标数据资产的综合重要程度;则所述方法还包括:确定各个访问类型的访问等级,所述访问等级与所述价值等级呈正比;根据各个目标数据资产的访问类型的访问量、所述访问等级以及预设的Kmeans聚类算法进行价值等级的聚类处理,确定各个所述目标数据资产的目标价值等级。
[0009]在一种可行实现方式中,所述资源消耗信息至少包括各个资源类型的资源消耗数据,所述资源类型至少包括中央处理器资源、读写资源、缓冲空间资源以及磁盘空间资源,所述资源消耗数据至少包括中央处理器资源的耗时数据、读写资源的读写次数、缓冲空间资源的第一占用数据以及磁盘空间资源的第二占用数据;则所述利用所述资源消耗信息进行成本评价,确定所述目标数据资产的目标成本指数,包括:分别对所述耗时数据、所述读写次数、所述第一占用数据以及所述第二占用数据进行归一化处理,确定各个资源类型的目标资源消耗数据;确定预设时间段内的目标资源消耗数据的目标资源占比,所述目标资源占比用于反映所述资源类型在所述预设时间段的资源消耗的程度;根据各个所述资源类型的目标资源占比以及预设的第一权重算法,确定所述资源类型的目标权重;利用所述目标权重、目标资源消耗数据以及预设的第一加权求和算法,确定所述目标数据资产的目标成本指数。
[0010]在一种可行实现方式中,所述根据所述活跃度信息进行活跃度评价,确定所述目标数据资产的目标活跃度指标,包括:利用预设的归一化算法对各个访问类型的访问量进行归一化处理,确定归一化后的各个访问类型的目标访问量;利用预设的熵权法以及各个访问类型的目标访问量进行熵值计算,确定各个访问类型的目标熵值;根据预设的第二权重算法以及各个访问类型的目标熵值,确定各个访问类型的目
标权重;利用预设的第二加权求和算法、所述各个访问类型的目标权重以及目标访问量,确定所述目标数据资产的目标活跃度指标。
[0011]在一种可行实现方式中,所述目标数据资产包括目标数据表,所述血缘关系网络信息至少包括目标数据表的依赖关系,则所述根据所述血缘关系网络信息进行影响力评价,确定所述目标数据资产的目标影响力指标,包括:分别对各个所述目标数据表的依赖关系进行统计,确定各个所述目标数据表的目标被引用次数;根据各个所述目标数据表的目标被引用次数以及预设网页排名算法,确定所述目标数据资产的目标影响力指标。
[0012]为实现上述目的,本专利技术第二方面提供一种数据资产的评价指标的确定装置,所述装置包括:日志获取模块:用于获取目标数据库的运维日志信息,所述目标数据库包括若干目标数据资产,所述运维日志信息至少包括各个所述目标数据资产的血缘关系网络信息、资源消耗信息以及活跃度信息,所述血缘关系网络信息用于反映所述目标数据资产的依赖关系;价值评价模块:用于利用所述血缘关系网络信息以及活跃度信息进行价值评价,确定所述目标数据资产的目标价值指数;成本评价模块:用于利用所述资源消耗信息进行成本评价,确定所述目标数据资产的目标成本指数;性价比确定模块:用于根据所述目标价值指数以及所述目标成本指数,确定所述目标数据资产的目标性价比;结果展示模块:用于利用所述目标价值指数、目标成本指数以及目标性价比进行可视化处理,生成目标可视化提示数据,并将所述目标可视化提示数据输出至预设显示终端,所述预设显示终端用于接收并展示所述目标可视化提示数据,所述目标可视化提示数据用于反映目标评价指标的可视化数据,所述目标评价指标至少包括所述目标价值指数、目标成本指数以及目标性价比。
[0013]为实现上述目的,本专利技术第三方面提供一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如第一方面及任一可行实现方式所示步骤。
[0014]为实现上述目的,本专利技术第四方面提供一种本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据资产的评价指标的确定方法,其特征在于,所述方法包括:获取目标数据库的运维日志信息,所述目标数据库包括若干目标数据资产,所述运维日志信息至少包括各个所述目标数据资产的血缘关系网络信息、资源消耗信息以及活跃度信息,所述血缘关系网络信息用于反映所述目标数据资产的依赖关系;利用所述血缘关系网络信息以及活跃度信息进行价值评价,确定所述目标数据资产的目标价值指数;利用所述资源消耗信息进行成本评价,确定所述目标数据资产的目标成本指数;根据所述目标价值指数以及所述目标成本指数,确定所述目标数据资产的目标性价比;利用所述目标价值指数、目标成本指数以及目标性价比进行可视化处理,生成目标可视化提示数据,并将所述目标可视化提示数据输出至预设显示终端,所述预设显示终端用于接收并展示所述目标可视化提示数据,所述目标可视化提示数据用于反映目标评价指标的可视化数据,所述目标评价指标至少包括所述目标价值指数、目标成本指数以及目标性价比。2.根据权利要求1所述方法,其特征在于,所述根据所述目标价值指数以及所述目标成本指数,确定所述目标数据资产的目标性价比,包括:确定所述目标价值指数以及所述目标成本指数之间的目标比值,所述目标性价比包括所述目标比值。3.根据权利要求1所述方法,其特征在于,所述利用所述血缘关系网络信息以及活跃度信息进行价值评价,确定所述目标数据资产的目标价值指数,包括:根据所述血缘关系网络信息进行影响力评价,确定所述目标数据资产的目标影响力指标;根据所述活跃度信息进行活跃度评价,确定所述目标数据资产的目标活跃度指标;根据所述目标影响力指标以及所述目标活跃度指标,确定所述目标数据资产的目标价值指数。4.根据权利要求1至3中任一项所述方法,其特征在于,所述活跃度信息至少包括所述目标数据资产的目标访问量数据,所述目标访问量数据至少包括访问类型与访问量的对应关系,所述目标评价指标还包括所述目标数据资产的价值等级,所述价值等级用于反映所述目标数据资产的综合重要程度;则所述方法还包括:确定各个访问类型的访问等级,所述访问等级与所述价值等级呈正比;根据各个目标数据资产的访问类型的访问量、所述访问等级以及预设的Kmeans聚类算法进行价值等级的聚类处理,确定各个所述目标数据资产的目标价值等级。5.根据权利要求1所述方法,其特征在于,所述资源消耗信息至少包括各个资源类型的资源消耗数据,所述资源类型至少包括中央处理器资源、读写资源、缓冲空间资源以及磁盘空间资源,所述资源消耗数据至少包括中央处理器资源的耗时数据、读写资源的读写次数、缓冲空间资源的第一占用数据以及磁盘空间资源的第二占用数据;则所述利用所述资源消耗信息进行成本评价,确定所述目标数据资产的目标成本指数,包括:
分别对所述耗时数据、所述读写次数、所述第一占用数据以及所述第二占用数据进行归一化处理,确定各个资源类型的目标资源消耗数据;确定预设时间段内的目...

【专利技术属性】
技术研发人员:曾标张伟宁魏强陈其宇覃刚
申请(专利权)人:深圳索信达数据技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1