一种构建元数据标签库的方法及装置制造方法及图纸

技术编号:29963366 阅读:7 留言:0更新日期:2021-09-08 09:25
本申请涉及一种构建元数据标签库的方法、装置、计算机设备和计算机可读存储介质,所述方法包括:获取多个元数据实体;根据所述多个元数据实体之间的关系,获取各元数据实体对应的维度标签;所述维度标签用于指示所述元数据实体与另一元数据实体之间关系的维度;根据各元数据实体对应的维度标签,获取各元数据实体对应的血缘关系;根据各元数据实体的血缘关系,针对各元数据实体获取并添加活跃度标签、影响力标签以及相似标签中的至少一个标签。采用本方法,将反应元数据实体关联关系的维度包含到数据资产标签体系中,能够完整的获取各种元数据实体及各元数据实体对应的血缘关系,从而构建完整的元数据标签体系。而构建完整的元数据标签体系。而构建完整的元数据标签体系。

【技术实现步骤摘要】
一种构建元数据标签库的方法及装置


[0001]本申请涉及大数据管理
,特别是涉及一种构建元数据标签库的方法及装置。

技术介绍

[0002]数据资产的概念边界随着数据管理技术的变化不断拓展,在大数据阶段,随着分布式存储、分布式计算以及多种人工智能技术的应用,结构化数据之外的数据也被纳入到数据资产的范畴,数据资产边界拓展到了海量的标签库、企业级知识图谱、文档、图片、视频等内容。目前,大型企业的数据资产的存在形式已从“数据库+数据仓库”升级到大数据资源库。在管理数据资产,挖掘、实现和输出数据资产价值时,一项重要的基础工作就是建立数据资产标签库。
[0003]在数据资产管理中,元数据管理是基础,它不仅有自己独特的管理需求、管理特点、技术实现方式,而且对数据使用支持、数据开发支持,以及数据质量管理、数据价值管理都有直接的影响和作用。元数据标签,是元数据管理的一个重要实现方式和承载方式,它主要应用在以下方面:数据分类和数据分级、数据血缘关系、数据质量传递分析、数据价值分析和判断、数据探查和联邦访问、数据组织和融合。
[0004]在数据资产中,存在着复杂的数据依赖关系和血缘关系,这种关系是很难通过关系型数据库来反映的。传统的数据标签生成方式,只是基于关系型数据库中的实体属性值的计算得到,当涉及到实体间的关系属性时,只能通过人工方式或规则计算方式获得少量、局部的实体关系属性信息,因此无法获得全网完整的实体关系信息,所以无法构建完整的元数据标签体系。

技术实现思路

[0005]为了解决上述技术问题或者至少部分地解决上述技术问题,本申请提供了一种构建元数据标签库的方法,用于实现元数据标签的自动化批量计算和自动打标。
[0006]第一方面,本申请提供了一种构建元数据标签库的方法,包括:
[0007]获取多个元数据实体;
[0008]根据所述多个元数据实体之间的关系,获取各元数据实体对应的维度标签;所述维度标签用于指示所述元数据实体与另一元数据实体之间关系的维度;
[0009]根据各元数据实体对应的维度标签,获取各元数据实体对应的血缘关系;
[0010]根据各元数据实体的血缘关系,针对各元数据实体获取并添加活跃度标签、影响力标签以及相似标签中的至少一个标签。
[0011]作为本专利技术实施例一种可选的实施方式,所述根据各元数据实体的血缘关系,针对各元数据实体获取并添加活跃度标签、影响力标签以及相似标签中的至少一个标签,包括:
[0012]根据各元数据实体的血缘关系,获取各元数据实体的被引用次数、被引用频率和
引用者权重;
[0013]根据所述被引用次数、被引用频率和所述引用者权重,获取各元数据实体的活跃度标签。
[0014]作为本专利技术实施例一种可选的实施方式,所述根据各元数据实体的血缘关系,针对各元数据实体获取并添加活跃度标签、影响力标签以及相似标签中的至少一个标签,包括:
[0015]根据各元数据实体的血缘关系,获取各元数据实体的中心度、中介度以及紧密度中的一个或多个;
[0016]根据所述中心度、中介度以及紧密度中的一个或多个,获取各元数据实体的影响力标签。
[0017]作为本专利技术实施例一种可选的实施方式,所述根据各元数据实体的血缘关系,针对各元数据实体获取并添加活跃度标签、影响力标签以及相似标签中的至少一个标签,包括:
[0018]对所述多个元数据实体进行聚类分析,获取聚类结果;
[0019]根据所述聚类结果,获取各元数据实体的影响力标签。
[0020]作为本专利技术实施例一种可选的实施方式,根据每个元数据实体的血缘关系,针对每个元数据实体获取并添加活跃度标签、影响力标签以及相似标签中的至少一个标签,还包括:
[0021]根据各所述元数据实体的血缘关系,获取各元数据实体之间的相似程度的计算结果;
[0022]根据各元数据实体之间的相似程度的计算结果,获取各元数据实体的相似标签。
[0023]作为本专利技术实施例一种可选的实施方式,在根据所述多个元数据实体之间的关系,获取各元数据实体对应的维度标签之前,所述方法还包括:
[0024]通过解析数据字典、解析SQL语句、解析数据库、解析审计日志中的一种或多种方式,获取所述多个元数据实体之间的关系。
[0025]作为本专利技术实施例一种可选的实施方式,所述方法还包括:
[0026]以各元数据实体为顶点、各元数据实体对应的血缘关系中元数据实体与其他元数据实体的关系为边,生成关系图谱;
[0027]将所述关系图谱保存到所述图数据库中。
[0028]第二方面,本申请提供了一种构建元数据标签库的装置,包括:
[0029]获取元数据实体模块,用于获取多个元数据实体;
[0030]第一获取模块,用于根据所述多个元数据实体之间的关系,获取各元数据实体对应的维度标签;所述维度标签用于指示所述元数据实体与另一元数据实体之间关系的维度;
[0031]第二获取模块,用于根据各元数据实体对应的维度标签,获取各元数据实体对应的血缘关系;
[0032]第三获取模块,用于根据各元数据实体的血缘关系,针对各元数据实体获取并添加活跃度标签、影响力标签以及相似标签中的至少一个标签。
[0033]作为本专利技术实施例一种可选的实施方式,所述根据各元数据实体的血缘关系,针
对各元数据实体获取并添加活跃度标签、影响力标签以及相似标签中的至少一个标签,包括:
[0034]根据各元数据实体的血缘关系,获取各元数据实体的被引用次数、被引用频率和引用者权重;
[0035]根据所述被引用次数、被引用频率和所述引用者权重,获取各元数据实体的活跃度标签。
[0036]作为本专利技术实施例一种可选的实施方式,所述根据各元数据实体的血缘关系,针对各元数据实体获取并添加活跃度标签、影响力标签以及相似标签中的至少一个标签,包括:
[0037]根据各元数据实体的血缘关系,获取各元数据实体的中心度、中介度以及紧密度中的一个或多个;
[0038]根据所述中心度、中介度以及紧密度中的一个或多个,获取各元数据实体的影响力标签。
[0039]作为本专利技术实施例一种可选的实施方式,所述根据各元数据实体的血缘关系,针对各元数据实体获取并添加活跃度标签、影响力标签以及相似标签中的至少一个标签,包括:
[0040]对所述多个元数据实体进行聚类分析,获取聚类结果;
[0041]根据所述聚类结果,获取各元数据实体的影响力标签。
[0042]作为本专利技术实施例一种可选的实施方式,根据每个元数据实体的血缘关系,针对每个元数据实体获取并添加活跃度标签、影响力标签以及相似标签中的至少一个标签,包括:
[0043]根据各所述元数据实体的血缘关系,获取各元数据实体之间的相似程度的计算结果;
[0044]根据各元数据实体之间的相似程度的计算结果,获取各元数据实体的相似标签。
[0045本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种构建元数据标签库的方法,其特征在于,所述方法包括:获取多个元数据实体;根据所述多个元数据实体之间的关系,获取各元数据实体对应的维度标签;所述维度标签用于指示所述元数据实体与另一元数据实体之间关系的维度;根据各元数据实体对应的维度标签,获取各元数据实体对应的血缘关系;根据各元数据实体的血缘关系,针对各元数据实体获取并添加活跃度标签、影响力标签以及相似标签中的至少一个标签。2.根据权利要求1所述的方法,其特征在于,所述根据各元数据实体的血缘关系,针对各元数据实体获取并添加活跃度标签、影响力标签以及相似标签中的至少一个标签,包括:根据各元数据实体的血缘关系,获取各元数据实体的被引用次数、被引用频率和引用者权重;根据所述被引用次数、被引用频率和所述引用者权重,获取各元数据实体的活跃度标签。3.根据权利要求1所述的方法,其特征在于,所述根据各元数据实体的血缘关系,针对各元数据实体获取并添加活跃度标签、影响力标签以及相似标签中的至少一个标签,包括:根据各元数据实体的血缘关系,获取各元数据实体的中心度、中介度以及紧密度中的一个或多个;根据所述中心度、中介度以及紧密度中的一个或多个,获取各元数据实体的影响力标签。4.根据权利要求1所述的方法,其特征在于,所述根据各元数据实体的血缘关系,针对各元数据实体获取并添加活跃度标签、影响力标签以及相似标签中的至少一个标签,包括:对所述多个元数据实体进行聚类分析,获取聚类结果;根据所述聚类结果,获取各元数据实体的影响力标签。5.根据权利要求1所述的方法,其特征在于,根据每个元数据实体的血缘关系,针对每个元数据实体获取并添加活跃度标签、影响力标签以及相似标签中的至少一个标签,...

【专利技术属性】
技术研发人员:崔维平孙艺新郑厚清王智敏王程贾德香王玓李心达陈光高洪达刘睿于灏刘素蔚陈睿欣颜拥姚影雷涛赵琳叶文广齐媛媛
申请(专利权)人:国网浙江省电力有限公司电力科学研究院天云融创数据科技北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1