System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 数据仓库表的标签集合生成方法、装置、设备及存储介质制造方法及图纸_技高网

数据仓库表的标签集合生成方法、装置、设备及存储介质制造方法及图纸

技术编号:39939686 阅读:4 留言:0更新日期:2024-01-08 22:27
本申请提供一种数据仓库表的标签集合生成方法、装置、设备及存储介质。该方法包括:获取待标记的数据仓库表所在的数据仓库,数据仓库包括多个数据仓库表;根据数据仓库表血缘关系图谱,在数据仓库的数据仓库表中确定与待标记的数据仓库表相关的多个关联数据仓库表,血缘关系图谱是包括数据仓库中的数据流转路径的数据仓库表关系图谱;根据多个关联数据仓库表的标签集合,生成待标记的数据仓库表的标签集合。本申请的方法,提高了数据仓库表的标签集合生成的准确性。

【技术实现步骤摘要】

本申请涉及大数据,尤其涉及一种数据仓库表的标签集合生成方法、装置、设备及存储介质


技术介绍

1、在大数据时代中,随着数据量不断增长,数仓模型,即数据仓库表作为一种数据管理和处理的解决方案,在高效地管理、分析数据等方面得到了广泛的应用。在数仓建设中,数据标签是一个非常重要的环节,通过给数仓模型生成合适的标签可以有效地提升数据的可读性、可理解性、可用性和查询效率等,进而帮助我们更好地进行数据分析、数据挖掘等工作。

2、现有技术中,通常通过人工的方式手动为每一个数仓模型添加标签。

3、然而,对于大规模、复杂多变的数仓来说,人工的方式添加标签会导致效率低以及准确率低的问题。


技术实现思路

1、本申请提供一种数据仓库表的标签集合生成方法、装置、设备及存储介质,用以解决数据仓库表的标签集合生成的准确性低的问题。

2、第一方面,本申请提供一种数据仓库表的标签集合生成方法,包括:

3、获取待标记的数据仓库表所在的数据仓库,所述数据仓库包括多个数据仓库表;

4、根据数据仓库表血缘关系图谱,在所述数据仓库的数据仓库表中确定与所述待标记的数据仓库表相关的多个关联数据仓库表,所述血缘关系图谱是包括所述数据仓库中的数据流转路径的数据仓库表关系图谱;

5、根据多个所述关联数据仓库表的标签集合,生成所述待标记的数据仓库表的标签集合。

6、第二方面,本申请提供一种数据仓库表的标签集合生成装置,包括:

7、获取模块,用于获取待标记的数据仓库表所在的数据仓库,所述数据仓库包括多个数据仓库表;

8、确定模块,用于根据数据仓库表血缘关系图谱,在所述数据仓库的数据仓库表中确定与所述待标记的数据仓库表相关的多个关联数据仓库表,所述血缘关系图谱是包括所述数据仓库中的数据流转路径的数据仓库表关系图谱;

9、生成模块,用于根据多个所述关联数据仓库表的标签集合,生成所述待标记的数据仓库表的标签集合。

10、第三方面,本申请提供一种数据仓库表的标签集合生成设备,包括:

11、处理器,存储器,通信接口;

12、所述存储器用于存储所述处理器的可执行指令;

13、其中,所述处理器配置为经由执行所述可执行指令来执行如上第一方面所述的数据仓库表的标签集合生成方法。

14、第四方面,本申请提供一种可读存储介质,包括:其上存储有计算机程序,所述计算机程序被处理器执行时实现执行如上第一方面所述的数据仓库表的标签集合生成方法。

15、本申请提供的数据仓库表的标签集合生成方法、装置、设备及存储介质,通过获取待标记的数据仓库表所在的数据仓库,数据仓库包括多个数据仓库表,根据数据仓库表血缘关系图谱,在数据仓库的数据仓库表中确定与待标记的数据仓库表相关的多个关联数据仓库表,根据多个关联数据仓库表的标签集合,生成待标记的数据仓库表的标签集合,其中,通过预先构建的数据仓库表血缘关系图谱确定待标记的数据仓库表的关联数据仓库表,提高了确定关联数据仓库表的准确性,进一步通过确定的关联数据仓库表的标签集合生成待标记的数据仓库表的标签集合,提高了数据仓库表的标签集合生成的准确性。

本文档来自技高网...

【技术保护点】

1.一种数据仓库表的标签集合生成方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述方法还包括:

3.根据权利要求2所述的方法,其特征在于,所述方法还包括:

4.根据权利要求3所述的方法,其特征在于,所述根据数据仓库表血缘关系图谱,在所述数据仓库的数据仓库表中确定与所述待标记的数据仓库表相关的多个关联数据仓库表,包括:

5.根据权利要求4所述的方法,其特征在于,所述计算各所述上游数据仓库表与所述待标记的数据仓库表之间的特征相关性强度,包括:

6.根据权利要求5所述的方法,其特征在于,所述计算各所述表特征之间的相关性强度,包括:

7.根据权利要求6所述的方法,其特征在于,所述根据多个所述关联数据仓库表的标签集合,生成所述待标记的数据仓库表的标签集合,包括:

8.一种数据仓库表的标签集合生成装置,其特征在于,包括:

9.一种数据仓库表的标签集合生成设备,其特征在于,包括:

10.一种可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现执行权利要求1至7任一项所述的数据仓库表的标签集合生成方法。

...

【技术特征摘要】

1.一种数据仓库表的标签集合生成方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述方法还包括:

3.根据权利要求2所述的方法,其特征在于,所述方法还包括:

4.根据权利要求3所述的方法,其特征在于,所述根据数据仓库表血缘关系图谱,在所述数据仓库的数据仓库表中确定与所述待标记的数据仓库表相关的多个关联数据仓库表,包括:

5.根据权利要求4所述的方法,其特征在于,所述计算各所述上游数据仓库表与所述待标记的数据仓库表之间的特征相关性强度,包括:

6....

【专利技术属性】
技术研发人员:尚亚涛徐悦刘旺
申请(专利权)人:阿维塔科技重庆有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1