元数据类型划分方法及电子设备、存储介质技术

技术编号:37494480 阅读:21 留言:0更新日期:2023-05-07 09:32
本申请公开了一种元数据类型划分方法及电子设备、计算机可读存储介质,本申请提供的方案包括:获取目标大数据环境下的元数据的场信息;根据所述场信息构建目标图网络,其中,目标图网络中的节点表示元数据,边表示对应连接的两个元数据关联的场信息;在目标图网络中确定元数据的场信息的权重;基于由目标图网络中节点对应的节点数据确定的样本和标签,对节点的类型判别模型进行训练,其中,所述标签包括节点表示的元数据对应所述目标大数据环境的应用类型,所述样本的样本特征包括节点表示的元数据的场信息;基于所述类型判别模型对所述目标图网络中的节点进行应用类型划分。目标图网络中的节点进行应用类型划分。目标图网络中的节点进行应用类型划分。

【技术实现步骤摘要】
元数据类型划分方法及电子设备、存储介质


[0001]本申请涉及大数据处理领域,尤其涉及一种元数据类型划分方法及电子设备、计算机可读存储介质。

技术介绍

[0002]随着大数据应用的广泛普及,大数据环境下如何做好海量数据的管理已逐渐成为提升大数据能力的重点工作。海量数据的管理通常是通过元数据的方式来对进行管理,而在海量数据中的元数据通常也是海量级别。因此,如何能准确、高效地对元数据进行类别自动划分,提升大数据环境下的数据质量管理的效率,是目前需要解决的技术问题。

技术实现思路

[0003]本申请实施例的目的是提供一种元数据类型划分方法及电子设备、计算机可读存储介质,用以解决如何能准确、高效实现对元数据类别自动划分的问题。
[0004]为了解决上述技术问题,本说明书是这样实现的:
[0005]第一方面,提供了一种元数据类型划分方法,包括:获取目标大数据环境下的元数据的场信息;根据所述场信息构建目标图网络,其中,目标图网络中的节点表示元数据,边表示对应连接的两个元数据关联的场信息;在目标图网络中确定元数据的场信息的权重本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种元数据类型划分方法,其特征在于,包括:获取目标大数据环境下的元数据的场信息;根据所述场信息构建目标图网络,其中,目标图网络中的节点表示元数据,边表示对应连接的两个元数据关联的场信息;在目标图网络中确定元数据的场信息的权重;基于由目标图网络中节点对应的节点数据确定的样本和标签,对节点的类型判别模型进行训练,其中,所述标签包括节点表示的元数据对应所述目标大数据环境的应用类型,所述样本的样本特征包括节点表示的元数据的场信息;基于所述类型判别模型对所述目标图网络中的节点进行应用类型划分。2.如权利要求1所述的方法,其特征在于,所述场信息包括元数据的创建时间、元数据的描述字段、元数据所属表的名称和元数据所属表的描述字段,根据所述场信息构建目标图网络,包括:根据元数据的创建时间、元数据的描述字段、元数据所属表的名称和元数据所属表的描述字段,确定与其他元数据具有上下文引用关系的第一类元数据;以各第一类元数据为节点,以各第一类元数据所属表的描述字段为边,构建第一类型图网络。3.如权利要求1所述的方法,其特征在于,所述场信息包括元数据的数据类型,根据所述场信息构建目标图网络,包括:根据元数据的数据类型,获取目标脚本中关于目标专题的第二类元数据,所述目标脚本用于记录所述目标专题的分析数据或应用数据;以各第二类元数据为节点,构建所述目标脚本对应的各第二类元数据的全连接网络;以同时出现在不同脚本对应的全连接网络中的相同第二元数据之间的连线为边,构建第二类型图网络。4.如权利要求1所述的方法,其特征在于,所述场信息包括元数据的名称或描述字段,根据所述场信息构建目标图网络,包括:确定存在相同的元数据名称或描述字段的第三类元数据;以各第三类元数据为节点,以各第三类元数据对应的相同的元数据名称或描述字段为边,构建第三类型图网络。5.如权利要求2至4中任一项所述的方法,其特征在于,在目标图网络中确定元数据的场信息的权重,包括:确定目标元数据对应的目标场信息的排序值;对所述排序值进行隐因子编码,得到所述目标场信息的权重...

【专利技术属性】
技术研发人员:祝希路
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1