一种元数据分类方法及装置制造方法及图纸

技术编号:38349212 阅读:16 留言:0更新日期:2023-08-02 09:29
本申请公开一种元数据分类方法及装置,方法包括:获取待分类数据;将待分类数据输入元数据分类模型,获得待分类数据的分类结果,分类结果用于表示待分类数据与标准业务元数据集合之间的映射关系;其中,元数据分类模型是基于标准业务元数据集合训练得到的,标准业务元数据集合是基于初始元数据与业务元数据标准主题域之间的匹配关系确定的,业务元数据标准主题域中包括按业务类型划分的元数据标准,不同标准业务元数据集合中的元数据对应不同的业务类型。本申请使数据分类更加高效,提高了数据分类的准确性及可信度。了数据分类的准确性及可信度。了数据分类的准确性及可信度。

【技术实现步骤摘要】
一种元数据分类方法及装置


[0001]本申请涉及数据处理领域,具体涉及一种元数据分类方法及装置。

技术介绍

[0002]随着数字化和信息化建设的发展,企业拥有种类繁多、体量庞大的数据资源,同时,随着业务范围和客户规模地不断扩大,企业所产生的数据规模也在迅速增长,但是分散的数据元、巨大的数据量和非结构化的数据类型使数据管理复杂性进一步复杂化,增加了数据识别和分类的难度。
[0003]相关技术中,通过人工对数据资源进行分类,但是人工分类数据缺少统一的数据标准和完整的分类方法,分类效率和准确性较低。

技术实现思路

[0004]本申请提供了一种元数据分类方法及装置,可以提高元数据分类的效率和准确性。
[0005]有鉴于此,本申请第一方面提供了一种元数据分类方法,所述方法包括:
[0006]获取待分类数据;
[0007]将所述待分类数据输入元数据分类模型,获得所述待分类数据的分类结果,所述分类结果用于表示所述待分类数据与标准业务元数据集合之间的映射关系;
[0008]其中,所述元数据分类模型是基于所本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种元数据分类方法,其特征在于,所述方法包括:获取待分类数据;将所述待分类数据输入元数据分类模型,获得所述待分类数据的分类结果,所述分类结果用于表示所述待分类数据与标准业务元数据集合之间的映射关系;其中,所述元数据分类模型是基于所述标准业务元数据集合训练得到的,所述标准业务元数据集合是基于初始元数据与业务元数据标准主题域之间的匹配关系确定的,所述业务元数据标准主题域中包括按业务类型划分的元数据标准,不同所述标准业务元数据集合中的元数据对应不同的业务类型。2.根据权利要求1所述的方法,其特征在于,所述标准业务元数据集合是通过如下方式获得的:采集初始元数据;对所述初始元数据进行数据元识别,获得数据元集合;将所述数据元集合与业务元数据标准主题域进行匹配,获得所述数据元集合中各个数据元对应的所述业务类型;根据所述数据元集合中各个数据元对应的所述业务类型,确定所述初始元数据对应的业务类型;基于对应于同一业务类型的初始元数据,确定所述业务类型对应的标准业务元数据集合。3.根据权利要求2所述的方法,其特征在于,所述对所述初始元数据进行数据元识别,获得数据元集合包括:通过基础识别、值域识别和正则识别中的至少一种识别方法,从所述初始元数据中识别数据元,获得第一识别结果;其中,所述基础识别通过字段名称识别数据元,所述值域识别通过数据的值域识别数据元,所述正则识别通过数据的正则规则识别数据元;根据所述第一识别结果中所述数据元对应的识别方法,对所述数据元设置对应的权重,获得第二识别结果;根据所述第二识别结果,获得数据元集合。4.根据权利要求1所述的方法,其特征在于,所述方法进一步包括:根据所述映射关系,将所述待分类数据与标准资源目录进行匹配,获得所述待分类数据与所述标准资源目录之间的匹配关系;根据所述匹配关系,对所述待分类数据进行目录化管理。5.根据权利要求4所述的方法,其特征在于,所述根据所述匹配关系,对所述待分类数据进行目录化管理包括:若所述匹配关系表示所述待分类数据匹配到一个标准资源目录,则将所述待分类数据划分至所述标准资源目录中;若所述匹配关系表示所述待分类数据匹配到多个标准资源目录,则根据所述待分类数据中的字段数量与所述多个标准资源目录中的字段数量进行二次匹配,并将所述待分类数据划分至满足预设条件的所述标准资源目录中;若所述匹配关系表示所述待分类数据未匹配到标准资源目录,则对所述待分类数据中的数据元进行过滤后,重新进行标准资源目录匹配。
6.根据权利要求5所述的方法,其...

【专利技术属性】
技术研发人员:王红凯谢裕清张建松黄宇腾江昊陈可沈思琪应张驰陈珊俞天奇许小可
申请(专利权)人:国网浙江省电力有限公司信息通信分公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1