一种基于数据要素的数据标记方法、数据处理方法及装置制造方法及图纸

技术编号:38724251 阅读:27 留言:0更新日期:2023-09-08 23:17
本发明专利技术提供一种基于数据要素的数据标记方法、数据处理方法及装置,方法包括:基于获取的业务信息,从预设描述维度创建包括要素标记字段的要素标记属性列表;根据资源表的信息,结合要素标记属性列表,进行要素标记,将资源ID与要素标记进行关联;依次标记资源表中不同的信息组;基于标记的信息组,找出信息组中的主体并进行标记;标记相同主体和相同要素标记的优先级。本发明专利技术的要素标记可以发挥数据元的作用,同时通过结合数据处理方法,易于刻画数据模型,便于形成数据资源或规则模型的数字化表达;突出资源关键特征,降低治理复杂度,加快治理进度;适于跨行业实施,释放数据价值。释放数据价值。释放数据价值。

【技术实现步骤摘要】
一种基于数据要素的数据标记方法、数据处理方法及装置


[0001]本申请涉及数据计算机
,特别是涉及一种基于数据要素的数据标记方法、数据处理方法及装置。

技术介绍

[0002]随着数据共享和数据挖掘等需求的发展,大数据治理在各行各业中发挥着举足轻重的作用。数据治理的关键步骤为数据元对标,数据元是将多元异构的数据转为标准化数据的重要手段之一。随着数据治理应用范围的扩大,针对不同行业,有不同的数据标准。因此,如何快速有效地进行跨行业数据清洗,显得尤为重要。
[0003]目前相关数据元都是与某一行业或某一特定场景深度相关,无法满足跨行业、混合行业大数据治理的需求。并且是以数据为中心,对模型、开发、校验等方法的管理、运用能力尚不足,对大数据治理体系的应用具有一定的局限性。

技术实现思路

[0004]为了解决上述技术问题,本专利技术提供一种基于数据要素的数据标记方法、数据处理方法及装置,对数据要素的数据标记(要素标记)可以发挥数据元的作用,同时通过结合数据处理方法,易于刻画数据模型,便于形成数据资源或规则模型的数字化表达;突出本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于数据要素的数据标记方法,其特征在于,包括:基于获取的业务信息,从预设描述维度创建包括要素标记字段的要素标记属性列表;根据资源表的信息,结合要素标记属性列表,进行要素标记,将资源ID与要素标记进行关联;依次标记资源表中不同的信息组;基于标记的信息组,找出信息组中的主体并进行标记;标记相同主体和相同要素标记的优先级。2.根据权利要求1所述的基于数据要素的数据标记方法,其特征在于,所述预设描述维度包括如下字段:要素标记、中文名称、对象类型、值域、字典代码、数据类型、数据元编码和处理方法;所述要素标记,为一个数据要素的唯一标识符;所述中文名称,为赋予要素标记的单个或多个中文字词的指称;所述对象类型,用于标记所描述的主体对象类型;所述值域,为根据相应属性中规定的数据类型、表示格式而决定的元类元素的允许值的集合;所述字典代码,为所遵循的字典代码集合的编号;所述数据类型,为标识要素的数据类型;所述数据元编码,对应行业的数据元编码;所述处理方法,为要素标记对应的数据处理规则。3.根据权利要求1所述的基于数据要素的数据标记方法,其特征在于,所述信息组代表同一实体对象的相关标记;相同信息组用相同的阿拉伯字母标记,标记顺序按照主体的重要程度划分。4.根据权利要求1所述的基于数据要素的数据标记方法,其特征在于,所述主体为用于确定描述资源主体对象的字段,主体可不唯一。5.一种基于数据要素的数据标记装置,其特征在于,包括:要素标记属性列表创建模块,用于基于获取的业务信息,从预设描述维度创建包括要素标记字段的要素标记属性列表;要素标记模块,用于根据资源表的信息,结合要素标记属性列表,进行要素标记,将资源ID与要素标记进行关联;信息组标记模块,用于依次标记资源表中不同的信息组;主体标记模块,用于基于标记的信息组,找出信息组中的主体并进行标记;优先级标记模块,用于标记相同主体和相同要素标记的优先级。6.一种基于要素标记的数据处理方法,其特征在于,包括:基于获取的业务信息,从预设描述维度创建包括要素标记字段的要素标记属性列表;根据资源表的信息,结合要素标记属性列表,进行要素标记,将资源ID与要素标记进行关联;依次标记资源表中不同的信息组;基于标记的信息组,找出信息组中的主体并进行标记;标记相同主体和相同要素标记的优先级;通过资源...

【专利技术属性】
技术研发人员:蔡晓梅吴文陈仕久黄荣昌郑美英叶女婷
申请(专利权)人:厦门市美亚柏科信息股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1