工业数据规范化管理和质量保证方法技术

技术编号:33776481 阅读:22 留言:0更新日期:2022-06-12 14:30
本发明专利技术公开了工业数据规范化管理和质量保证方法,明确质量目标和用户需求,规划数据质量描述要素,开展数据质量描述;识别数据质量要素,新建数据质量要素,开展数据质量识别;选择评价方法,确定评价流程和步骤,开展数据质量评价;确定控制规则,选择控制方法,开展数据质量控制;通过比较数据与内外部参考信息来确定数据质量。本发明专利技术提供了工业数据规范化管理和数据质量保证方法,本方法通过对工业数据质量持续改进的模型、质量的描述、识别、评价、控制和报告等的标准化,支撑工业数据的协同建设、互联互通、共享利用,提高工业数据的质量、可用性和利用效率;本标准的实施有助于实现工业数据的规范化管理和质量保证。业数据的规范化管理和质量保证。业数据的规范化管理和质量保证。

【技术实现步骤摘要】
工业数据规范化管理和质量保证方法


[0001]本专利技术涉及工业数据领域,尤其涉及工业数据规范化管理和质量保证方法。

技术介绍

[0002]数据是事实或观察的结果,是对客观事物的逻辑归纳,是用于表示客观事物的未经加工的的原始素材,数据可以是连续的值,比如声音、图像,称为模拟数据,也可以是离散的,如符号、文字,称为数字数据。在计算机系统中,数据以二进制信息单元0、1的形式表示。
[0003]随着信息化与工业化的深度融合,信息技术渗透到了工业企业产业链的各个环节,工业企业建立了很多计算机信息系统,积累了大量工业数据,工业数据已成为工业企业的重要资源,同时,数据质量贯穿于工业数据生命周期的产生、收集、存储、维护、传输、加工和利用等各个阶段,海量的工业数据存在数据残缺、数据不规范以及数据错误等数据质量问题。
[0004]为此,我们提出工业数据规范化管理和质量保证方法。

技术实现思路

[0005]基于
技术介绍
存在的技术问题,本专利技术提出了工业数据规范化管理和质量保证方法,以解决上述
技术介绍
中提出的问题。
[0006]本专利技术提供如下技术方案:
[0007]工业数据规范化管理和质量保证方法,包括如下步骤:
[0008]A、工业数据质量管理:
[0009]a、策划:明确质量目标和用户需求,规划数据质量描述要素,开展数据质量描述;
[0010]b、实施:识别数据质量要素,新建数据质量要素,开展数据质量识别;
[0011]c、检查:选择评价方法,确定评价流程和步骤,开展数据质量评价;
[0012]d、处置:确定控制规则,选择控制方法,开展数据质量控制;
[0013]B、工业数据质量评价:数据质量评价方法分为直接评价方法:通过比较数据与内外部参考信息来确定数据质量;间接评价方法:使用与数据相关的外部知识推断或估计数据质量;
[0014]C、工业数据质量控制:“数据质量描述测试套件”用来测试数据集质量描述的正确性。
[0015]优选的,所述步骤B中直接评价方法可分为:完全检查方法:测试数据质量范围内的所有数据项;抽样检查方法:测试数据质量范围内的部分数据项,抽样方法、抽样率及抽样过程应在数据质量报告中报告。
[0016]优选的,所述步骤B中间接评价方法所依据的外部知识包括但不限于:数据质量非定量元素、数据集的其它质量报告。
[0017]优选的,所述步骤C中“数据质量描述测试套件”包括要素测试、可用性测试、排斥性测试、定量子元素描述项正确性检查和“数据质量报告”符合性检查。
[0018]本专利技术提供了工业数据规范化管理和质量保证方法,本方法通过对工业数据质量持续改进的模型、质量的描述、识别、评价、控制和报告等的标准化,支撑工业数据的协同建设、互联互通、共享利用,提高工业数据的质量、可用性和利用效率;本标准的实施有助于实现工业数据的规范化管理和质量保证。
附图说明
[0019]图1为本专利技术工业数据质量持续改进模型;
[0020]图2为本专利技术工数据质量描述框架;
[0021]图3为本专利技术工评价与报告数据质量结果的过程流图。
具体实施方式
[0022]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0023]请参阅图1

3,本专利技术提供一种技术方案:
[0024]工业数据规范化管理和质量保证方法,包括如下步骤:
[0025]A、工业数据质量管理:
[0026]a、策划:明确质量目标和用户需求,规划数据质量描述要素,开展数据质量描述;
[0027]b、实施:识别数据质量要素,新建数据质量要素,开展数据质量识别;
[0028]c、检查:选择评价方法,确定评价流程和步骤,开展数据质量评价;
[0029]d、处置:确定控制规则,选择控制方法,开展数据质量控制;
[0030]工业数据质量描述
[0031]描述要素
[0032]源自数据集、用户需求的工业数据质量信息所反映的数据质量应满足用户的特定需求,质量目标表明数据质量应符合任务的特定目的,通过识别数据集、用户需求、质量目标中的质量元素来描述质量信息,质量描述可用于数据集系列、数据集或数据集内具有相同特征的部分数据;
[0033]一个数据集的质量用以下两个要素来描述:
[0034]数据质量定量元素和数据质量非定量元素;
[0035]每个质量定量元素可细分为多个质量定量子元素,每个质量定量子元素用多个质量定量子元素描述项描述,通过数据质量定量元素、数据质量定量子元素及数据质量定量子元素描述项,描述数据集满足数据规范中预先设定标准的程度,并提供定量的质量信息;
[0036]数据质量非定量元素提供非定量的质量信息,可用于评价数据集在非预期的特定应用中的质量;质量信息的可信性,记录在“数据质量报告”中;
[0037]定量元素
[0038]构成
[0039]数据质量定量元素用来描述数据集的定量质量信息,用来表达符合数据规范的程度。包括但不限于以下元素:
[0040]完整性:特征、特征属性及特征关系存在或不存在;
[0041]一致性:数据结构(包括概念结构、逻辑结构、物理结构)、属性及其关系符合逻辑规则的程度;
[0042]准确性:包括正确性、精确性和时序性;
[0043]附加数据质量定量元素:用户可根据需求设置,以便描述无法用以上定量元素描述的定量的数据质量信息;
[0044]子元素;
[0045]数据质量定量子元素与数据质量定量元素相对应,用来描述数据集的定量质量信息;包括但不限于以下子元素:
[0046]a、完整性的子元素:
[0047]多余:数据集中有多余数据;
[0048]缺少:数据集中缺少应有数据;
[0049]交叉:数据集中存在交叉重复数据;
[0050]b、一致性的子元素:
[0051]概念一致性:符合概念模式规则;
[0052]值域一致性:值在值域范围内;
[0053]格式一致性:数据存储与数据集物理结构的一致性。
[0054]c、准确性的子元素:
[0055]正确性:数据反映和描述客观事物及其变化的准确程度;
[0056]精确性:数值符合其实际值或规定值的程度;
[0057]时序性:表达有序活动或序列活动相关数据时间顺序的正确性;
[0058]B、工业数据质量评价:数据质量评价方法分为直接评价方法:通过比较数据与内外部参考信息来确定数据质量;间接评价方法:使用与数据相关的外部知识推断或估计数据质量;
[0059]C、工业数据质量控制:“数本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.工业数据规范化管理和质量保证方法,其特征在于,包括如下步骤:A、工业数据质量管理:a、策划:明确质量目标和用户需求,规划数据质量描述要素,开展数据质量描述;b、实施:识别数据质量要素,新建数据质量要素,开展数据质量识别;c、检查:选择评价方法,确定评价流程和步骤,开展数据质量评价;d、处置:确定控制规则,选择控制方法,开展数据质量控制;B、工业数据质量评价:数据质量评价方法分为直接评价方法:通过比较数据与内外部参考信息来确定数据质量;间接评价方法:使用与数据相关的外部知识推断或估计数据质量;C、工业数据质量控制:“数据质量描述测试套件”用来测试数据集质量描述的正确性。2.根据权利要求1所述...

【专利技术属性】
技术研发人员:王志强
申请(专利权)人:中国标准化研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1