一种基于元数据驱动的电力通信大数据质量管理方法技术

技术编号:20025635 阅读:29 留言:0更新日期:2019-01-06 04:30
一种基于元数据驱动的电力通信大数据质量管理方法,包括S1、设定标准元数据模型;S2、基于标准元数据模型设定数据评价模型;S3、构建数据系统,数据系统包括采样数据库、评价数据库、日志数据库、记录数据库和查询接口;S4、在每个数据采样点依据标准元数据模型进行数据采样,得到待接入数据,持久化数据录入采样数据库中;S5、根据数据评价模型对待接入数据进行评价;S6、根据S5的评价结果生成评价数据和日志数据,将评价数据录入评价数据库,将日志数据录入日志数据库。本发明专利技术通过元数据在各个数据产生采集过程中的驱动能力,实现对数据在生产过程中的质量检测,以实现对数据质量的控制。

【技术实现步骤摘要】
一种基于元数据驱动的电力通信大数据质量管理方法
本专利技术涉及电力大数据管理
,具体的说是一种基于元数据驱动的电力通信大数据质量管理方法。
技术介绍
当前,大数据在电力通信领域得到了广泛应用,对电力通信网络管理活动产生了巨大影响。但是由电力通信管理数据的大量更新会导致过时数据迅速产生,也更易于产生不一致数据,为人工错误检测与修复带来困难。且电力通信大数据来源和形式上的多样,使得数据有更大的可能产生不一致和冲突。例如,在不同单位、不同系统获取到的描述同一事务的数据有较大差异,存在冲突。电力通信管理大数据存在数据质量问题会带来管理工作带来严重的后果,因此需要对电力通信大数据进行质量管理,从而确保基于电力通信大数据的各种应用得到有效实施。目前,对大数据的质量管理主要体现在四个方面:首先是数据的及时性。保证数据的及时性需要在数据提取、传送、转换、加载、展现的过程中予以贯彻。其次数据的完整性。保障数据是一套能够自洽的指标体系,包含数据分析所需的所有维度的信息,并且信息之间存在清晰的逻辑校验关系。再次是数据的一致性,和前两个角度相比,一致性更强调了一种空间感,由于数据来自于不同的数据源或者说经过传递了很多环节,这些环节之间相关的数据定义、数据的值、数据的数量都应该是保持一致的。最后是数据的准确性,数据中记录的信息和数据是否准确,是否存在异常或者错误的信息。导致一致性问题的原因可能是数据记录的规则不一,但不一定存在错误;而准确性关注的是数据记录中存在的错误。
技术实现思路
为了解决现有技术中的不足,本专利技术提供一种基于元数据驱动的电力通信大数据质量管理方法,通过元数据在各个数据产生采集过程中的驱动能力,实现对数据在生产过程中的质量检测,以实现对数据质量的控制。为了实现上述目的,本专利技术采用的具体方案为:一种基于元数据驱动的电力通信大数据质量管理方法,包括如下步骤:S1、设定标准元数据模型;S2、基于所述标准元数据模型设定数据评价模型;S3、构建数据系统,所述数据系统包括采样数据库、评价数据库、日志数据库、记录数据库和查询接口,所述查询接口与所述采样数据库、所述评价数据库、所述日志数据库和所述记录数据库均保持链接,所述采样数据库、所述评价数据库和所述日志数据库依次链接,所述采样数据库与所述记录数据库保持链接;S4、在每个数据采样点依据所述标准元数据模型进行数据采样,得到待接入数据,所述持久化数据录入所述采样数据库中;S5、根据所述数据评价模型对所述待接入数据进行评价,根据评价结果执行S51或者S52;S51、对通过评价的所述待接入数据进行处理得到持久化数据,并且将所述持久化数据录入所述记录数据库;S52、对未通过评价的所述待接入数据进行标识,得到待修正数据,并且将所述待修正数据通过所述查询接口输出;S6、根据S5的评价结果生成评价数据和日志数据,将所述评价数据录入所述评价数据库,将所述日志数据录入所述日志数据库。优选的,所述标准元数据模型包括技术元数据模型、业务元数据模型和管理元数据模型,所述技术元数据模型、所述业务元数据模型和所述管理元数据模型均包括字段信息子模型和时间信息子模型。优选的,所述数据评价模型包括元数据完整性评价子模型、元数据一致性评价子模型、元数据准确性评价子模型和元数据及时性评价子模型,所述数据完整性评价子模型用于评价所述待接入数据是否符合所述字段信息子模型,所述元数据一致性评价子模型用于评价前后多个所述待接入数据是否具有统一性,所述元数据准确性评价子模型用于评价所述待接入数据是否存在异常,所述元数据及时性评价子模型用于评价所述待接入数据的录入时间是否正确。优选的,S51中,对所述待接入数据的处理过程包括:S511、对所述待接入数据进行格式转换,得到转换后数据;优选的,S512、对所述转换后数据进行清洗,生成所述持久化数据。优选的,S511中,对所述待接入数据进行格式转换的方法为:将所述待接入数据转换为计算机数据。优选的,S512中,对所述转换后数据进行清洗的方法为:对所述转换后数据进行压缩。优选的,所述评价数据包括依次关联的数据采集点信息、待接入数据信息、评价结果信息和备注信息,所述备注信息用于表征所述待接入数据未通过评价的原因。优选的,所述备注信息包括信息问题特征码、技术问题特征码、流程问题特征码和管理问题特征码。优选的,所述日志数据包括依次关联的数据采集点信息、待接入数据信息和评价结果信息。优选的,所述查询接口包括被动接口和主动接口。本专利技术通过元数据在各个数据产生采集过程中的驱动能力,实现对数据在生产过程中的质量检测,并且把各个数据产生过程中的检查结果关联在一起,以实现对数据质量的控制,最终实现数据质量的可分析和可追溯,并且具有报警能力。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术的流程图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。请参阅图1,图1是本专利技术的流程图。一种基于元数据驱动的电力通信大数据质量管理方法,包括S1至S6。S1、设定标准元数据模型。标准元数据模型包括技术元数据模型、业务元数据模型和管理元数据模型,技术元数据模型、业务元数据模型和管理元数据模型均包括字段信息子模型和时间信息子模型。技术元数据模型,设定关于数据系统技术细节的数据,适用于开发和管理数据而使用的数据,主要包括数据仓库结构的描述,包括对数据结构、数据处理过程的特征描述,存储方式和位置覆盖整个涉及数据的生产和消费环节;业务元数据模型,从业务角度描述了数据仓库中的数据,提供了业务使用者和实际系统之间的语义层,主要包括业务术语、指标定义、业务规则等信息;管理元数据模型,描述系统中管理领域相关概念、关系和规则的数据,主要包括人员角色、岗位职责、管理流程等信息。通过设定良好的标准元数据模型,能为数据质量的采集、分析、监控、改进提供高效、有力的强大保障。同时,良好的数据质量管理系统也能促进元数据管理系统的持续改进,互相促进完善,共同为一个高质量和高效运转的数据平台提供支持。S2、基于标准元数据模型设定数据评价模型。数据评价模型包括元数据完整性评价子模型、元数据一致性评价子模型、元数据准确性评价子模型和元数据及时性评价子模型,数据完整性评价子模型用于评价待接入数据是否符合字段信息子模型,主要包括数据的记录和信息是否完整,是否存在缺失情况;元数据一致性评价子模型用于评价前后多个待接入数据是否具有统一性;元数据准确性评价子模型用于评价待接入数据是否存在异常;元数据及时性评价子模型用于评价待接入数据的录入时间是否正确。S3、构建数据系统,数据系统包括采样数据库、评价数据库、日志数据库、记录数据库和查询接口,查询接口与采样数据库、评价数据库、日志数据库和记录数据库均保持链接,本文档来自技高网...

【技术保护点】
1.一种基于元数据驱动的电力通信大数据质量管理方法,其特征在于:包括如下步骤:S1、设定标准元数据模型;S2、基于所述标准元数据模型设定数据评价模型;S3、构建数据系统,所述数据系统包括采样数据库、评价数据库、日志数据库、记录数据库和查询接口,所述查询接口与所述采样数据库、所述评价数据库、所述日志数据库和所述记录数据库均保持链接,所述采样数据库、所述评价数据库和所述日志数据库依次链接,所述采样数据库与所述记录数据库保持链接;S4、在每个数据采样点依据所述标准元数据模型进行数据采样,得到待接入数据,所述持久化数据录入所述采样数据库中;S5、根据所述数据评价模型对所述待接入数据进行评价,根据评价结果执行S51或者S52;S51、对通过评价的所述待接入数据进行处理得到持久化数据,并且将所述持久化数据录入所述记录数据库;S52、对未通过评价的所述待接入数据进行标识,得到待修正数据,并且将所述待修正数据通过所述查询接口输出;S6、根据S5的评价结果生成评价数据和日志数据,将所述评价数据录入所述评价数据库,将所述日志数据录入所述日志数据库。

【技术特征摘要】
1.一种基于元数据驱动的电力通信大数据质量管理方法,其特征在于:包括如下步骤:S1、设定标准元数据模型;S2、基于所述标准元数据模型设定数据评价模型;S3、构建数据系统,所述数据系统包括采样数据库、评价数据库、日志数据库、记录数据库和查询接口,所述查询接口与所述采样数据库、所述评价数据库、所述日志数据库和所述记录数据库均保持链接,所述采样数据库、所述评价数据库和所述日志数据库依次链接,所述采样数据库与所述记录数据库保持链接;S4、在每个数据采样点依据所述标准元数据模型进行数据采样,得到待接入数据,所述持久化数据录入所述采样数据库中;S5、根据所述数据评价模型对所述待接入数据进行评价,根据评价结果执行S51或者S52;S51、对通过评价的所述待接入数据进行处理得到持久化数据,并且将所述持久化数据录入所述记录数据库;S52、对未通过评价的所述待接入数据进行标识,得到待修正数据,并且将所述待修正数据通过所述查询接口输出;S6、根据S5的评价结果生成评价数据和日志数据,将所述评价数据录入所述评价数据库,将所述日志数据录入所述日志数据库。2.如权利要求1所述的一种基于元数据驱动的电力通信大数据质量管理方法,其特征在于:所述标准元数据模型包括技术元数据模型、业务元数据模型和管理元数据模型,所述技术元数据模型、所述业务元数据模型和所述管理元数据模型均包括字段信息子模型和时间信息子模型。3.如权利要求2所述的一种基于元数据驱动的电力通信大数据质量管理方法,其特征在于:所述数据评价模型包括元数据完整性评价子模型、元数据一致性评价子模型、元数据准确性评价子模型和元数据及时性评价子模型,所述数据完整性评价子模型用于评价所述待接入数据是...

【专利技术属性】
技术研发人员:杨鸿珍吴慧张辰彭瑶张明熙赵建朋孙晓恩简伟华
申请(专利权)人:国网浙江省电力有限公司信息通信分公司国网浙江省电力有限公司国家电网公司
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1