【技术实现步骤摘要】
一种用于数据中台数据质量的监控方法及系统
[0001]本专利技术属于数据中台、数据质量监控
,具体涉及一种用于数据中台数据质量的监控方法及系统。
技术介绍
[0002]随着社会经济和信息技术的飞速发展,人类日常的生产和生活产生了大量的数据,对大数据进行处理分析已成为人们重要的决策支持和可靠的业务优化手段。然而,大数据处理过程中,各个系统获得的海量数据往往存储在不同的数据库中,导致数据碎片化和数据孤岛现象,使得数据无法高效整合和共享。因此,数据中台应运而生,它是一种集中的数据管理和服务平台,将各个系统的数据进行集中治理,帮助人们打破数据孤岛,消除数据碎片化。
[0003]然而,数据中台中的数据是海量且冗杂的,其价值密度较低,数据质量往往良莠不齐,导致数据可信度低,从而影响基于数据中台做出的决策的准确性和有效性。目前,人们对数据质量的进行监控的关注点通常在于两端数据是否一致,即数据中台端从数据源端进行数据同步时是否发生错误,从而导致数据不完整或不准确。而事实上,数据质量低不仅仅是因为两端数据不一致,还可能是数据源端获取的数据受到了干扰。在这种情况下,数据从一开始就是错误或不准确的,即使后期做到两端数据完全一致,也只是数据中台同步了这些错误或不准确的数据,其数据质量自然无法提高。因此,需要一种用于数据中台数据质量的监控方法及系统,使数据中台能够判断数据源端获取的数据是否受到了干扰,期望达到直接监控数据源端数据质量的目的。
技术实现思路
[0004]本专利技术的目的在于提出一种用于数据中台数据质 ...
【技术保护点】
【技术特征摘要】
1.一种用于数据中台数据质量的监控方法,其特征在于,所述方法包括以下步骤:S100,配置数据中台的分布式监控网络;S200,通过分布式监控网络持续获取电力数据画像;S300,利用电力数据画像计算画像紊性水平;S400,根据画像紊性水平向数据中台进行预警;其中,在步骤S200中,通过分布式监控网络持续获取电力数据画像的方法是:通过电力分析仪采集不同监测信息的实时测量值,根据历史数据中各个时刻的实时测量值形成监测序列以及预测序列,并通过监测序列以及预测序列计算获得各个监测信息的测模距离,结合同一时刻下各个监测信息的测模距离形成电力数据画像;在步骤S300中,利用电力数据画像计算画像紊性水平的方法是:根据电力数据画像将部分获得的监测信息定义为一阶监测信息,将各个时刻的预测水平与实测水平进行比较形成第一紊扰值,结合一个时段内的第一紊扰值计算画像紊性偏向比,最后利用紊性水平计算获得紊性水平;或者,在步骤S300中,利用电力数据画像计算画像紊性水平的方法是:通过各个时刻的电力数据画像中存储的测模距离形成拟应序列,拟应序列进一步划分为第一拟应序列和第二拟应序列,将第一拟应序列和各个第二拟应序列比对,形成监测信息的低标指量和高标指量,再进一步获得低标指量序列和高标指量序列,最后根据低标指量序列和高标指量序列计算得到监测信息的子紊性值,并通过子紊性值进一步计算得到画像紊性水平。2.根据权利要求1所述的一种用于数据中台数据质量的监控方法,其特征在于,在步骤S100中,配置数据中台的分布式监控网络的方法是:数据中台的建立采用分布式系统,以分布式系统中的各个服务器分别作为节点,各个节点分别与数据中台连接并进行数据交换或者数据传输;以一个数据采集点作为一个单元,其中数据采集点为用于采集数据中台所需数据的位置或者地点;各个单元均布置有电力分析仪,通过电力分析仪采集监测信息,一个单元采集的监测信息包括电压、电流、功率、电能、频率和功率因数中的两种或两种以上,将单元采集的监测信息的数量记作NSen;把连接于同一个节点的单元数量记作NUni;通过各个节点和单元构建成的信息网络作为分布式监控网络。3.根据权利要求1所述的一种用于数据中台数据质量的监控方法,其特征在于,在步骤S200中,通过分布式监控网络持续获取电力数据画像的方法是:设定一个时间区间作为测量间隔t1,t1∈[1,60]秒;各个单元每隔t1获取一次电力信息,其中电力信息包括所有监测信息对应的实时测量值;以同一个监测信息下不同单元的实时测量值为一列,以同一个单元下不同监测信息的实时测量值为一行,构建一个矩阵FMX;以FMX中任意一列的极大值与极小值之差作为该列对应监测信息的实测水平,获取各个监测信息对应的实测水平;设定一个时间区间作为测量间隔t2,t2∈[60,120]分钟;设定一个关于时刻数量的变量tk,其取值范围为tk∈[1,20]个,以一个时刻与其前tk个时刻的实测水平的算术平均值作为该时刻的预测水平;以监测信息在t2时段内各个时刻的实测水平与预测水平分别构建一个序列,分别记作监测序列与预测序列;通过监测序列与预测序列计算获得均方根误差作为该监测信息的测模距离;各个监测数据种的测模距离构建一个序列作为测模序列;以测模序列作为当前时刻的电力数据画像。
4.根据权利要求1所述的一种用于数据中台数据质量的监控方法,其特征在于,在步骤S300中,利用电力数据画像计算画像紊性水平的方法是:获取当前时刻的电力数据画像中各个元素的平均值EFL,如果电力数据画像中一个元素的数值大于EFL,则将该元素对应监测信息定义为一阶监测信息;将任意一个一阶监测信息中的各个时刻的预测水平与实测水平进行比较,如果一个时刻下预测水平小于实测水平,则定义该时刻的预测水平为第一紊扰值,设定一个时间区间作为测量间隔t2,t2∈[60,120]分钟,以...
【专利技术属性】
技术研发人员:叶名震,王益斌,庞新安,
申请(专利权)人:湖南中青能科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。