一种多能源系统多源异构数据融合方法及系统技术方案

技术编号:36707687 阅读:20 留言:0更新日期:2023-03-01 09:31
本发明专利技术涉及一种多能源系统多源异构数据融合方法及系统,包括以下步骤:步骤1、采集多能源系统负荷数据和环境监测数据,并初步清洗异常数据;步骤2、考虑到各传感器采样周期不同,对步骤1的清洗后的多能源系统负荷数据和环境监测数据进行数据时间配准;步骤3、考虑到各传感器数据采集的量测数据缺失,对步骤2配准后的数据进行数据填补,获得更为完整的传感器数据集;步骤4、基于步骤3填补后的完整数据集,采用DBSCAN算法进行数据降噪;步骤5、采用卡尔曼滤波算法对步骤4获得的降噪后多源异构数据进行融合。本发明专利技术能够有效提高多源异构数据的融合效率,减小数据融合的误差。减小数据融合的误差。减小数据融合的误差。

【技术实现步骤摘要】
一种多能源系统多源异构数据融合方法及系统


[0001]本专利技术属于多能源系统数据处理
,涉及一种多能源系统多源异构数据融合方法及系统。

技术介绍

[0002]随着状态监测技术的发展、电网结构复杂性的提高,以及电网人工智能应用的推广,智能电力设备采集数据呈现出规模大,更新速度快,多源异构,价值密度低的特点。在电力设备大数据爆炸性增长的新形势下,传统的数据处理技术已无法安全准确地从海量数据中完成知识获取和信息分析,因此多源异构大数据清洗和融合技术对于智能电网的稳定、安全可靠运行显示出重要作用。
[0003]针对多能源系统多源异构数据的融合,国内外学者开展了相关的研究。聂庆科提出了一种用于多源异构监测数据融合方法,通过采用小波分解技术对不同类型的原始监测数据进行预处理和去噪,并借助熵权法将来自不同监测点的相同类型监测数据融合为一个监测序列。王罡提出了一种新的综合管廊电力舱状态分析判断方法,将来自管廊电力舱的多个分布式数据源采用中间件技术进行数据层融合。Ngiam通过深度学习模型提取音频数据和视频数据的特征,然后结合音频和视频特征形成目标对象的集成特征向量,实现异构信息特征源的非线性融合。莫慧凌提出了一种联邦学习中基于Tucker分解的多源异构数据融合算法,通过引入张量Tucker分解理论,构建一个具有异构空间维度特性的高阶张量,实现联邦学习中多源异构数据的融合。
[0004]由此可见,目前研究缺乏有效的多源异构数据融合技术,现有的多能源系统多源异构数据融合方法,数据融合误差较大,时间较长。同时对于各类传感器的大量监测数据,缺乏有效的处理。因此需研究数据配准、填补以及降噪等数据预处理技术,为数据的融合创造良好的基础。

技术实现思路

[0005]本专利技术的目的在于克服现有技术中的不足,提出一种多能源系统多源异构数据融合方法及系统,能够有效提高多源异构数据的融合效率,减小数据融合的误差。
[0006]本专利技术解决其现实问题是采取以下技术方案实现的:
[0007]一种多能源系统多源异构数据融合方法,包括以下步骤:
[0008]步骤1、采集多能源系统负荷数据和环境监测数据,并清洗异常数据;
[0009]步骤2、对步骤1的清洗后的多能源系统负荷数据和环境监测数据进行数据时间配准;
[0010]步骤3、对步骤2配准后的数据进行数据填补,获得更为完整的传感器数据集;
[0011]步骤4、对步骤3填补后的完整数据集,进行数据降噪;
[0012]步骤5、对步骤4获得的降噪后多源异构数据进行融合。
[0013]而且,所述步骤1的具体步骤包括:
[0014](1)采集多能源系统的负荷数据和环境监测数据;
[0015]其中,所述负荷数据包括设备的属性参数和电网的实时运行状态数据;所述环境监测数据包括温度、湿度和振动数据;
[0016](2)采用局部异常因子算法,通过给每个所采集的数据都分配一个依赖于相邻区域密度的离群因子的离群程度值,计算每个数据的局部可达密度和局部异常因子;
[0017]所述数据的局部可达密度ρ
i
(x)和局部异常因子LOF
i
(x)的计算公式为:
[0018][0019][0020]式中,N
i
(x)为数据点x的第i距离领域;ρ
i
(x)为局部可达密度;s
i
(x,f
j
)为监测数据x与第j天同期监测数据f
j
的距离;
[0021](3)通过判断局部异常因子数值来判断数据点是否为异常数据,进而获得初步清洗异常数据;
[0022]其判断标准为:
[0023]1)LOF
i
(x)接近1,说明x可能和领域点输入同一簇;
[0024]2)LOF
i
(x)<1,说明x的密度就高于其邻域点密度为密集点;
[0025]3)LOF
i
(x)>1,说明x的密度就低于其邻域点密度为异常点。
[0026]而且,所述步骤2的具体步骤包括:
[0027](1)采用最小二乘法对步骤1的清洗后的多能源系统负荷数据和环境监测数据进行数据时间配准,设传感器A1、A2的采样周期分别为T1、T2,传感器A1最近一次监测时刻记作(k

1)T1,当前时刻表示为kT1=[(k

1)T1+nT2],即在传感器A1的一个周期内,传感器A2的数据监测次数为n;
[0028](2)设传感器A1的监测值为y
n
,传感器A2的监测序列为Y
n
=(y1,y2,

,y
n
)
T
,则n个监测值的融合值和其倒数构成的数据集合为处理后的数据为
[0029]y
i
=Y
n
+(i

n)TY
n
+o
i
[0030]式中:o
i
为数据测量过程中出现的噪声值;y
n
为传感器A1的监测值;T为采样周期;Y
n
为传感器A2的检测序列;
[0031](3)将基于传感器A1数据进行的时间配准后,传感器A2数据与测量向量表示为
[0032][0033]式中,T'为融合时间。
[0034]而且,所述步骤3采用KNN算法对步骤2配准后的数据进行数据填补,获得填补后的时序数据集的具体步骤包括:
[0035](1)利用与量测缺失传感器m
i
近邻的传感器历史采集数据进行联合计算,得到量测传感器之间的空间相关性:
[0036]选择出与量测缺失传感器m
i
相关性高的k个传感器,定义传感器m
i
与近邻传感器m
j
的空间相关性系数为:
[0037][0038]式中:R为两个量测传感器间的空间相关性;y
i,t
‑1为传感器m
i
在时刻t

1的量测数据;y
j,t
‑1为传感器m
j
在时刻t

1的量测数据;
[0039](2)基于计算获得的空间相关性系数,计算各传感器相对于量测缺失传感器的填补权重,具体为:
[0040][0041]式中:w
i
为权重系数;R为两个传感器间的空间相关性;
[0042](3)基于KNN算法空间相关性得出利用k个近邻传感器量测数据与相应权重系数,填补量测缺失传感器数据y
i,t
,具体可写为
[0043][0044]式中:为传感器m
i
在时刻t缺失数据的填补结果;
[0045]通过上式,可以得出传感器v
i
在时刻t缺失数据的填补结果。
[004本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种多能源系统多源异构数据融合方法,其特征在于:包括以下步骤:步骤1、采集多能源系统负荷数据和环境监测数据,并清洗异常数据;步骤2、对步骤1的清洗后的多能源系统负荷数据和环境监测数据进行数据时间配准;步骤3、对步骤2配准后的数据进行数据填补,获得更为完整的传感器数据集;步骤4、对步骤3填补后的完整数据集,进行数据降噪;步骤5、对步骤4获得的降噪后多源异构数据进行融合。2.根据权利要求1所述的一种多能源系统多源异构数据融合方法,其特征在于:所述步骤1的具体步骤包括:(1)采集多能源系统的负荷数据和环境监测数据;其中,所述负荷数据包括设备的属性参数和电网的实时运行状态数据;所述环境监测数据包括温度、湿度和振动数据;(2)采用局部异常因子算法,通过给每个所采集的数据都分配一个依赖于相邻区域密度的离群因子的离群程度值,计算每个数据的局部可达密度和局部异常因子;所述数据的局部可达密度ρ
i
(x)和局部异常因子LOF
i
(x)的计算公式为:(x)的计算公式为:式中,N
i
(x)为数据点x的第i距离领域;ρ
i
(x)为局部可达密度;s
i
(x,f
j
)为监测数据x与第j天同期监测数据f
j
的距离;(3)通过判断局部异常因子数值来判断数据点是否为异常数据,进而获得初步清洗异常数据;其判断标准为:1)LOF
i
(x)接近1,说明x可能和领域点输入同一簇;2)LOF
i
(x)<1,说明x的密度就高于其邻域点密度为密集点;3)LOF
i
(x)>1,说明x的密度就低于其邻域点密度为异常点。3.根据权利要求1所述的一种多能源系统多源异构数据融合方法,其特征在于:所述步骤2的具体步骤包括:(1)采用最小二乘法对步骤1的清洗后的多能源系统负荷数据和环境监测数据进行数据时间配准,设传感器A1、A2的采样周期分别为T1、T2,传感器A1最近一次监测时刻记作(k

1)T1,当前时刻表示为kT1=[(k

1)T1+nT2],即在传感器A1的一个周期内,传感器A2的数据监测次数为n;(2)设传感器A1的监测值为y
n
,传感器A2的监测序列为Y
n
=(y1,y2,

,y
n
)
T
,则n个监测值的融合值和其倒数构成的数据集合为处理后的数据为y
i
=Y
n
+(i

n)TY
n
+o
i
式中:o
i
为数据测量过程中出现的噪声值;y
n
为传感器A1的监测值;T为采样周期;Y
n

传感器A2的检测序列;(3)将基于传感器A1数据进行的时间配准后,传感器A2数据与测量向量表示为式中,T'为融合时间。4.根据权利要求1所述的一种多能源系统多源异构数据融合方法,其特征在于:所述步骤3采用KNN算法对步骤2配准后的数据进行数据填补,获得填补后的时序数据集的具体步骤包括:(1)利用与量测缺失传感器m
i
近邻的传感器历史采集数据进行联合计算,得到量测传感器之间的空间相关性:选择出与量测缺失传感器m
i
相关性高的k个传感器,定义传感器m
i
与近邻传感器m
j
的空间相关性系数为:式中:R为两个量测传感器间的空间相关性;y
i,t
‑1为传感器m
i
在时刻t

1的量测数据;y
j,t
‑1为传感器m
j
在时刻t

1的量测数据;(2)基于计算获得的空间相关性系数,计算各传感器相对于量测缺失传感器的填补权重,具体为:式中:w
i
为权重系数;R为两个传感器间的空间相关性;(3)基于KNN算法空间相关性得出利用k个近邻传感器量测数据与相应权重系数,填补量测缺失传...

【专利技术属性】
技术研发人员:赵猛张文斌李野佘家驹田润泽王毅王凯游跃
申请(专利权)人:国家电网有限公司国网天津市电力公司信息通信公司国网绿色能源有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1