基于贝叶斯高斯张量分解模型的用电数据修复方法及系统技术方案

技术编号:38573699 阅读:14 留言:0更新日期:2023-08-22 21:07
本发明专利技术属于数据修复领域,公开了一种基于贝叶斯高斯张量分解模型的用电数据修复方法及系统,收集天气、节假日、星期类型和用电量数据,构建成天气因子、节假日因子和星期因子,根据天气因子、节假日因子和星期因子构建相似度目标函数;使用野马优化算法对相似度目标函数进行寻优,在历史日中查找到与修复日相似度最高的M个相似日;以相似度最高的M个相似日的用电量数据构成三阶张量,将三阶张量输入到贝叶斯高斯张量分解模型中进行数据修复。本发明专利技术采用改进的野马优化算法选择相似日,输入贝叶斯高斯张量分解模型中对残缺数据进行修复,提升了修复准确率,以提高数据质量,达到提升预测等行为的精确性。等行为的精确性。等行为的精确性。

【技术实现步骤摘要】
基于贝叶斯高斯张量分解模型的用电数据修复方法及系统


[0001]本专利技术涉及数据修复
,具体涉及一种基于贝叶斯高斯张量分解模型的用电数据修复方法及系统。

技术介绍

[0002]随着电力系统信息化程度的提高和智能电网的加速建设,用户电力数据量呈指数型增长状态。为了更好地服务用户以及维持国民经济的可持续发展,对配用电大数据中海量用户用电行为的分析和挖掘具有越来越重要的意义,同时海量电力用户所产生的负荷大数据也对数据修复技术提出了更加严峻的挑战。
[0003]当前,用电信息采集系统可为多种业务提供数据支撑。但由于采集设备故障、通信信道不稳定以及外界干扰等原因,往往会出现用电信息采集系统采集到存在数据缺失的电量数据,这会造成基于电量数据的各种应用分析失去准确性甚至无法进行。因此,必须对存在数据缺失的电量数据进行修复。

技术实现思路

[0004]本专利技术的目的在于提供一种基于贝叶斯高斯张量分解模型的用电数据修复方法及系统,收集天气、节假日、星期类型和用电量数据,将选取的天气因素运用灰色关联度构建成天气因子,根据是否是节假日构建节假日因子,根据星期类型构建星期因子,然后构建相似度目标函数。使用改进后的野马优化算法对构建的目标函数进行寻优,从而再大量历史数据中找到相似度最高的相似日,将相似日的数据输入进贝叶斯高斯张量分解模型进行残缺数据修复。本专利技术采用改进的野马优化算法选择相似日,输入贝叶斯高斯张量分解模型中对残缺数据进行修复,提升修复数据准确率,以提高数据质量,提高预测精确性。
[0005]为了实现上述目的,本专利技术采用的技术方案是:基于贝叶斯高斯张量分解模型的用电数据修复方法,包括以下步骤:步骤1:收集修复日和历史日的天气数据、是否是节假日和星期类型数据,并且收集残缺数据电表和相邻两个电表修复日和历史日的用电量数据;步骤2:对收集到的天气数据进行归一化处理,得到归一化天气数据;步骤3:将归一化天气数据运用灰色关联度构建成天气因子,根据是否是节假日构建节假日因子,根据星期类型构建星期因子,根据天气因子、节假日因子和星期因子构建相似度目标函数;使用野马优化算法对相似度目标函数进行寻优,在历史日中查找到与修复日相似度最高的M个相似日;步骤4:以相似度最高的M个相似日的用电量数据构成三阶张量,将三阶张量输入到贝叶斯高斯张量分解模型中进行数据修复。
[0006]进一步优选,将修复日的归一化天气数据作为母序列,历史日的归一化天气数据作为子序列进行灰色关联度计算:
;式中,为分辨系数,为修复日的第k类归一化天气数据;为第n个历史日的第k类归一化天气数据;为第n个历史日与修复日的第k类归一化天气数据之间的灰色关联度;将第n个历史日与修复日的各类归一化天气数据之间的灰色关联度相加,得到第n个历史日的天气因子,公式如下:,K为天气数据类别总数。
[0007]进一步优选,节假日因子构建方式如下:;;式中,为第n个历史日的节假日因子,为第n个历史日与修复日的关联系数,q为修复日与第n个历史日相隔的天数;mod为取余函数;为历史日与修复日是否所处同一个节假日或者非节假日的衰减系数,;为历史日和修复日相隔每增加一天的日衰减系数,;为全年的天数。
[0008]进一步优选,所述星期因子的构建方式如下:;式中,为第n个历史日的星期因子,,为星期衰减系数,为比例系数用来根据每个地区工作日和休息日用电量不同调整比例系数,t1为修复日星期数,t2为相似日的星期数。
[0009]进一步优选,所述相似度目标函数为:;式中,为第n个历史日与修复日的相似度,为天气因子的权重系数,为节假日因子的权重系数,为星期因子的权重系数。
[0010]进一步优选,所述野马优化算法流程如下:步骤3.5.1:创建初始种群:;
;式中:为搜索空间中候选解的总数,即为野马的总数,d为决策变量总数, 为第个候选解,为第个候选解的第个决策变量,i=1,2,

,N;j=1,2,

,d; 是第个候选解的第个决策变量的最小边界,是第个候选解的第个决策变量的最大边界;是一个均匀分布的随机数;将初始种群分为几个小组,分组数为G=[N
×
PS],其中PS是种马在种群中的百分比,将其视为野马算法的控制参数,根据种群的数量,得到G个领导者,剩下的N

G个成员平均分配,在初始时随机选取各组的领导者,在后续阶段,根据成员之间的适应度选择领导者;步骤3.5.2:放牧行为:种群成员在以领导者为圆心进行中心搜索,其表达式为:;式中:为成员更新后的位置,为领导者位置,第个候选解处于初始位置,为取值[

2,2]之间的随机数,用来控制成员与领导者的角度,为自适应机制;;式中:是由0和1组成的向量,和为[0,1]空间内均匀分布的随机向量;为取值[0,1]之间的随机数,为索引,表示二进制取反;满足条件的随机向量返回索引;为自适应因子;;式中:t为迭代次数, 为最大迭代次数;步骤3.5.3:野马交配:离开第u个小组的野马和离开v组的野马分别加入了一个临时组,进入青春期后进行交叉;交叉后对野马子代位置进行更新;;;;;式中:表示下一代野马的位置,表示第u个小组内的小野马g的当前位置,
表示第v个小组内的小野马的当前位置,为交叉函数,
ꢀꢀ
表示父代的位置,表示母代的位置,表示全局最优个体的位置,表示父代和传给子代基因的权重比,表示母代传给子代基因的权重比;步骤3.5.4:团队领导:领导者的位置更新公式为:,式中:为第u个小组领导者更新后的位置,表示最优个体位置;步骤3.5.5:领导者选拔:,式中:为适应的函数,出现的领导者即为最优解。进一步优选,所述三阶张量是由三片矩阵构成,第一片矩阵为:;式中,N
u
为每天的采样点数,表示待修复数据的电表修复日当天的第1个采样点用电量数据,表示第M个相似日的待修复数据电表的第1个采样点用电量数据,表示待修复数据的电表修复日当天的第N
u
个采样点用电量数据,表示第M个相似日的待修复数据电表的第N
u
个采样点用电量数据,在到之间存在点缺失数据;第二片矩阵为:;式中,表示待修复数据电表的相邻电表a修复日当天的第1个采样点用电量数据,表示第M个相似日的待修复数据电表的相邻电表a的第1个采样点用电量数据,表示待修复数据电表的相邻电表a修复日当天的第N
u
个采样点用电量数据,表示第M个相似日的待修复数据电表的相邻电表a的第N
u
个采样点用电量数据;第三片矩阵为:;式中,表示待修复数据电表的相邻电表c修复日当天的第1个采样点用电量数据,表示第M个相似日的待修复数据电表的相邻电表c的第1个采样点用电量数据,表示待修复数据电表的相邻电表c修复日当天的第N
u
个采样点用电量数据,示
为第M个相似日的待修复数据电表的相邻电表c的第N
u
个采样点用电量数据。
[0011]进一步优选,所述天气数据包括最高气温、最低本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于贝叶斯高斯张量分解模型的用电数据修复方法,其特征在于,包括以下步骤:步骤1:收集修复日和历史日的天气数据、是否是节假日和星期类型数据,并且收集残缺数据电表和相邻两个电表修复日和历史日的用电量数据;步骤2:对收集到的天气数据进行归一化处理,得到归一化天气数据;步骤3:将归一化天气数据运用灰色关联度构建成天气因子,根据是否是节假日构建节假日因子,根据星期类型构建星期因子,根据天气因子、节假日因子和星期因子构建相似度目标函数;使用野马优化算法对相似度目标函数进行寻优,在历史日中查找到与修复日相似度最高的M个相似日;步骤4:以相似度最高的M个相似日的用电量数据构成三阶张量,将三阶张量输入到贝叶斯高斯张量分解模型中进行数据修复。2.根据权利要求1所述的基于贝叶斯高斯张量分解模型的用电数据修复方法,其特征在于,将修复日的归一化天气数据作为母序列,历史日的归一化天气数据作为子序列进行灰色关联度计算:;式中,为分辨系数,为修复日的第k类归一化天气数据;为第n个历史日的第k类归一化天气数据;为第n个历史日与修复日的第k类归一化天气数据之间的灰色关联度;将第n个历史日与修复日的各类归一化天气数据之间的灰色关联度相加,得到第n个历史日的天气因子,公式如下:,K为天气数据类别总数。3.根据权利要求2所述的基于贝叶斯高斯张量分解模型的用电数据修复方法,其特征在于,节假日因子构建方式如下:;;式中,为第n个历史日的节假日因子,为第n个历史日与修复日的关联系数,q为修复日与第n个历史日相隔的天数;mod为取余函数;为历史日与修复日是否所处同一个节假日或者非节假日的衰减系数;为历史日和修复日相隔每增加一天的日衰减系数;为全年的天数。4.根据权利要求3所述的基于贝叶斯高斯张量分解模型的用电数据修复方法,其特征在于,所述星期因子的构建方式如下:;式中,为第n个历史日的星期因子,为星期衰减系数,为比例系数用来根据每个地
区工作日和休息日用电量不同调整比例系数,t1为修复日星期数,t2为相似日的星期数。5.根据权利要求4所述的基于贝叶斯高斯张量分解模型的用电数据修复方法,其特征在于,所述相似度目标函数为:;式中,为第n个历史日与修复日的相似度,为天气因子的权重系数,为节假日因子的权重系数,为星期因子的权重系数。6.根据权利要求1所述的基于贝叶斯高斯张量分解模型的用电数据修复方法,其特征在于,所述野马优化算法流程如下:步骤3.5.1:创建初始种群:;;式中:为搜索空间中候选解的总数,即为野马的总数,d为决策变量总数,为第个候选解,为第个候选解的第个决策变量,i=1,2,

,N;j=1,2,

,d; 是第个候选解的第个决策变量的最小边界,是第个候选解的第个决策变量的最大边界;是一个均匀分布的随机数;将初始种群分为几个小组,分组数为G=[N
×
PS],其中PS是种马在种群中的百分比,将其视为野马算法的控制参数,根据种群的数量,得到G个领导者,剩下的N

G个成员平均分配,在初始时随机选取各组的领导者,在后续阶段,根据成员之间的适应度选择领导者;步骤3.5.2:放牧行为:种群成员在以领导者为圆心进行中心搜索,其表达式为:;式中:为成员更新后的位置,为领导者位置,第个候选解处于初始位置,为取值[

【专利技术属性】
技术研发人员:王宗耀屈浏强许志浩丁贵立康兵张兴旺单惠敏范师尧
申请(专利权)人:江西博微新技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1