一种电力负荷预测中应用孤立森林算法剔除异常数据处理的方法技术

技术编号：25636964 阅读：40 留言：0更新日期：2020-09-15 21:29

由于实际生产生活中的用电不规律性（例如突发事件造成的用电高峰或低谷，监测系统故障等），经常会出现监测值背离实际情况或者不符合电力预测对象普遍用电规律的情况。在电力负荷预测中纳入这类异常的数值将会大大的降低电力负荷预测模型的训练效果，进而降低电力负荷预测结果的准确性，通过相应的数学统计的方式分析以及处理原始的电力负荷历史数据，保证用于电力负荷预测的负荷历史数据的有效性已经成为电力负荷预测中的一个重要研究课题。本发明专利技术公开了一种电力负荷预测中对历史负荷数据应用孤立森林算法剔除异常数据处理的方法，达到剔除电力系统运行中产生的异常历史电力负荷数据的目的。

全部详细技术资料下载

【技术实现步骤摘要】
一种电力负荷预测中应用孤立森林算法剔除异常数据处理的方法
本专利技术涉及电力负荷预测
，具体涉及一种电力负荷预测中对历史负荷数据中应用孤立森林算法剔除异常数据处理的方法。
技术介绍
电力负荷预测在电力系统运营中起到决定性的作用，对电力负荷的准确预测是保证电力系统安全，经济运行和实现电网科学管理及调度的重要基础,又是电力能源管理系统的核心组成部分，也是今后进行电网商业化运营的前提条件。在电力负荷预测中，指定单位的历史负荷数据通常是进行预测计算，模拟的重要基础数据。电力负荷预测通常会在考虑一些重要的系统运行特性,自然条件下,研究或利用一系列数学方法,找到历史数据之间特有的联系，在满足一定精度的意义下，进而确定未来某特定时刻或某些特定时刻的电力负荷数值。由此可见，电力历史负荷数据在电力负荷预测中十分关键，在电力预测数据分析，预测模型中都会起到重要作用。但是，由于实际生产生活中的用电不规律性（例如突发事件造成的用电高峰或低谷，监测系统故障等），经常会出现监测值背离实际情况或者不符合电力预测对象普遍用电规律的情况。在电力负荷预测中纳入这类异常的数值将会大大的降低电力负荷预测模型的训练效果，进而降低电力负荷预测结果的准确性。通过相应的数学统计的方式分析以及处理原始的电力负荷历史数据，保证用于电力负荷预测的负荷历史数据的有效性已经成为电力负荷预测中的一个重要研究课题。本专利技术公开了一种电力负荷预测中对历史负荷数据应用孤立森林算法剔除异常数据处理的方法，达到剔除电力系统运行中产生的异常历史电力负荷数据的目的。...

【技术保护点】
1.一种电力负荷预测中应用孤立森林算法剔除异常数据处理的方法其特征在于，包括：/n步骤一、数据预处理：对采集到的原始历史电力负荷历史数据按时间序列排列，确定数据集起止时间，检查数据在时间序列上的缺省，标明缺省值并记录缺省的起止时间；/n步骤二、孤立森林算法剔除异常值：将经过步骤1预处理的历史电力负荷数据标注时间戳后输入孤立森林算法模型；/n首先对数据进行单棵树的训练：/n1）从训练数据中随机选择 n个点作为子样本，放入一棵孤立树的根节点；/n2）随机指定一个维度，在当前节点数据范围内，随机产生一个切割点 p —— 切割点产生于当前节点数据中指定维度的最大值与最小值之间；/n3）此切割点的选取生成了一个超平面，将当前节点数据空间切分为2个子空间：把当前所选维度下小于 p 的点放在当前节点的左分支，把大于等于 p 的点放在当前节点的右分支；/n4）在节点的左分支和右分支节点递归步骤 2、3，不断构造新的叶子节点，直到叶子节点上只有一个数据（无法再继续切割）或树已经生长到了所设定的高度；/n图2所示为对子样本进行切割训练的过程，左图的Xi处于密度较高的区域，因此切割了十几次才被分到了单独的...

【技术特征摘要】
1.一种电力负荷预测中应用孤立森林算法剔除异常数据处理的方法其特征在于，包括：
步骤一、数据预处理：对采集到的原始历史电力负荷历史数据按时间序列排列，确定数据集起止时间，检查数据在时间序列上的缺省，标明缺省值并记录缺省的起止时间；
步骤二、孤立森林算法剔除异常值：将经过步骤1预处理的历史电力负荷数据标注时间戳后输入孤立森林算法模型；
首先对数据进行单棵树的训练：
1）从训练数据中随机选择n个点作为子样本，放入一棵孤立树的根节点；
2）随机指定一个维度，在当前节点数据范围内，随机产生一个切割点p——切割点产生于当前节点数据中指定维度的最大值与最小值之间；
3）此切割点的选取生成了一个超平面，将当前节点数据空间切分为2个子空间：把当前所选维度下小于p的点放在当前节点的左分支，把大于等于p的点放在当前节点的右分支；
4）在节点的左分支和右分支节点递归步骤2、3，不断构造新的叶子节点，直到叶子节点上只有一个数据（无法再继续切割）或树已经生长到了所设定的高度；
图2所示为对子样本进行切割训练的过程，左图的Xi处于密度较高的区域，因此切割了十几次才被分到了单独的子空间，而右图的Xo落在边缘分布较稀疏的区域，只经历了四次切分就被“孤立”了；
在对孤立树分别进行计算后再整合全部孤立树的结果，由于切割过程是完全随机的，所以需要用集合的方法来使结果收敛，即反复从头开始切，然后计算每次切分结果的平均值；
在获得t个孤立树后，单棵树的训练就结束了；
接下来就可以用生成的孤立树来评估测试数据了，即计算异常分数s；
对于每个样本x，需要对其综合计算每棵树的结果，通过下面的公式计算异常得分：

h(x)为x在每棵树的高度，c(Ψ)为给定样本数Ψ时路径长度的平均值，用来对样本x的路径长...

【专利技术属性】
技术研发人员：周浩，胡炳谦，顾一峰，韩俊，
申请(专利权)人：上海积成能源科技有限公司，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人