一种面向电力系统重过载预警的大数据分析方法技术方案

技术编号:13013478 阅读:106 留言:0更新日期:2016-03-16 10:44
本发明专利技术涉及一种面向电力系统重过载预警的大数据分析方法,包括:对历史电力负荷数据进行预处理;提取预处理后的历史电力负荷数据D中与负荷属性关联性强的属性集合,建立包含负荷属性数据和与负荷属性关联性强的属性集合数据集D′;利用聚类方法将数据集D分为正常运行数据类、重载数据类和过载数据类;根据数据集D构建电力负荷数据预测模型,预测变压器的重载概率和过载概率;本发明专利技术提供的方法利用历史负载数据,天气数据及其他外部数据,对特定时期区域下属各台区在特定时间段的负荷重过载概率进行预测,从而优化配置在此时期的配电网检测、检修等人力和物质资源,以提高系统运行的安全稳定性,并减少电网工作人员的劳动强度。

【技术实现步骤摘要】

本专利技术涉及电力负荷预测
,具体涉及一种面向电力系统重过载预警的大 数据分析方法。
技术介绍
电力负荷有两方面的含义:一方面是指电力工业的服务对象,包括使用电力的部 门、机关、企事业单位、工厂、农村、车间、学校以及各种各样的用电设备;另一方面是指上述 各用电单位、用电部门或用电设备使用电力和电量的具体数量。电力负荷预测中的负荷概 念是指国民经济整体或部门或地区对电力和电量消费的历史情况及未来的变化发展趋势。 负荷预测是根据系统的运行特性、增容决策、自然条件与社会影响等诸多因数,在 满足一定精度要求的条件下,确定未来某特定时刻的负荷数据,其中负荷是指电力需求量 (功率)或用电量;负荷预测是电力系统经济调度中的一项重要内容。 目前,对负荷特性的现状、影响负荷特性的主要因素和未来负荷特性的变化趋势 等都进行了系统的分析和研究,得出了一些对电力规划和电网运行有指导意义和参考价值 的结论,但缺乏对影响负荷的相关因素分析。限于过去的条件,在绝大多数系统中没有考虑 气象、温度等因素对负荷的影响,预测精度不高。
技术实现思路
针对现有技术的不足,本专利技术提供一种面向电力系统重过载预警的大数据分析方 法,利用区域内所有变压器的历史负载数据,本地区的天气数据及其他外部数据,对特定时 期区域下属各台区在特定时间段的负荷重过载概率进行预测,从而优化配置在此时期的配 电网检测、检修等人力和物质资源,以提高系统运行的安全稳定性,并减少电网工作人员的 劳动强度。 本专利技术的目的是采用下述技术方案实现的: -种面向电力系统重过载预警的大数据分析方法,其改进之处在于,包括: (1)对历史电力负荷数据进行预处理; (2)对预处理后的所述历史电力负荷数据D进行关联规则挖掘,提取与负荷属性 关联性强的属性集合,建立包含所述负荷属性数据和与负荷属性关联性强的属性集合数据 集D,; (3)利用聚类方法将所述数据集D分为正常运行数据类、重载数据类和过载数据 类; (4)根据所述数据集D构建电力负荷数据预测模型,预测变压器的重载概率和过 载概率。 优选的,所述步骤(1)包括: (1-1)对所述历史电力负荷数据进行匿名化处理; (1-2)采用K近邻填补算法对数值型数据缺失值进行填补; (1-3)对所述历史电力负荷数据对应的天气数据进行处理; (1-4)获取所述历史电力负荷数据的负荷值,并根据所述负荷值将所述历史电力 负荷数据分为正常、重载和过载三类。 进一步的,所述步骤(1-1)中,采用混合K-匿名对所述历史电力负荷数据进行匿 名化处理,包括: 令攻击者的背景知识包括:目标客户地址及目标客户至多m个受电点,以客户作 为顶点,客户地址作为顶点属性,建立复合超图,其中,顶点包含 所述客户的受电点集合,超边的标签为所述客户的受电点集合S的全部大小为min{m,|S|} 的子集; 将所述复合超图中秩小于k的超边进行合并,直至所述复合超图中超边的秩均大 于或等于k; 将所述复合超图中顶点属性进行泛化,直至所述复合超图每个连通量中顶点属性 相同。 进一步的,所述步骤(1-2)中,将所述历史电力负荷数据的数据表中的空缺位置 进行数据填充,填充内容为所述空缺位置列临近的k个邻居的众数或平均值。 进一步的,所述步骤(1-3)中,将每天t时间段内所述历史电力负荷数据对应的天 气温度求平均值作为温度基准值,采用温度基准值+温度变化率作为所述历史电力负荷数 据的属性。 进一步的,所述步骤(1-4)中,确定所述历史电力负荷数据第i时的负荷值Pi,公 式为:式⑴中,ie,Pi'为所述历史电力负荷数据第i时的视在功率值,P为 变压器容量;若max{PJe(〇, 80],则所述历史电力负荷数据为正常运行数据; 若max{PJe(80, 100],则所述历史电力负荷数据为重载数据; 若max{PJe[100,+①),则所述历史电力负荷数据为过载数据。 优选的,所述步骤(2)中,输入所述预处理后的历史电力负荷数据D作为事务集, A和B分别为两个互斥的项集,其中,A为所述历史电力负荷数据中除负荷属性数据外的属 性集合,B为所述历史电力负荷数据中负荷属性,设定支持度最小阈值min_supp,设定置信 度最小阈值min_conf,确定项集A与项集B的支持度support(A二B),公式为: 式(2)中,P(AUB)为事务集D中既包含项集A又包含项集B的实例所占的百分 比;确定项集A与项集B的置信度confidcncc(A,公式为:式(3)中,P(B|A)为事务集D中包含项集A也包含项集B的实例所占的百分比; 确定项集A与项集B的提升度///h:.4 =>Z?),公式为: 式(4)中,P⑶为事务集D中包含项集B的实例所占的百分比; 根据/興』竭对所述历史电力负荷数据中挖掘到的规则进行排序,设定阈值e, 提取/说(Jk的规则包含的属性数据和负荷属性数据建立所述数据集D'。 优选的,所述步骤(3)中,调用DBSCAN算法,输入所述数据集D',具体包括: (3-1)设置扫描半径d和最小包含点数min_pts,选择任意核心点,其中,核心点为 满足扫描半径d内指定数据样本数大于min_pts的对象; (3-2)获取从所述核心点出发的所有密度相连的负荷样本; (3-3)遍历所述核心点在扫描半径d内的全部核心点样本,并获取所述全部核心 点样本密度相连的负荷样本,形成聚类。 优选的,所述步骤(4)中,调用随机森林算法,输入所述数据集D'构造电力负荷 预测模型,其中,以所述数据集D'为根节点构造分类决策树,叶子节点为模型决策的类别, 所述分类决策树中的分支选择根据下述公式:GINI(s,t) =pLGINI(tL) +pRGINI(tR) (5) 式(5)中,t为当前节点分支的属性,s为当前节点分支的属性值,队为节点t以S 为切分点生成的左子树中的样例占当前节点样例的比例,PR为节点t以s为切分点生成的 右子树中的样例占当前节点样例的比例,GINI(tj为节点t以s为切分点生成的左子树的 基尼指数,GINI(tR)为节点t以s为切分点生成的右子树的基尼指数,其中,所述基尼指数 GINI(t)的公式为: 式(6)中,p(j/t)为目标类别j在节点t出现的比例,j取值为0/1/2,分别表示 正常运行/重载/过载; 选择使GINI(s,t)值最小的t和s对当前节点进行分裂,生成所述分类决策树。 与最接近的现有技术相比,本专利技术具有的有益效果: 本专利技术提供的,采用匿名化方 法,在保证数据安全性的同时最大限度保障数据的可用性,数据质量控制方法采用混合质 量评价模型,使数据质量具有高度可信性、可用性。 本专利技术提供的,,采用频繁项集 找不小于最小支持度和最小置信度的强关联规则,提取挖掘到的属性作为对负荷影响较大 的属性,解决电力大数据候选属性过多的问题,最大程度提高算法效率。 本专利技术提供的,采用随机森林方 法用于建模,对大数据有良好的可扩展性,能够解决大数据的快速处理问题,又防止电力系 统中正样本较少时过拟合发生,针对大数据环境下的电力负荷预测有较好的应用前景。【附图说明】图1是本专利技术提供的流程图; 图2是本专利技术实施例中用户与受电点的二分图; 图3是本专利技术实施例中用户与受电点的复合超图;图本文档来自技高网...

【技术保护点】
一种面向电力系统重过载预警的大数据分析方法,其特征在于,包括步骤:(1)对历史电力负荷数据进行预处理;(2)对预处理后的所述历史电力负荷数据D进行关联规则挖掘,提取与负荷属性关联性强的属性集合,建立包含所述负荷属性数据和与负荷属性关联性强的属性集合数据集D′;(3)利用聚类方法将所述数据集D分为正常运行数据类、重载数据类和过载数据类;(4)根据所述数据集D构建电力负荷数据预测模型,预测变压器的重载概率和过载概率。

【技术特征摘要】

【专利技术属性】
技术研发人员:王继业朱朝阳张东霞邓春宇王晓蓉贾育培李浥东季知祥张磊张涛贺简章王海波李慧芳
申请(专利权)人:中国电力科学研究院国家电网公司北京交通大学国网山东省电力公司电力科学研究院
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1