【技术实现步骤摘要】
基于MapReduce框架的分区最大负荷预测方法
本专利技术涉及的是采用计算机技术对于配电网大数据进行处理,属于配电网大数据挖掘与分析领域。
技术介绍
随着国家电网公司建设坚强电网战略目标的提出,智能用电终端和采集终端数量日益扩大,使得各种类型的电力自动化数据出现几何级的增长,呈现出“体量大”、“类型多”、“密度低”和“增速快”的典型大数据特征。在配电网的管理与规划过程中,电力负荷统计指标、电压分析统计指标等一系列数据可以为配电网发策部门提供电力系统规划、设计、调度提供决策的依据。国内已有传统电力系统信息平台的建设大多采用价格昂贵的大型服务器,存储采用磁盘阵列,数据库采用关系数据库系统,业务应用采用紧密耦合的套装软件,导致系统扩展性较差、成本较高,难以适应智能电网对状态监测数据可靠性和实时性的更高要求。2006年Hadoop分布式计算平台发布,2009年,伯克利大学提出和发展了Spark计算平台,在Hadoop分布式计算的基础上,引入了内存计算,使数据计算速度得到10倍乃至100倍的提升。Hadoop大数据处理框架可以很好的解决数据量剧增带来的瓶颈,且具备良好的可 ...
【技术保护点】
1.一种基于MapReduce框架的分区最大负荷预测方法,其特征在于,包括以下步骤:步骤a:搭建大数据分析平台;步骤b:对原始数据进行数据预处理;步骤c:采用交叉点判别法判断配电所在区域;步骤d:求取台区公变与台区专变在一年中的最大负荷;步骤e:采用线性回归模型对台区公变与台区专变的最大负荷分别进行预测,台区最大负荷即为两个预测值之和。
【技术特征摘要】
1.一种基于MapReduce框架的分区最大负荷预测方法,其特征在于,包括以下步骤:步骤a:搭建大数据分析平台;步骤b:对原始数据进行数据预处理;步骤c:采用交叉点判别法判断配电所在区域;步骤d:求取台区公变与台区专变在一年中的最大负荷;步骤e:采用线性回归模型对台区公变与台区专变的最大负荷分别进行预测,台区最大负荷即为两个预测值之和。2.根据权利要求1所述的基于MapReduce框架的分区最大负荷预测方法,其特征在于,步骤a中的大数据分析平台搭建具体如下:1)采用LinuxUbuntu作为操作系统;2)将原始数据存储于Hadoop平台提供的分布式文件系统HDFS,实现数据集的离散化存储和查询;3)数据建表采用Hadoop提供的Hive组件;4)以ApacheHadoop为开发工具,对计算任务进行调度,完成HQL语句与集群上的MapReduce作业的转换;5)分布式计算层采用ApacheSpark,将数据以弹性分布式数据集的形式进行并行化操作。3.根据权利要求1所述的基于MapReduce框架的分区最大负荷预测方法,其特征在于,步骤b中的对数据预处理包括:1)空数据...
【专利技术属性】
技术研发人员:周嘉,李伟伦,贲树俊,黄霆,徐晓轶,吉宇,季晨宇,张乐,张敏,杨鸣,袁健华,叶颖杰,潘海玲,钱天能,钱霜秋,罗云,马骏,吴杰,代克丽,谈永庆,蔡雯雯,
申请(专利权)人:国网江苏省电力有限公司南通供电分公司,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。