一种基于数据挖掘的光伏发电量预测方法技术

技术编号:13183666 阅读:97 留言:0更新日期:2016-05-11 15:15
一种基于数据挖掘的光伏发电量预测方法,本发明专利技术涉及新能源技术领域,它的操作步骤如下:大量收集数据建立数据源;从数据源中提取数据,建立数据仓库,用于存储管理提取出来的数据;对数据仓库中的数据进行ETL处理,建立数据集市,对处理后的数据分类存储;将数据集市中的各类数据和预测的天气环境数据采用聚类分析和关联规则进行处理分析,对这两种方法的结果进行综合分析,得出光伏发电量的预测结果。预测方法简单,预测结果准确性高,对光伏发电量具有更高的预测精度。

【技术实现步骤摘要】

本专利技术涉及新能源
,具体涉及。
技术介绍
随时社会的发展和人们生活水平的不断提高,人们日常的能源需求也越来越大。而传统化石燃料的日益枯竭和环境污染的形势越发严峻,对新能源的开发使用是必然趋势。光伏发电作为新能源的一种,具有安全、不污染环境、无噪声、使用寿命长等特点,在全世界得到快速发展。近几年,我国也建立了很多大规模光伏电站试验示范基地。但光伏发电是间断性的,发电量易受到天气、环境和光伏阵列自身因素影响。随着光伏发电站的规模不断变大,当光伏发电并入大电网时,其具有的间断性威胁着大电网系统的稳定和安全。对于上述问题,有学者开始研究光伏发电量的预测方法,来解决光伏发电间断性给大电网带来的负面影响。准确的预测光伏发电量,有利于协调电力系统的电能调配,减少电力系统运行成本,并且可以将太阳能资源更好的为人类服务。因此,预测光伏发电量具有重要的意义。
技术实现思路
本专利技术的目的在于针对现有技术的缺陷和不足,提供一种设计合理、预测方便的,预测方法简单,预测结果准确性高,对光伏发电量具有更高的预测精度。为实现上述目的,本专利技术采用的技术方案是:它的操作步骤如下:大量收集数据建立数据源;从数据源中提取数据,建立数据仓库,用于存储管理提取出来的数据;对数据仓库中的数据进行ETL处理,建立数据集市,对处理后的数据分类存储;将数据集市中的各类数据和预测的天气环境数据采用聚类分析和关联规则进行处理分析,对这两种方法的结果进行综合分析,得出光伏发电量的预测结果。进一步地,所述的大量收集数据建立数据源,即大量收集影响光伏发电量的所有相关数据和历史发电量数据,这些数据为内部数据;收集实时天气和周围环境数据,这些数据为外部数据,内部数据和外部数据共同构成数据源。进一步地,所述的建立数据仓库,用于存储管理提取出来的数据,即对数据源中的内部数据经行处理,包括清洗、调和、导出、匹配、合并、消除重复,清洗后的数据重新导入内部数据中,建立数据仓库,用于存储管理实时外部数据和处理后的内部数据。进一步地,所述的对数据仓库中的数据进行ETL处理,即数据仓库中的数据经抽取、转换、加载。进一步地,所述的将数据集市中的各类数据和预测的天气环境数据采用聚类分析和关联规则进行处理分析,即对于数据集市中存储的各类数据和预测的天气环境数据,采用聚类分析和关联规则进行处理分析。进一步地,所述的聚类分析,即采用连续型属性的相似度计算方法,首先,用欧氏距离作为数据样本间的相似性度量,然后,用k-means聚类算法使用误差平方和准则函数来评价聚类性能;最后,选择一个初始分类,通过迭代法得到聚类结果。进一步地,所述的关联规则,S卩采用FP-growth算法来挖掘数据集市中的频繁集,根据各类数据建立一棵FP-tree,利用建立的FP-tree产生频繁集。本专利技术的工作原理:基于数据挖掘的方法,收集大量数据,将处理后的数据建立成数据仓库;对数据仓库中的数据按照影响发电量因素进行分类处理,建立数据集市;利用数据挖掘的经典算法聚类分析和关联规则进行数据分析,结合数据集市的各类数据和预测的天气环境数据,分析数据间的相似度和相互影响关系,得出光伏发电量的预测结果。采用上述结构后,本专利技术有益效果为:本专利技术所述的,预测方法简单,预测结果准确性高,对光伏发电量具有更高的预测精度。【附图说明】为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术的工作流程图。【具体实施方式】下面结合附图,对本专利技术作进一步的说明。参看图1所示,本【具体实施方式】采用的技术方案是: 1、大量收集光伏发电量预测所需数据,构成数据源,并分为内部数据和外部数据。内部数据为历史环境数据和历史发电量数据,内部数据从全国各个太阳能光伏电站试验示范基地和世界气象组织太阳辐射基准(BSRN)站获取。外部数据为实时天气环境数据,主要来自环境参考测试仪,预测的天气环境数据主要来自天气预报和气象站; 2、建立数据仓库,用于存储管理实时外部数据和处理后的内部数据,对于内部数据的处理方式有清洗、调和、导出、匹配、合并和消除重复。处理后的内部数据重新返回到数据源中,作为数据源数据的更新; 3、对数据仓库中的数据进行ETL处理,建立数据集市,数据集市分类存储所有影响光伏发电量的数据,数据集市包含不同主题,太阳辐射量、光伏组件角度、光伏组件效率、光伏组件组合损失、光伏组件温度特性、灰尘损失、MPPT效率、线路损失、控制器逆变器效率、蓄电池效率等。将数据详细分类有利于快速查找数据、对比数据; 4、抽取数据集市中各类数据和预测的天气环境数据,用聚类分析和关联规则进行处理分析,聚类分析可以计算同一数据类之间的相似度,关联规则可以发现所有数据间相互影响的关系; 5、聚类分析计算步骤为,先用欧氏距离作为数据样本间的相似性度量;然后用k-means聚类算法使用误差平方和准则函数来评价聚类性能;最后选择一个初始分类,通过迭代法得到聚类结果。关联规则步骤为,采用FP-growth算法来挖掘数据集市中的频繁集。根据各类数据建立一棵FP-tree,利用建立的FP-tree产生频繁集。6、利用聚类分析和关联规则,将未来几小时或几天的天气、环境数据与历史数据进行分析对比,得出数据间的相似度和相互影响关系,根据分析的结果来预测光伏发电量。本【具体实施方式】的工作原理:基于数据挖掘的方法,收集大量数据,将处理后的数据建立成数据仓库;对数据仓库中的数据按照影响发电量因素进行分类处理,建立数据集市;利用数据挖掘的经典算法聚类分析和关联规则进行数据分析,结合数据集市的各类数据和预测的天气环境数据,分析数据间的相似度和相互影响关系,得出光伏发电量的预测结果。采用上述结构后,本【具体实施方式】有益效果为:本【具体实施方式】所述的,预测方法简单,预测结果准确性高,对光伏发电量具有更高的预测精度。以上所述,仅用以说明本专利技术的技术方案而非限制,本领域普通技术人员对本专利技术的技术方案所做的其它修改或者等同替换,只要不脱离本专利技术技术方案的精神和范围,均应涵盖在本专利技术的权利要求范围当中。【主权项】1.,其特征在于:它的操作步骤如下:大量收集数据建立数据源;从数据源中提取数据,建立数据仓库,用于存储管理提取出来的数据;对数据仓库中的数据进行ETL处理,建立数据集市,对处理后的数据分类存储;将数据集市中的各类数据和预测的天气环境数据采用聚类分析和关联规则进行处理分析,对这两种方法的结果进行综合分析,得出光伏发电量的预测结果。2.根据权利要求1所述的,其特征在于:所述的大量收集数据建立数据源,即大量收集影响光伏发电量的所有相关数据和历史发电量数据,这些数据为内部数据;收集实时天气和周围环境数据,这些数据为外部数据,内部数据和外部数据共同构成数据源。3.根据权利要求1所述的,其特征在于:所述的建立数据仓库,用于存储管理提取出来的数据,即对数据源中的内部数据经行处理,包括清洗、调和、导出、匹配、合并、消除重复,清洗后的数据重新导入内部数据中,建立数据仓库,用本文档来自技高网...

【技术保护点】
一种基于数据挖掘的光伏发电量预测方法,其特征在于:它的操作步骤如下:大量收集数据建立数据源;从数据源中提取数据,建立数据仓库,用于存储管理提取出来的数据;对数据仓库中的数据进行ETL处理,建立数据集市,对处理后的数据分类存储;将数据集市中的各类数据和预测的天气环境数据采用聚类分析和关联规则进行处理分析,对这两种方法的结果进行综合分析,得出光伏发电量的预测结果。

【技术特征摘要】

【专利技术属性】
技术研发人员:葛愿葛宜然
申请(专利权)人:安徽工程大学
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1