当前位置: 首页 > 专利查询>东南大学专利>正文

基于决策树分类的辐照度数据插补方法及系统技术方案

技术编号:26846488 阅读:12 留言:0更新日期:2020-12-25 13:09
本发明专利技术提供了一种基于决策树分类的辐照度缺失数据插补方法及系统,其中方法包括以下步骤:检测缺失的辐照度值;运用决策树分类的方法将数据按天气分类;根据日期、时间、经纬度计算太阳高度角;在不同的天气类别下,根据当前时间、功率和环境温度,运用不同的神经网络参数拟合辐照度序列;插补缺失的辐照度值。本发明专利技术通过决策树的分类保留了天气现象的信息,又在神经网络中加了太阳高度角的输入,保留了日期和时间的信息,因此数据插补效果明显优于其他算法,大大提高了插补的准确度。本发明专利技术有助于填补缺失的辐照度数据,在不降低性能的前提下,解决辐照度、温度、功率时间戳不一致的问题,有助于增加样本数量。

【技术实现步骤摘要】
基于决策树分类的辐照度数据插补方法及系统
本专利技术属于数据处理
,涉及序列预测技术,具体涉及一种基于决策树分类的辐照度缺失数据插补方法及系统。
技术介绍
一般地,在数据预处理时,会挑选各项序列都完整的数据来训练,若存在部分缺失的数据,将会删除整条数据记录,导致丢失了很多数据信息。因此缺失数据的插补问题,备受关注,它不仅可以提高序列完整度,便于后续的数据处理工作,而且可以通过插补,来有效的解决不同类型数据时间戳不一致的问题。然而现有的缺失数据插补方法大多只从单个序列角度出发,挖掘序列的规律信息来插补,导致数据插补的准确度较低,反而会给原始数据带来更多的干扰,难以实际应用。
技术实现思路
为解决上述问题,本专利技术提供一种准确度较高的基于决策树分类的辐照度缺失数据插补方法及系统,满足实际应用需求。为了达到上述目的,本专利技术提供如下技术方案:基于决策树分类的辐照度缺失数据插补方法,包括如下步骤:S1:检测辐照度序列中缺失的辐照度值;S2:将辐照度序列运用决策树的方法分类;S3:根据日期、时间、经纬度计算太阳高度角;S4:根据当前逆变器功率、环境温度、太阳高度角拟合辐照度,不同的决策树类别运用不同的神经网络参数去拟合;S5:运用决策树预测缺失点所属的类别,运用对应的神经网络预测缺失的辐照度值,进行序列插补;S6:输出完整的辐照度序列。进一步的,所述步骤S1包括如下过程:输入一个辐照度序列,检测序列中缺失的辐照度值,列出缺失索引,进行标记;将辐照度完整的部分定为训练数据集,将缺失辐照度的部分定为测试数据集。进一步的,所述步骤S2包括如下过程:对于训练数据集D={(x1,y1),(x2,y2),...,(xN,yN)},其中,N为样本容量,为输入实例,yi∈{1,2,...,K}为类别标签,K为类别数量,特征向量为两维向量,分别是天气现象的种类和温度,定义正则化的极大似然函数为损失函数,生成决策树,再自下而上进行剪枝,完成对训练数据集的分类。进一步的,所述步骤S3包括如下过程:基于以下公式计算太阳高度角其中,为纬度,ω=15HS-180为时角,赤纬角n为一年中的日期序号,HS为北京时间。进一步的,所述步骤S4包括如下过程:在S2得到的不同决策树类别的训练数据集中,用BP神经网络分别去拟合辐照度,BP神经网络的输入为归一化后的逆变器功率、环境温度和太阳高度角正弦值,BP神经网络的输出为归一化后的辐照度值;在不同的决策树类别下,神经网络参数不同。进一步的,所述BP神经网络输入的数值都在0到1之间。进一步的,所述步骤S5包括如下过程:在测试数据集中,先用决策树预测缺失点所属的是哪一类,再运用相应的神经网络模型,预测缺失的辐照度,进行序列插补。进一步的,所述步骤S6包括如下过程:插补完毕后,将归一化后的辐照度插补结果还原成未归一化的正常辐照度值,输出完整的无数据缺失的辐照度序列。基于决策树分类的辐照度缺失数据插补系统,包括缺失辐照度值检测模块、决策树分类模块、太阳高度角计算模块、辐照度拟合模块、缺失辐照度值插补模块、输出模块;所述缺失辐照度值检测模块用于检测辐照度序列中缺失的辐照度值;所述决策树分类模块用于将辐照度序列运用决策树的方法分类;所述太阳高度角计算模块用于根据日期、时间、经纬度计算太阳高度角;所述辐照度拟合模块用于根据当前逆变器功率、环境温度、太阳高度角拟合辐照度,不同的决策树类别运用不同的神经网络参数去拟合;所述缺失辐照度值插补模块用于运用决策树预测缺失点所属的类别,运用对应的神经网络预测缺失的辐照度值,进行序列插补;所述输出模块用于输出完整的辐照度序列。与现有技术相比,本专利技术具有如下优点和有益效果:本专利技术先运用决策树方法,根据天气现象种类和温度的特征,对数据序列进行分类,保留了天气现象的信息;根据日期、时间、经纬度信息计算太阳高度角,在后续步骤中作为神经网络的输入,增广了输入的时间和地理信息;再针对不同的种类,对辐照度序列进行拟合,保证神经网络参数的贴合度;最后在缺失点判断所属类别,运用对应的神经网络预测插补值,提升了算法的准确率,插补效果明显优于其他算法。本专利技术有助于填补缺失的辐照度数据,在不降低性能的前提下,解决辐照度、温度、功率时间戳不一致的问题,有助于增加样本数量。附图说明图1为本专利技术提供的基于决策树分类的辐照度缺失数据插补方法整体流程示意图。具体实施方式以下将结合具体实施例对本专利技术提供的技术方案进行详细说明,应理解下述具体实施方式仅用于说明本专利技术而不用于限制本专利技术的范围。本例基于湖北省巴东县118个电站从2019年7月1日到2020年2月29日的实测数据,包括日期,时间,各个电站的经纬度、海拔,每个逆变器每5分钟的功率、每小时的辐照度、环境温度、风向、风速、天气类别等。针对光伏电站设备通信故障导致辐照度缺失情况描述本专利技术方法。本专利技术提供的基于决策树分类的辐照度缺失数据插补方法,其流程如图1所示,包括如下步骤:S1:检测辐照度序列中缺失的辐照度值,具体包括如下过程:输入一个辐照度序列,检测序列中缺失的辐照度值,列出缺失索引。将辐照度完整的部分定为训练数据集,将缺失辐照度的部分定为测试数据集;S2:将辐照度序列运用决策树的方法分类,具体包括如下过程:对于给定的训练数据集D={(x1,y1),(x2,y2),...,(xN,yN)},N为样本容量,为输入实例,yi∈{1,2,...,K}为类别标签,K为类别数量,特征向量为两维向量,分别是天气现象的种类和温度,定义正则化的极大似然函数为损失函数,生成决策树,再自下而上进行剪枝,完成对训练数据集的分类;S3:根据日期、时间、经纬度计算太阳高度角,具体包括如下过程:本例中,一年中的日期序号为n,赤纬角北京时间为HS,经度为L,纬度为时角为ω=15HS-180,可求得太阳高度角S4:根据当前逆变器功率、环境温度、太阳高度角拟合辐照度,不同的决策树类别运用不同的神经网络参数去拟合,具体包括如下过程:在步骤S2得到的不同决策树类别的训练数据集中,用BP神经网络分别去拟合辐照度,BP神经网络的输入为归一化后的逆变器功率、环境温度和太阳高度角正弦值,输入的数值都在0到1之间,BP神经网络的输出为归一化后的辐照度值。在不同的决策树类别下,神经网络的隐层数量、隐结点数量、学习率等参数不同,以达到最好的拟合效果;S5:运用决策树预测缺失点所属的类别,运用对应的神经网络预测缺失的辐照度值,进行序列插补,具体包括如下过程:在测试数据集中,先用决策树预测缺失点所属的是哪一类,再运用相应的神经网络模型,预测缺失的辐照度,进行序列插补;S6:输出完整的辐照度序列,具体包括如下过程:插补完毕后,将归一化后的辐照度插补结果还原成未归一化的正常辐照度值,输出本文档来自技高网...

【技术保护点】
1.基于决策树分类的辐照度缺失数据插补方法,其特征在于,包括如下步骤:/nS1:检测辐照度序列中缺失的辐照度值;/nS2:将辐照度序列运用决策树的方法分类;/nS3:根据日期、时间、经纬度计算太阳高度角;/nS4:根据当前逆变器功率、环境温度、太阳高度角拟合辐照度,不同的决策树类别运用不同的神经网络参数去拟合;/nS5:运用决策树预测缺失点所属的类别,运用对应的神经网络预测缺失的辐照度值,进行序列插补;/nS6:输出完整的辐照度序列。/n

【技术特征摘要】
1.基于决策树分类的辐照度缺失数据插补方法,其特征在于,包括如下步骤:
S1:检测辐照度序列中缺失的辐照度值;
S2:将辐照度序列运用决策树的方法分类;
S3:根据日期、时间、经纬度计算太阳高度角;
S4:根据当前逆变器功率、环境温度、太阳高度角拟合辐照度,不同的决策树类别运用不同的神经网络参数去拟合;
S5:运用决策树预测缺失点所属的类别,运用对应的神经网络预测缺失的辐照度值,进行序列插补;
S6:输出完整的辐照度序列。


2.根据权利要求1所述的基于决策树分类的辐照度缺失数据插补方法,其特征在于,所述步骤S1包括如下过程:
输入一个辐照度序列,检测序列中缺失的辐照度值,列出缺失索引,进行标记;将辐照度完整的部分定为训练数据集,将缺失辐照度的部分定为测试数据集。


3.根据权利要求1所述的基于决策树分类的辐照度缺失数据插补方法,其特征在于,所述步骤S2包括如下过程:
对于训练数据集D={(x1,y1),(x2,y2),...,(xN,yN)},其中,N为样本容量,为输入实例,yi∈{1,2,...,K}为类别标签,K为类别数量,特征向量为两维向量,分别是天气现象的种类和温度,定义正则化的极大似然函数为损失函数,生成决策树,再自下而上进行剪枝,完成对训练数据集的分类。


4.根据权利要求1所述的基于决策树分类的辐照度缺失数据插补方法,其特征在于,所述步骤S3包括如下过程:
基于以下公式计算太阳高度角



其中,为纬度,ω=15Hs-180为时角,赤纬角n为一年中的日期序号,Hs为北京时间。


5.根据权利要求1所述的基于决策树分类的辐照度缺失数据插补方法,其...

【专利技术属性】
技术研发人员:张侃健陈昕怡刘奕男谢利萍方仕雄张金霞葛健魏海坤
申请(专利权)人:东南大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1