【技术实现步骤摘要】
一种基于不平衡数据集情况的下风机叶片结冰预测方法
本专利技术涉及短期风力发电
,特别是一种基于不平衡数据集情况下的风力发电机叶片结冰预测方法。
技术介绍
风能是一种典型的可再生清洁能源,由于其储量丰富,并且具备大规模开发的条件,因此在全世界范围内受到了广泛地关注。在全球可再生能源发电装机容量中,风力发电占有压倒性优势。在被利用的可再生能源中,风能占了一半以上,而且风力发电也是所有可再生资源利用技术最为成熟的一种。近年来,世界风力发电量高速增长,前景光明。截止到2012年12月,世界风力发电装机容量已经从2000年的60GW增加到了282.578GW。目前,中国是世界上风力发电装机容量最多且发展速度最快的国家。截止到2015年底,我国风力发电总装机容量达到145.1GW,约占我国总装机容量的2.5%,年增长率达到了26.6%。风能在快速发展的同时也面临着突出的问题。随着风力发电机高度的不断增加,风机叶片也由于所处严寒环境而变得根据容易结冰。叶片结冰是风力发电领域的一个全球性难题。低温环境所导致的叶片结冰、材料及结构性能改变、载荷改变的问题等,对风机的发电性能和 ...
【技术保护点】
1.一种基于不平衡数据集情况的下风机叶片结冰预测方法,其特征在于:包括如下步骤:步骤1)对风电场的历史气象数据、风机运行状态数据进行搜集整理,最终将整理好的数据存储在数据库中,方便预测时使用;其中的风电场的历史气象数据以及风机运行状态数据和预测目标可以构成一个风机历史数据训练向量;步骤2)对搜集整理到的风机历史数据训练向量组成的风机历史数据样本进行“极差法”归一化处理,使得处理后的数据更加适合学习模型训练;其中归一化计算公式为:
【技术特征摘要】
1.一种基于不平衡数据集情况的下风机叶片结冰预测方法,其特征在于:包括如下步骤:步骤1)对风电场的历史气象数据、风机运行状态数据进行搜集整理,最终将整理好的数据存储在数据库中,方便预测时使用;其中的风电场的历史气象数据以及风机运行状态数据和预测目标可以构成一个风机历史数据训练向量;步骤2)对搜集整理到的风机历史数据训练向量组成的风机历史数据样本进行“极差法”归一化处理,使得处理后的数据更加适合学习模型训练;其中归一化计算公式为:式中,X表示风机历史数据样本,;Xmin表示风机历史数据样本中的最小值;Xmax表示风机历史数据样本中的最大值;Xnew为处理后的风机历史数据样本;步骤3)根据风机历史数据样本中少数类样本的数据分布状况与不同聚类数目情况下Calinski-HarabaszIndex评分系数大小,所述少数类样本为风机历史数据样本中风机结冰时所对应的数据样本;首先假定了集合中可能的BIRCH聚类数目,后经过Calinski-HarabaszIndex评分系数确定后,获得选择评分系数最高聚类簇数目z;步骤4)将经过“极差法”归一化处理后的数据样本Xnew中的少数类样本,使用BIRCH聚类算法聚为z个聚类簇后,再将聚类结果存储在数据集D={cluster_1,cluster_2,cluster_3,cluster_4,cluster_5,....,cluster_z}中;步骤5)根据密集度公式,计算集合D里各聚类簇中少数类样本点的密集度值;对于样本点密集度公式可以做如下的定义:样本密集度值指某个少数类样本Xorigin与周围K个最近邻同类样本的距离之和Density(Xorigin),即公式可描述为:其中di表示两个样本点之间的欧氏距离,i表示样本Xorigin周围k个最近邻同类样本中的某一个;步骤6)将所有聚类簇中少数类样本点,按照少数类样本点密集度大小进行降序排列;根据排序结果将簇内样本点等分为高浓度、中浓度、低浓度三个浓度区;步骤7)在每个聚类簇中的各个浓度区里,为少数类样本点寻找最近邻的K个少数类样本,对于高浓度区再从少数类样本点寻找到的最近邻的K个少数类样本中选取high_num个少数类样本;对于中浓度区再从少数类样本点寻找到的最近邻的K个少数类样本中选取middle_num个少数类样本;对于低浓度区再从少数类样本点寻找到的最近邻的K个少数类样本中选取low_num个少数类样本;步骤8)使用步骤7)中所选取的high_num、low_num、middle_num个少数类样本,根据如下公式合成新样本;依照如下公式进行合成后,高浓度区中的每个少数类样本可产生high_num个新样本点,对应的中浓度区、低浓度区每个少数类样本分别可获得middle_num和low_num个新样本点;其中,Xnew_1为新生成样本点;Xorigin,i为步骤7)从不同浓度区中选取的少数类样本的第i维特征;Xneighbor,i表示Xorigin,i在步骤7)从不同浓度区中选取的少数类样本中的某个近邻样本点的第i维特征;rand(0,1)表示0到1之间的某一个随机数;步骤9)对少数类样本进行插值操作后可能会引入噪声样本点,所以需要对合成后的数据集去噪;通过识别新生成少...
【专利技术属性】
技术研发人员:岳东,葛阳鸣,卜阳,宋星星,
申请(专利权)人:南京邮电大学,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。