一种基于元学习的分布式发电孤岛检测方法技术

技术编号:10022183 阅读:140 留言:0更新日期:2014-05-09 04:09
本发明专利技术涉及一种基于元学习的分布式发电孤岛检测方法,包括以下步骤:1)采用RELIEF算法识别孤岛检测的关键特征,得到关键特征集合;2)多个基学习器对原始关键特征集合进行分类预测;3)将多个基学习器的分类结果作为特征项加入训练集中,生成新的样本集合T;4)元学习器以样本T作为训练集,对基学习器的分类结果进行再学习,得到最终的检测结果。与现有技术相比,本发明专利技术解决了样本中的弱相关特征会降低分类算法的精度和导致过度拟合问题,具有适应性好、检测精度高等优点。

【技术实现步骤摘要】
【专利摘要】本专利技术涉及,包括以下步骤:1)采用RELIEF算法识别孤岛检测的关键特征,得到关键特征集合;2)多个基学习器对原始关键特征集合进行分类预测;3)将多个基学习器的分类结果作为特征项加入训练集中,生成新的样本集合T;4)元学习器以样本T作为训练集,对基学习器的分类结果进行再学习,得到最终的检测结果。与现有技术相比,本专利技术解决了样本中的弱相关特征会降低分类算法的精度和导致过度拟合问题,具有适应性好、检测精度高等优点。【专利说明】—种基于元学习的分布式发电孤岛检测方法
本专利技术涉及一种分布式发电技术,尤其是涉及。
技术介绍
将大量分布式发电(distributed generation,DG)以友好的方式接入系统是智能电网的重要特征。无论从系统运行、人员设备安全还是电能质量角度,都要求分布式发电具备孤岛检测功能。现有孤岛检测方法主要包括被动检测法、主动检测法、开关状态检测法等3类。开关状态检测法依赖于实时通信技术,存在可靠性、费用等问题,所以目前对孤岛检测的研究兴趣主要集中在被动或主动检测方面。较之于继电保护,孤岛检测保护的各种检测阈值往往缺乏明确的整定公式,使得检测阈值的确定存在经验性和盲目性。近年来,研究者注意到可以利用机器学习中的分类算法解决上述问题并取得了良好效果。分布式电源的出力存在波动性,含分布式电源的配网的运行方式存在多样性。由于分类算法属于一种有监督学习算法,所以其难点主要在于如何提高算法的分类精度和泛化能力,从应用的角度,就是如何提高算法对未知实例的适应性。
技术实现思路
本专利技术的目的就是为了克服上述现有技术存在的缺陷而提供一种解决了样本中的弱相关特征会降低分类算法的精度和导致过度拟合问题、适应性好、检测精度高的基于元学习的分布式发电孤岛检测方法。本专利技术的目的可以通过以下技术方案来实现:,其特征在于,包括以下步骤:1)采用RELIEF算法识别孤岛检测的关键特征,得到关键特征集合;2)多个基学习器对原始关键特征集合进行分类预测;3)将多个基学习器的分类结果作为特征项加入训练集中,生成新的样本集合T ;4)元学习器以样本T作为训练集,对基学习器的分类结果进行再学习,得到最终的检测结果。所述的采用RELIEF算法识别孤岛检测的关键特征具体步骤如下:101)给定样本集合 E= Kxi, y)} (i = 1,…n),其特征集合为 A(x) = {a(j)} (j=I,…d);102)对各特征的值做归一化处理,设定各特征的初始权重ωj=O ;对集合E的采样次数为η ;103)随机从E中选取一个样本(Xi,yi),其中i = 1,...n;104)找出与样本(X,y)欧式距离最近的同类样本H(X)和异类样本M(X);105) ω j = ω , | x(J)-M(J) (x) | -1 x(J)-H(J) (x) |,其中 j = 1,...d ;106)选择权重大于设定阈值的特征作为关键特征集合。所述的基学习器的个数为K个,所述的新的样本集合T = (Xi, C1 (Xi),C2 (Xi),..., Ck(X1),C(Xi) | Xi e E}其中原始样本集合E= ((X^yi)I (i = I,...n) ,Ck 为基学习器,k = I,...KjC(Xi)表示Xi的类别标签,即真实分类Yi,而用Ck(Xi)表示基学习器Ck对Xi的分类结果,公式中前面d列为基学习器的特征,从d+Ι列到d+K列为由K个基学习器的分类结果构成的特征,最后一列为类别标签。所述的基学习器包括C4.5、CART和SVM三种分类算法的学习器。所述的元学习器为SVM分类算法的学习器。与现有技术相比,本专利技术具有以下优点:1、解决了样本中的弱相关特征会降低分类算法的精度和导致过度拟合问题,提出利用RELIEF算法识别孤岛检测的关键特征,该算法独立于所选用的分类器,且适应于各种孤岛检测问题。2、适应性好,利用多个基学习器之间的互补性以及元学习器的再学习能力来提高整体分类的适应性;3、检测精度高,元学习器并不从各个基学习器中挑选最佳学习器,而是对基学习器的结果进行“再学习”,对基学习器错误的分类进行纠正,而对正确的分类加以巩固。这样,元学习器的分类精度就不限于最佳的基学习器,而是优于所有基学习器。【专利附图】【附图说明】图1为元学习系统结构示意图;`图2为含多个DG的配网系统示意图;图3为关键特征组合的基学习器特征散点图;图4为非关键特征组合的基学习器特征散点图; 图5为CART决策树示意图;图6为C4.5决策树示意图;图7为不同功率不平衡度(PI)下C4.5交叉分类的准确率曲线图;图8为本专利技术的流程图。【具体实施方式】下面结合附图和具体实施例对本专利技术进行详细说明。如图8所示,,包括以下步骤:S100、采用RELIEF算法识别孤岛检测的关键特征,得到关键特征集合;S200、多个基学习器对原始关键特征集合进行分类预测;S300、将多个基学习器的分类结果作为特征项加入训练集中,生成新的样本集合T ;S400、元学习器以样本T作为训练集,对基学习器的分类结果进行再学习,得到最终的检测结果。1、特征选择方法1.1特征判据设E = Kxi, Yi)! (i = I,...η)为训练样本集合,η为样本总数,(Xi, Yi)为一个样本实例。其中【权利要求】1.,其特征在于,包括以下步骤: 1)采用RELIEF算法识别孤岛检测的关键特征,得到关键特征集合; 2)多个基学习器对原始关键特征集合进行分类预测; 3)将多个基学习器的分类结果作为特征项加入训练集中,生成新的样本集合T; 4)元学习器以样本T作为训练集,对基学习器的分类结果进行再学习,得到最终的检测结果。2.根据权利要求1所述的,其特征在于,所述的采用RELIEF算法识别孤岛检测的关键特征具体步骤如下: 101)给定样本集合E = Kxi, Yi)} (i = I,...η),其特征集合为 A(x) = {a(j)} (j =I,...d); 102)对各特征的值做归一化处理,设定各特征的初始权重ω」=0 ;对集合E的采样次数为η ; 103)随机从E中选取一个样本(Xi,Yi),其中i = I,...η ; 104)找出与样本(x,y)欧式距离最近的同类样本H(X)和异类样本M(X); 105)ω j = ω ^ | x(J)-M(J) (x) | -1 x(J)-H(J) (x) |,其中 j = 1,...d ; 106)选择权重大于设定阈值的特征作为关键特征集合。3.根据权利要求2所述的,其特征在于,所述的基学习器的个数为K个,所述的新的样本集合 T= (Xi,C1 (Xi),C2 (Xi),...,Ck (Xi),C (Xi) I Xi e E} 其中原始样本集合E = Kx^yiM (i = I,...n), Ck为基学习器,k = I,...K, C(Xi)表示Xi的类别标签,即真实分类Yi,而用Ck(Xi)表示基学习器Ck对Xi的分类结果,公式中前面d列为基学习器的特征,从d+Ι列到d+K列为由K个基学习器的分类结果构成的特征,最后一列为类别标签。4.根据权利要`求1所述的,其特征在于,所述的基学习器包括C4.5、CART本文档来自技高网...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员:杨珮鑫张沛超谭啸风
申请(专利权)人:上海交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1