一种基于AIC的逐步特征变量选择方法技术

技术编号:14746759 阅读:869 留言:0更新日期:2017-03-01 23:16
本发明专利技术结合AIC准则和逐步筛选原理,提出一种基于AIC的逐步特征变量选择方法,采用逐步选择的方式,解决了单向方法易陷入局部最优的问题,能从全局角度选择最优组合,建立精确模型,解决GWR分析中无法建立全局最优模型的问题。

【技术实现步骤摘要】

本专利技术涉及地理信息科学领域,尤其涉及一种基于AIC的逐步特征变量选择方法
技术介绍
地理加权回归是近年来提出的一种新的空间分析方法,它是将空间结构嵌入线性回归模型中,能够有效处理回归分析中空间非平稳性现象。在地理空间分析当中,利用在n个不同的地理位置上获取的样本数据进行回归分析时,回归参数在很多情况下是随着地理位置变化的,为了反映回归参数的空间变化特征,因而需要采用地理加权回归的分析方法。在地理加权回归(GeographicallyWeightedRegression,GWR)分析时,需要从多个特征变量中选择合适的变量,作为自变量与因变量一起建立模型。特征变量的选择对模型性能影响很大。在普通线性回归(OrdinarilyLinearityRegression,OLR)中,常用的特征变量选择方法包括基于F检验的向前引入法、向后剔除法和逐步回归法。由于GWR在OLR的基础上考虑了各影响因素在空间非平稳性,上述方法无法直接应用于GWR。在GWR特征变量选择方法上,赵阳阳提出一种基于贪心算法的地理加权回归特征变量选择方法该方法基于Akaike信息法则(AkaikeInformationCriterion,AIC),采用贪心算法筛选变量,提高了GWR中特征变量选择的精度。但是,由于贪心算法选择过程是单向的,一旦变量选入模型或删除后,无法再判断,得到的结果可能只是局部最优,而不是全局最优。
技术实现思路
鉴于上述现有技术中存在的以上问题,本专利技术结合AIC准则和逐步筛选原理,提出一种基于AIC的逐步特征变量选择方法,解决GWR分析中无法建立全局最优模型的问题。本专利技术提供的基于AIC的逐步特征变量选择方法包括以下步骤:步骤1:设全部特征变量集为L,记作L={x1,x2,…,xd本文档来自技高网...
一种基于AIC的逐步特征变量选择方法

【技术保护点】
一种基于AIC的逐步特征变量选择方法,其特征在于,包括以下步骤:步骤1:设全部特征变量集为L,记作L={x1,x2,…,xd},其中d大于等于2;随机选择L中的1个特征变量放入已选特征变量集S,令备选特征变量集U为子集S在L中的绝对补集,记作U={x1,x2,…,xk},全局最小AIC值为AICw=+∞,即初始赋值为无穷大;步骤2:计算备选特征变量集U中所包含的备选特征变量的个数,记作k;判断k是否为0;若是,则执行步骤11;若否,则执行步骤3;步骤3:对备选特征变量集U中的每个备选特征变量,作为新变量分别与已选特征变量集S、因变量y建立GWR模型,得到模型GWRu1,GWRu2,…,GWRuk;计算模型GWRu1,GWRu2,…,GWRuk当中每个模型的AIC值,获得{AICGWRu1,AICGWRu2,...,AICGWRuk},其中AICGWRuk表示模型GWRuk的AIC值;步骤4:求出{AICGWRu1,AICGWRu2,…,AICGWRuk}当中的最小值,记为当前最小AIC值AICc;步骤5:判断步骤4中所述AICc是否比全局最小AIC值AICw小3;若是,执行步骤6;若否,随机从U中选择一个变量,删除该变量,执行步骤7;步骤6:将计算出步骤4中所述AICc的GWR模型所对应的备选特征变量加入已选特征变量集S,将加入后的已选特征变量集S记作S={x1,x2,…,xm};并从备选特征变量集U中删除该备选特征变量,将所述AICc的值赋值给AICw;然后执行步骤7;步骤7:对已选特征变量集S中的m个变量,每次去除其中一个变量,利用S中的其它变量与因变量y组合建立GWR模型,得到模型GWRs1,GWRs2,…,GWRsm;其中GWRsm表示将S中的变量xm去除后,利用其它变量与因变量y组合而建立的GWR模型;并计算模型GWRs1,GWRs2,…,GWRsm当中每个模型的AIC值,获得{AICGWRs1,AICGWRs2,…,AICGWRsm},其中AICGWRsm表示模型GWRsm的AIC值;步骤8:求{AICGWRs1,AICGWRs2,…,AICGWRsm}当中的最小值,记为当前最小AIC值AICc;步骤9:判断步骤8中所述AICc是否比全局最小AIC值AICw小3;若是,执行步骤10;若否,执行步骤2;步骤10:将计算出步骤8中所述AICc的GWR模型对应的特征变量从已选特征变量集S中删除,将步骤8中所述AICc赋值给AICw,返回执行步骤2;步骤11:循环结束,此时的已选特征变量集作为最优特征变量组合。...

【技术特征摘要】
1.一种基于AIC的逐步特征变量选择方法,其特征在于,包括以下步...

【专利技术属性】
技术研发人员:刘纪平赵阳阳张福浩石丽红仇阿根刘晓东陶坤旺张小璐
申请(专利权)人:辽宁工程技术大学中国测绘科学研究院
类型:发明
国别省市:辽宁;21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1