一种违约用电风险模型特征选择方法、装置及设备制造方法及图纸

技术编号:15691635 阅读:205 留言:0更新日期:2017-06-24 05:00
本发明专利技术实施例公开了一种违约用电风险模型特征选择方法、装置及设备。该方法包括:S101、获取用户的违约用电标签以及用户的特征因子;S102、依据所述违约用电标签和所述特征因子,构建LASSO惩罚函数;S103、通过修正的LARS求解所述LASSO惩罚函数,得到所述LASSO惩罚函数的自变量的有效集;S104、依据设定的筛选规则和所述有效集对所述自变量进行筛选,得到选择的特征因子。本发明专利技术实施例提供的技术方案,提高了特征因子的选择效率及有效性。

Characteristic selection method, device and equipment for default power risk model

The embodiment of the invention discloses a method, a device and a device for selecting an electric risk model for breach of contract. The method includes: S101, access to the user's default feature label and user power factor; S102, according to the default label and the electricity characteristic factor, construct the LASSO penalty function; S103, LARS by solving the modified the LASSO penalty function, effectively set the variable LASSO penalty function. Screening; rule S104, according to set and the efficient set of the independent variables were obtained, the characteristic factor selection. The technical proposal provided by the embodiment of the invention improves the selection efficiency and validity of the feature factor.

【技术实现步骤摘要】
一种违约用电风险模型特征选择方法、装置及设备
本专利技术实施例涉及特征因子选择方法,尤其涉及一种违约用电风险模型特征选择方法、装置及设备。
技术介绍
电力企业客户信息涉及计量自动化系统实时电量数据、GIS(GeographicInformationSystem,地理信息系统)数据、电网潮流信息、95598客服录音等海量数据。这些数据来源广,包括内部数据和外部数据,数据类型多,且随着电网企业信息化程度的提高,移动互联网、大数据技术等的深入发展,与客户相关的数据呈现爆炸式增长。随着科技的进步。电力大数据的应用一方面是与宏观经济、人民生活、社会保障、道路交通等信息融合,促进经济社会发展;另一方面,是电力行业或企业内部,跨专业、跨单位、跨部门的数据融合,提升行业、企业管理水平和经济效益。因此如何有效地从电力大数据中挖掘出有用的信息也越来越受到人们的关注。目前最有效的处理手段之一就是数学建模,而建模之初,通常会尽可能多地选择自变量来减少因缺少自变量而出现的模型偏差,但在实际建模过程中需要寻找对因变量最具有解释性的自变量子集,这个过程称为特征选择,是建模过程中很重要的一个问题。用户违约用电行为是指用户私自改变用电类别、用电容量;私自变动供电设施、计量装置;私自引入、供电或自备电源并网等情况。这不仅会影响供电企业的利益,还可能引发事故。目前对于用户违约用电的查处主要通过用电检查工作进行。所以建立准确的违约用电风险模型,辅助业务人员进行有针对性的违约用电检查,对于提高用电检查的工作效率具有重要作用。在建立违约用电风险模型的时候,通常是由相关专家根据专业理论和经验,对可能与违约用电(即因变量)相关的自变量进行人工筛选。这可能引发对因变量影响小甚至没影响的自变量被选中,自变量共线性等问题,从而导致建模过程计算量增大。另一方面,目前系统抽取到的历史发生过违约用电的用户数量太少,以此作为样本,建立的预测模型准确度不高,也导致了最终估算和预测的精度下降。
技术实现思路
本专利技术实施例提供一种违约用电风险模型特征选择方法、装置及设备,以提高特征因子的选择效率及有效性。一方面,本专利技术实施例提供了一种违约用电风险模型特征选择方法,包括:S101、获取用户的违约用电标签以及用户的特征因子;S102、依据所述违约用电标签和所述特征因子,构建LASSO惩罚函数;S103、通过修正的LARS求解所述LASSO惩罚函数,得到所述LASSO惩罚函数的自变量的有效集;S104、依据设定的筛选规则和所述有效集对所述自变量进行筛选,得到选择的特征因子。另一方面,本专利技术实施例提供了一种违约用电风险模型特征选择装置,包括:数据获取模块,用于获取用户的违约用电标签以及用户的特征因子;LASSO构建模块,用于依据所述违约用电标签和所述特征因子,构建LASSO惩罚函数;有效集确定模块,用于通过修正的LARS求解所述LASSO惩罚函数,得到所述LASSO惩罚函数的自变量的有效集;因子筛选模块,用于依据设定的筛选规则和所述有效集对所述自变量进行筛选,得到选择的特征因子。另一方面,本专利技术实施例还提供了一种设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本专利技术实施例所述的方法。本专利技术实施例提供的技术方案,通过使用LASSO方法来解决特征选择问题。具体的,通过构造一个惩罚函数得到一个较为精炼的模型,使得它压缩一些系数,同时设定一些系数为零,进而达到降维的目的,保留了子集收缩的优点,是一种处理具有复共线性数据的有偏估计。这样在违约用电风险建模中就可以有效地降低获取自变量观测数据的代价,减少建模过程的计算量,并充分提升最终的预测和估计精度。附图说明图1为本专利技术实施例中提供的一种违约用电风险模型特征选择方法的流程图;图2为本专利技术实施例中提供的一种求解LASSO惩罚函数的示意图;图3为本专利技术实施例中提供的一种违约用电风险模型特征选择装置的结构图。具体实施方式下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。图1为本专利技术实施例中提供的一种违约用电风险模型特征选择方法的流程图。本实施例的方法可以由违约用电风险模型特征选择装置来执行,该装置可以通过软件的方式来实现,且可以加载于终端设备中。参考图1,本实施例提供的违约用电风险模型特征选择方法可以包括如下步骤:S101、获取用户的违约用电标签以及用户的特征因子。数据来源于某区域电网公司。其中,用户的违约用电标签可以包括违约用电和按约用电。用户的特征因子指的是确定用户是否违约用电的影响因子,如用户的特征因子可以是用电类别、电压等级、行业分类、计量方式、用户类别、合同容量、负荷性质、客户身份、客户分群和查表周期等。S102、依据所述违约用电标签和所述特征因子,构建LASSO惩罚函数。其中,特征因子(自变量)与用电标签(因变量)成线性关系,LASSO惩罚函数用于确定自变量与因变量的相关系数。示例性的,构建的LASSO惩罚函数为:其中,p为特征因子的总数,M为用户的总数,t≥0是约束参数,yi为第i个用户的违约用电标签对应的因变量,xi=(xi(1),…,xi(j),…,xi(p))T为第i个用户的特征因子对应的自变量,β=(β0,β1,…,βj,…,βp)T为待求解的回归系数。S103、通过修正的LARS(LeastAngleRegression,最小角回归算法)求解所述LASSO惩罚函数,得到所述LASSO惩罚函数的自变量的有效集。LARS的运行模式为:一开始由于各个自变量的系数β1,…,βj,…,βp均为零,故回归预测的拟合结果为每个自变量对应的当前残差为找出与当前残差相关性最大的自变量x(j)=(x1(j),x2(j),…,xM(j))T,然后沿着这个变量前进,逐点增大该自变量对应的系数βj,以减小该自变量与残差的相关性。此时回归预测的拟合结果为残差为继续计算新的残差与各自变量之间的相关系数,随着系数βj的逐点增大,该自变量x(j)与新的残差的相关性会逐渐减小,直到出现一个新的自变量x(k)满足内积此时沿着x(j)和x(k)的角平分线方向前进,对应地逐点增大βj和βk。相应地,回归预测的预测结果为残差为如此重复,找到第三个自变量,确定这三个自变量中第一自变量与第二自变量夹角的第一角平分线,以及第二自变量与第三自变量夹角的第二角平分线,再沿着第一角平分线和第二角平分线所在夹角的角平分线方向逐点移动,调整这三个自变量的系数,使得在移动过程中这个三个自变量与当前残差的相关性均减小且一直相等……直到特征因子的所有自变量均属于有效集为止,即直到所有自变量加入回归预测为止,此时即为无约束的线性回归。示例性的,结合图2(图2以p取10为例),S103可以包括:S103-1、中心标准化自变量,从残差开始,令β1,…βp均为0,初始有效集为空。具体的,使实现中心标准化自变量,从残差开始,令β1,…βp均为0,初始有效集为空。S103-2、确定和残差r相关性最强的自变量x(j)加入有效集。由于自变量和残差的相关本文档来自技高网
...
一种违约用电风险模型特征选择方法、装置及设备

【技术保护点】
一种违约用电风险模型特征选择方法,其特征在于,包括:S101、获取用户的违约用电标签以及用户的特征因子;S102、依据所述违约用电标签和所述特征因子,构建LASSO惩罚函数;S103、通过修正的LARS求解所述LASSO惩罚函数,得到所述LASSO惩罚函数的自变量的有效集;S104、依据设定的筛选规则和所述有效集对所述自变量进行筛选,得到选择的特征因子。

【技术特征摘要】
1.一种违约用电风险模型特征选择方法,其特征在于,包括:S101、获取用户的违约用电标签以及用户的特征因子;S102、依据所述违约用电标签和所述特征因子,构建LASSO惩罚函数;S103、通过修正的LARS求解所述LASSO惩罚函数,得到所述LASSO惩罚函数的自变量的有效集;S104、依据设定的筛选规则和所述有效集对所述自变量进行筛选,得到选择的特征因子。2.根据权利要求1所述的方法,其特征在于,所述LASSO惩罚函数为:其中,p为特征因子的总数,M为用户的总数,t≥0是约束参数,yi为第i个用户的违约用电标签对应的因变量,xi=(xi(1),…,xi(j),…,xi(p))T为第i个用户的特征因子对应的自变量,β=(β0,β1,…,βj,…,βp)T为待求解的回归系数。3.根据权利要求1所述的方法,其特征在于,S103可以包括:S103-1、中心标准化自变量,从残差开始,令β1,…βp均为0,初始有效集为空;S103-2、确定和残差r相关性最强的自变量x(j)加入有效集;S103-3、调整有效集中自变量对应的系数,使有效集中各自变量与当前残差的相关性均减小且一直相等,当前残差为S103-4、确定有效集中自变量的非零系数是否变为0,若是,则将系数变为0的自变量从有效集中剔除,并继续执行S103-5;若否,继续执行S103-5;S103-5、确定是否存在非有效集自变量和有效集自变量与当前残差的相关性相等;若是,则继续执行S103-6;否则,返回执行S103-3;S103-6、将该非有效集自变量加入到有效集;S103-7、确定是否存在非有效集自变量,若是,则返回执行S103-3;否则,结束操作。4.根据权利要求1-3任一项所述的方法,其特征在于,所述筛选规则为MallowsCp准则。5.一种违约用电风险模型特征选择装置,其特征在于,包括:数据获取模块,用于获取用户的...

【专利技术属性】
技术研发人员:陈丰王志英林火华张诗军李远宁杨漾黄聪朱杏传
申请(专利权)人:中国南方电网有限责任公司彩讯科技股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1