The embodiment of the invention discloses a method, a device and a device for selecting an electric risk model for breach of contract. The method includes: S101, access to the user's default feature label and user power factor; S102, according to the default label and the electricity characteristic factor, construct the LASSO penalty function; S103, LARS by solving the modified the LASSO penalty function, effectively set the variable LASSO penalty function. Screening; rule S104, according to set and the efficient set of the independent variables were obtained, the characteristic factor selection. The technical proposal provided by the embodiment of the invention improves the selection efficiency and validity of the feature factor.
【技术实现步骤摘要】
一种违约用电风险模型特征选择方法、装置及设备
本专利技术实施例涉及特征因子选择方法,尤其涉及一种违约用电风险模型特征选择方法、装置及设备。
技术介绍
电力企业客户信息涉及计量自动化系统实时电量数据、GIS(GeographicInformationSystem,地理信息系统)数据、电网潮流信息、95598客服录音等海量数据。这些数据来源广,包括内部数据和外部数据,数据类型多,且随着电网企业信息化程度的提高,移动互联网、大数据技术等的深入发展,与客户相关的数据呈现爆炸式增长。随着科技的进步。电力大数据的应用一方面是与宏观经济、人民生活、社会保障、道路交通等信息融合,促进经济社会发展;另一方面,是电力行业或企业内部,跨专业、跨单位、跨部门的数据融合,提升行业、企业管理水平和经济效益。因此如何有效地从电力大数据中挖掘出有用的信息也越来越受到人们的关注。目前最有效的处理手段之一就是数学建模,而建模之初,通常会尽可能多地选择自变量来减少因缺少自变量而出现的模型偏差,但在实际建模过程中需要寻找对因变量最具有解释性的自变量子集,这个过程称为特征选择,是建模过程中很重要的一个问题。用户违约用电行为是指用户私自改变用电类别、用电容量;私自变动供电设施、计量装置;私自引入、供电或自备电源并网等情况。这不仅会影响供电企业的利益,还可能引发事故。目前对于用户违约用电的查处主要通过用电检查工作进行。所以建立准确的违约用电风险模型,辅助业务人员进行有针对性的违约用电检查,对于提高用电检查的工作效率具有重要作用。在建立违约用电风险模型的时候,通常是由相关专家根据专业理论和经验,对可能与 ...
【技术保护点】
一种违约用电风险模型特征选择方法,其特征在于,包括:S101、获取用户的违约用电标签以及用户的特征因子;S102、依据所述违约用电标签和所述特征因子,构建LASSO惩罚函数;S103、通过修正的LARS求解所述LASSO惩罚函数,得到所述LASSO惩罚函数的自变量的有效集;S104、依据设定的筛选规则和所述有效集对所述自变量进行筛选,得到选择的特征因子。
【技术特征摘要】
1.一种违约用电风险模型特征选择方法,其特征在于,包括:S101、获取用户的违约用电标签以及用户的特征因子;S102、依据所述违约用电标签和所述特征因子,构建LASSO惩罚函数;S103、通过修正的LARS求解所述LASSO惩罚函数,得到所述LASSO惩罚函数的自变量的有效集;S104、依据设定的筛选规则和所述有效集对所述自变量进行筛选,得到选择的特征因子。2.根据权利要求1所述的方法,其特征在于,所述LASSO惩罚函数为:其中,p为特征因子的总数,M为用户的总数,t≥0是约束参数,yi为第i个用户的违约用电标签对应的因变量,xi=(xi(1),…,xi(j),…,xi(p))T为第i个用户的特征因子对应的自变量,β=(β0,β1,…,βj,…,βp)T为待求解的回归系数。3.根据权利要求1所述的方法,其特征在于,S103可以包括:S103-1、中心标准化自变量,从残差开始,令β1,…βp均为0,初始有效集为空;S103-2、确定和残差r相关性最强的自变量x(j)加入有效集;S103-3、调整有效集中自变量对应的系数,使有效集中各自变量与当前残差的相关性均减小且一直相等,当前残差为S103-4、确定有效集中自变量的非零系数是否变为0,若是,则将系数变为0的自变量从有效集中剔除,并继续执行S103-5;若否,继续执行S103-5;S103-5、确定是否存在非有效集自变量和有效集自变量与当前残差的相关性相等;若是,则继续执行S103-6;否则,返回执行S103-3;S103-6、将该非有效集自变量加入到有效集;S103-7、确定是否存在非有效集自变量,若是,则返回执行S103-3;否则,结束操作。4.根据权利要求1-3任一项所述的方法,其特征在于,所述筛选规则为MallowsCp准则。5.一种违约用电风险模型特征选择装置,其特征在于,包括:数据获取模块,用于获取用户的...
【专利技术属性】
技术研发人员:陈丰,王志英,林火华,张诗军,李远宁,杨漾,黄聪,朱杏传,
申请(专利权)人:中国南方电网有限责任公司,彩讯科技股份有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。