一种违约用电风险模型特征选择方法、装置及设备制造方法及图纸

技术编号:15691635 阅读:214 留言:0更新日期:2017-06-24 05:00
本发明专利技术实施例公开了一种违约用电风险模型特征选择方法、装置及设备。该方法包括:S101、获取用户的违约用电标签以及用户的特征因子;S102、依据所述违约用电标签和所述特征因子,构建LASSO惩罚函数;S103、通过修正的LARS求解所述LASSO惩罚函数,得到所述LASSO惩罚函数的自变量的有效集;S104、依据设定的筛选规则和所述有效集对所述自变量进行筛选,得到选择的特征因子。本发明专利技术实施例提供的技术方案,提高了特征因子的选择效率及有效性。

Characteristic selection method, device and equipment for default power risk model

The embodiment of the invention discloses a method, a device and a device for selecting an electric risk model for breach of contract. The method includes: S101, access to the user's default feature label and user power factor; S102, according to the default label and the electricity characteristic factor, construct the LASSO penalty function; S103, LARS by solving the modified the LASSO penalty function, effectively set the variable LASSO penalty function. Screening; rule S104, according to set and the efficient set of the independent variables were obtained, the characteristic factor selection. The technical proposal provided by the embodiment of the invention improves the selection efficiency and validity of the feature factor.

【技术实现步骤摘要】
一种违约用电风险模型特征选择方法、装置及设备
本专利技术实施例涉及特征因子选择方法,尤其涉及一种违约用电风险模型特征选择方法、装置及设备。
技术介绍
电力企业客户信息涉及计量自动化系统实时电量数据、GIS(GeographicInformationSystem,地理信息系统)数据、电网潮流信息、95598客服录音等海量数据。这些数据来源广,包括内部数据和外部数据,数据类型多,且随着电网企业信息化程度的提高,移动互联网、大数据技术等的深入发展,与客户相关的数据呈现爆炸式增长。随着科技的进步。电力大数据的应用一方面是与宏观经济、人民生活、社会保障、道路交通等信息融合,促进经济社会发展;另一方面,是电力行业或企业内部,跨专业、跨单位、跨部门的数据融合,提升行业、企业管理水平和经济效益。因此如何有效地从电力大数据中挖掘出有用的信息也越来越受到人们的关注。目前最有效的处理手段之一就是数学建模,而建模之初,通常会尽可能多地选择自变量来减少因缺少自变量而出现的模型偏差,但在实际建模过程中需要寻找对因变量最具有解释性的自变量子集,这个过程称为特征选择,是建模过程中很重要的一个问题。用户违约用电行为是本文档来自技高网...
一种违约用电风险模型特征选择方法、装置及设备

【技术保护点】
一种违约用电风险模型特征选择方法,其特征在于,包括:S101、获取用户的违约用电标签以及用户的特征因子;S102、依据所述违约用电标签和所述特征因子,构建LASSO惩罚函数;S103、通过修正的LARS求解所述LASSO惩罚函数,得到所述LASSO惩罚函数的自变量的有效集;S104、依据设定的筛选规则和所述有效集对所述自变量进行筛选,得到选择的特征因子。

【技术特征摘要】
1.一种违约用电风险模型特征选择方法,其特征在于,包括:S101、获取用户的违约用电标签以及用户的特征因子;S102、依据所述违约用电标签和所述特征因子,构建LASSO惩罚函数;S103、通过修正的LARS求解所述LASSO惩罚函数,得到所述LASSO惩罚函数的自变量的有效集;S104、依据设定的筛选规则和所述有效集对所述自变量进行筛选,得到选择的特征因子。2.根据权利要求1所述的方法,其特征在于,所述LASSO惩罚函数为:其中,p为特征因子的总数,M为用户的总数,t≥0是约束参数,yi为第i个用户的违约用电标签对应的因变量,xi=(xi(1),…,xi(j),…,xi(p))T为第i个用户的特征因子对应的自变量,β=(β0,β1,…,βj,…,βp)T为待求解的回归系数。3.根据权利要求1所述的方法,其特征在于,S103可以包括:S103-1、中心标准化自变量,从残差开始,令β1,…βp均为0,初始有效集为空;S103-2、确定和残差r相关性最强的自变量x(j)加入有效集;S103-3、调整有效集中自变量对应的系数,使有效集中各自变量与当前残差的相关性均减小且一直相等,当前残差为S103-4、确定有效集中自变量的非零系数是否变为0,若是,则将系数变为0的自变量从有效集中剔除,并继续执行S103-5;若否,继续执行S103-5;S103-5、确定是否存在非有效集自变量和有效集自变量与当前残差的相关性相等;若是,则继续执行S103-6;否则,返回执行S103-3;S103-6、将该非有效集自变量加入到有效集;S103-7、确定是否存在非有效集自变量,若是,则返回执行S103-3;否则,结束操作。4.根据权利要求1-3任一项所述的方法,其特征在于,所述筛选规则为MallowsCp准则。5.一种违约用电风险模型特征选择装置,其特征在于,包括:数据获取模块,用于获取用户的...

【专利技术属性】
技术研发人员:陈丰王志英林火华张诗军李远宁杨漾黄聪朱杏传
申请(专利权)人:中国南方电网有限责任公司彩讯科技股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1