一种基于聚类算法和主成分分析的电力客户画像构建方法技术

技术编号:23401072 阅读:25 留言:0更新日期:2020-02-22 13:13
本发明专利技术公开了一种基于聚类算法和主成分分析的电力客户画像构建方法,方法包括以下步骤:选取影响电力客户交易的信息作为评价电力客户的属性;根据各属性所属不同的评价指标,对所有属性进行划分将其划分为对应所属的评价指标下;将属于连续性的属性基于聚类算法进行再分级,并确定属性下各个再分级的权值;基于主成分分析算法确定评价指标及其属性权重;根据电力客户的属性数据和评价指标、属性和再分级的权值,计算电力客户的综合评价得分,形成电力客户画像。本发明专利技术选取评价电力客户的各属性构成评价体系,并确定权重以便得到客户评分和等级,形成电力客户画像。

A construction method of power customer profile based on clustering algorithm and principal component analysis

【技术实现步骤摘要】
一种基于聚类算法和主成分分析的电力客户画像构建方法
本专利技术属于电力系统
,具体涉及一种基于聚类算法和主成分分析的电力客户画像构建方法。
技术介绍
随着电力体制改革的进一步推进,售电侧的改革允许符合条件的发电企业投资组建售电公司,这样有利于延伸发电企业产业链,形成发售一体,优化资源配置战略布局,获得新的利润增长点。在电力市场下,售电公司逐渐成为市场主体成员,为电力客户提供专业化的售电服务以及增值服务。传统的电力销售是统购统销模式,发电企业的营销体系、营销人才、营销信息化工具的都比较薄弱,已经逐渐无法适应电力市场特别是电力现货市场中电力营销的需求。此外,随着大数据、云计算技术的不断发展,电力营销系统积累了海量的电力数据,但这些数据尚未被有效挖掘其中的价值。客户画像是客户信息标签化的体现,通过客户画像分类,能够快速区分无价值客户,高价值用户,企业针对不同价值的客户制定优化的个性化服务方案,采取不同的营销策略,将有限的营销资源集中于高价值客户,实现企业利润最大化目标。因此,利用大数据分析技术,构建更符合电力客户的用户画像,深入掌握用户行为进而制定精准营销策略和提供差异化服务,成为售电公司提升在市场竞争中的优势,提高客户满意度的关键。然而,在电力行业,电力营销尚未形成完整的营销体系,还未形成针对电力客户的价值评价体系,亟需使用数据挖掘技术进行大数据分析,构建电力客户画像,实现精细化营销。
技术实现思路
本专利技术的目的在于克服现有技术的不足,提供了一种基于聚类算法和主成分分析的电力客户画像构建方法,选取评价电力客户的各属性构成评价体系,并确定权重以便得到客户评分和等级,形成电力客户画像。为解决上述技术问题,本专利技术提供了一种基于聚类算法和主成分分析的电力客户画像构建方法,其特征是,包括以下步骤:获取电力客户的详细信息,从中选取影响电力客户交易的信息作为评价电力客户的属性;根据各属性所属不同的评价指标,对所有属性进行划分将其划分为对应所属的评价指标下;将所有属性中属于连续性的属性基于聚类算法进行再分级,并确定属性下各个再分级的权值;基于主成分分析算法确定评价指标及其属性权重;根据电力客户的属性数据和评价指标、属性和再分级的权值,计算电力客户的综合评价得分,形成电力客户画像。进一步的,所述评价电力客户的属性包括:客户日负荷、电压等级、用电性质、月度实际用电量、月度计划网购用电量、月度申报量、用户年度申报量、是否通过微信公众平台签约、是否办理增值服务、已签约年份和再次签约年份。进一步的,还包括根据月度计划网购电量、月度申报电量和月度实际用电量,计算平均事前偏差率、累计实际偏差率以及负偏差累计次数作为新的属性元素,计算公式分别为:平均事前偏差率=∑(|(月度计划网购电量-月度申报电量)/月度申报电量)/月份累计实际偏差率=∑(|(月度实际用电量-月度申报电量)/月度申报电量)/月份负偏差累计次数=(月度实际用电量-月度申报电量)<0或偏差率<0的次数将平均事前偏差率、累计实际偏差率以及负偏差累计次数作为新的属性。进一步的,还包括根据评价电力客户属性与评价结果之间的互信息,保留互信息值大的属性,删除互信息值小的属性。进一步的,所述评价指数包括:企业指数、信用指数、风险指数、交易指数和运维指数,将电压等级和用电性质属性划分为企业指数,平均事前偏差率属性划分为信用指数,累计实际偏差率、负偏差累计次数属性划分为风险指数,用户年度申报量、是否通过微信公众平台签约、已签约年份、再次签约年份属性划分为交易指数,是否办理增值服务属性划分为运维指数。进一步的,所述确定属性下各个再分级的权值,包括:属性下各个再分级的权值为再分级每一类中用户数占总用户的比重。进一步的,所述根据电力客户的属性数据和评价指标、属性和再分级的权值,计算电力客户的综合评价得分,包括:根据电力客户的属性数据和评价指标、属性和再分级的权值,按再分级、属性到评价指标从下往上进行计算得到电力客户的最终评价得分。进一步的,所述按再分级、属性到评价指标从下往上进行计算得到电力客户的最终评价得分,包括:以企业指数为例,首先获取用户电压数值和用电性质数值,根据用户电压数值判断电力客户属于评价体系第三层中哪个电压范围,之后将用户电压数值乘以其所属电压范围的权重,再乘以评价体系第二层中电压等级的属性权重,将此计算结果记为结果1,然后根据用电性质数值判断电力客户属于评价体系第三层中哪个用电性质再分级,之后将用电性质数值乘以其所属用电性质再分级的权重,再乘以评价体系第二层中用电性质的属性权重,将此计算结果记为结果2,将结果1和结果2相加后再乘以评价体系第一层中企业指数权重,最终得到结果作为企业指数的得分,此得分即作为企业指数的评价得分;将所有评价指标都进行上述计算得到各评价指标的得分,所有得分累加和即为此用户的最终评价得分。与现有技术相比,本专利技术所达到的有益效果是:本专利技术方法提出了一种针对电力客户数据,构建用户画像的方法,利用互信息的方法对客户进行特征选择,构造出偏差率、累计偏差次数等更能够影响客户类别的新属性;能够通过K-means++方法进行用户电压和年用电量等的分级,实现了数据自动分类,而不是人为地进行分段;并提供了一种客观的计算各属性权重的主成分分析方法,以便得到客户评分和等级,对客户进行分级。这种方法的提出有助于售电公司充分利用历史的客户信息,得到不同价值的客户,且使用客观的方式得到客户评分,为营销提供参考价值,实现精准营销和定制服务。附图说明图1表示构建电力客户画像的总流程;图2表示本文的电力客户评价体系;图3表示K-means++聚类算法的具体实现流程。具体实施方式下面结合附图对本专利技术作进一步描述。以下实施例仅用于更加清楚地说明本专利技术的技术方案,而不能以此来限制本专利技术的保护范围。本专利技术的一种基于聚类算法和主成分分析的电力客户画像构建方法,参见图1所示,具体的包括以下内容:步骤(1)获取电力客户的详细信息,从中选取影响电力客户交易的数据信息作为评价电力客户的属性。该步骤主要目的是进行数据源的采集与预处理,为下一步分析工作提供支持。从数据源提取目前系统内的一段时间的有交易记录的所有电力客户的详细数据形成历史数据,主要包括企业的基础信息、交易信息、用电信息及其他外界数据类型。并对这些详细数据进行数据预处理,删除缺失值和异常值。从这些数据中,先主观筛选现有数据中影响用户交易的数据信息作为评价电力客户的属性,整理得出:基础信息:客户名称、客户所在地;用电信息:客户日负荷(衡量是否用电使用正常)、电压等级(衡量电量使用程度)、用电性质(用来区分大中小用户,包括农业生产用电、一般工商业及其他用电、大工业用电)、月度实际用电量;交易信息:月度计划网购用电量、月度申报量、用户年度申报量、是否通本文档来自技高网...

【技术保护点】
1.一种基于聚类算法和主成分分析的电力客户画像构建方法,其特征是,包括以下步骤:/n获取电力客户的详细信息,从中选取影响电力客户交易的信息作为评价电力客户的属性;/n根据各属性所属不同的评价指标,对所有属性进行划分将其划分为对应所属的评价指标下;/n将所有属性中属于连续性的属性基于聚类算法进行再分级,并确定属性下各个再分级的权值;/n基于主成分分析算法确定评价指标及其属性权重;/n根据电力客户的属性数据和评价指标、属性和再分级的权值,计算电力客户的综合评价得分,形成电力客户画像。/n

【技术特征摘要】
1.一种基于聚类算法和主成分分析的电力客户画像构建方法,其特征是,包括以下步骤:
获取电力客户的详细信息,从中选取影响电力客户交易的信息作为评价电力客户的属性;
根据各属性所属不同的评价指标,对所有属性进行划分将其划分为对应所属的评价指标下;
将所有属性中属于连续性的属性基于聚类算法进行再分级,并确定属性下各个再分级的权值;
基于主成分分析算法确定评价指标及其属性权重;
根据电力客户的属性数据和评价指标、属性和再分级的权值,计算电力客户的综合评价得分,形成电力客户画像。


2.根据权利要求1所述的一种基于聚类算法和主成分分析的电力客户画像构建方法,其特征是,所述评价电力客户的属性包括:
客户日负荷、电压等级、用电性质、月度实际用电量、月度计划网购用电量、月度申报量、用户年度申报量、是否通过微信公众平台签约、是否办理增值服务、已签约年份和再次签约年份。


3.根据权利要求2所述的一种基于聚类算法和主成分分析的电力客户画像构建方法,其特征是,还包括根据月度计划网购电量、月度申报电量和月度实际用电量,计算平均事前偏差率、累计实际偏差率以及负偏差累计次数作为新的属性元素,计算公式分别为:
平均事前偏差率=∑(|(月度计划网购电量-月度申报电量)/月度申报电量|)/月份
累计实际偏差率=∑(|(月度实际用电量-月度申报电量)/月度申报电量|)/月份
负偏差累计次数=(月度实际用电量-月度申报电量)<0或偏差率<0的次数
将平均事前偏差率、累计实际偏差率以及负偏差累计次数作为新的属性。


4.根据权利要求1所述的一种基于聚类算法和主成分分析的电力客户画像构建方法,其特征是,还包括根据评价电力客户属性与评价结果之间的互信息,保留互信息值大的属性,删除互信息值小的属性。


5.根据权利要求3所述的一种基于聚类算法和主成分分析的电力客户画像构建...

【专利技术属性】
技术研发人员:储方诚张庭玉朱海东郝浩李鹏刘子良
申请(专利权)人:南京华盾电力信息安全测评有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1