电力客户分类方法及装置制造方法及图纸

技术编号:29255969 阅读:17 留言:0更新日期:2021-07-13 17:27
本发明专利技术提供一种电力客户分类方法及装置,该方法包括:计算每个待分类电力客户的任一特征指标与上一次获取的每个聚类中心的该特征指标之间的距离,将该特征指标对应的距离与该特征指标的权重相乘;将每个待分类电力客户的所有特征指标相对于每个聚类中心对应的权重相乘结果相加,获取每个待分类电力客户与每个聚类中心之间的距离;将与每个待分类电力客户之间的距离最近的聚类中心的类别作为每个待分类电力客户的类别,对每个聚类中心进行更新,直到满足预设终止条件,将最后一次的聚类结果作为最终分类结果。本发明专利技术考虑各特征指标的重要程度,准确获取分类结果;且适用于待分类电力客户的特征指标密度差异大和分布不均匀的情况,鲁棒性好。

【技术实现步骤摘要】
电力客户分类方法及装置
本专利技术涉及数据挖掘
,尤其涉及一种电力客户分类方法及装置。
技术介绍
客户分类是基于大数据技术以客户的特征指标作为依据对客户进行分类的一种方法。不仅可以根据客户的类别评估客户的价值,为信贷服务提供参考依据,还可以根据客户的类别制定相应的营销策略。现有的基于大数据的客户分类方法可分为两类,有标签的客户分类方法和无标签的客户分类方法。若训练样本(客户的特征指标)已进行了标注,则可以直接对分类器进行训练,获取客户分类模型。若训练样本为无标签,通常需要按照专家打分或者基于模型的方式对客户的行为指标进行打分后再进行分类。上述客户分类方法存在专家或人工干涉,不能保证分类结果的客观正确性,很难满足在电力大数据高维度场景下的客户分类。而且客户的行为指标种类多和数量大,人工标注或分析时,不仅工作量大,还容易引起标度专家反感和判断混乱,导致标注不准确,使得训练模型的性能差,进而导致分类结果不准确。现有技术还采用传统K-means(K均值)聚类算法对客户进行分类,但是电力客户的特征指标数据分布密度不均衡,直接采用传统K-means聚类算法,会造成高密度小群瓜分低密度大群的现象,难以保证分类的准确性。
技术实现思路
本专利技术提供一种电力客户分类方法及装置,用以解决现有技术中标注的工作量大和标注准确性低,以及存在高密度小群瓜分低密度大群的现象,导致分类准确性低的缺陷,实现自动对客户进行准确分类。本专利技术提供一种电力客户分类方法,包括:计算每个待分类电力客户的任一特征指标与上一次获取的每个聚类中心的该特征指标之间的距离,并将该特征指标对应的距离与该特征指标的权重相乘;其中,所述待分类电力客户的特征指标与所述待分类电力客户的用电信息相关;将每个待分类电力客户的所有特征指标相对于每个聚类中心对应的权重相乘结果相加,获取所述每个待分类电力客户与每个聚类中心之间的距离;将与每个待分类电力客户之间的距离最近的聚类中心的类别作为每个待分类电力客户的类别,对每个聚类中心进行更新,直到满足预设终止条件,并将最后一次的聚类结果作为所述待分类电力客户的最终分类结果。根据本专利技术提供的一种电力客户分类方法,在所述将该特征指标对应的距离与该特征指标的权重相乘之前,还包括:将所有待分类电力客户的特征指标作为样本,将所有待分类电力客户在预设时段的用电量作为样本标签,对机器学习模型进行训练;将训练后的机器学习模型的参数作为所述待分类电力客户的特征指标的权重。根据本专利技术提供的一种电力客户分类方法,所述将所有待分类电力客户的特征指标作为样本,将所有待分类电力客户在预设时段的用电量作为样本标签,对机器学习模型进行训练,包括:基于因子分析方法对每个待分类电力客户的特征指标进行降维;将所有待分类电力客户的降维后的特征指标作为所述样本,将所有待分类电力客户在预设时段的用电量作为所述样本标签,对所述机器学习模型进行训练。根据本专利技术提供的一种电力客户分类方法,每个待分类电力客户与每个聚类中心之间的距离的计算公式为:其中,dist(Cp·xi)为第i个待分类电力客户到第p个聚类中心的距离,h为第i个待分类电力客户的特征指标的总数量,xij为第i个待分类电力客户的第j个特征指标,wj为i个待分类电力客户的第j个特征指标的权重,cpj为第p个聚类中心的第j个特征指标。根据本专利技术提供的一种电力客户分类方法,所述对每个聚类中心进行更新,直到满足预设终止条件,包括:计算每个类别对应的待分类电力客户的特征指标的标准差,获取每个类别对应的标准差;将每个类别对应的待分类电力客户的数量与所有待分类电力客户的总数量相除;将每个类别对应的标准差与每个类别对应的相除结果相乘;将所有类别对应的相乘结果相加,获取所有类别对应的聚类准则函数值;若所述聚类准则函数值小于预设阈值,则停止对每个聚类中心进行更新;若所述聚类准则函数值不小于所述预设阈值,则继续对每个聚类中心进行更新。根据本专利技术提供的一种电力客户分类方法,所述计算每个类别对应的待分类电力客户的特征指标的标准差,包括:根据每个类别对应的所有待分类电力客户的任一特征指标生成该特征指标的集合,并计算该特征指标的集合的标准差;将该特征指标的集合的标准差与该特征指标的权重相乘;将每个特征指标对应的权重相乘结果相加,获取每个类别对应的待分类电力客户的特征指标的标准差。根据本专利技术提供的一种电力客户分类方法,所述聚类准则函数值的计算公式为:其中,ε为所述聚类准则函数值,N为所有待分类电力客户的总数量,K为所述类别的数量,Np为第p个类别的待分类电力客户的数量,δp为第p个类别对应的待分类电力客户的特征指标的标准差。本专利技术还提供一种电力客户分类装置,包括:计算模块,用于计算每个待分类电力客户的任一特征指标与上一次获取的每个聚类中心的该特征指标之间的距离,并将该特征指标对应的距离与该特征指标的权重相乘;其中,所述待分类电力客户的特征指标与所述待分类电力客户的用电信息相关;获取模块,用于将每个待分类电力客户的所有特征指标相对于每个聚类中心对应的权重相乘结果相加,获取所述每个待分类电力客户与每个聚类中心之间的距离;分类模块,用于将与每个待分类电力客户之间的距离最近的聚类中心的类别作为每个待分类电力客户的类别,对每个聚类中心进行更新,直到满足预设终止条件,并将最后一次的聚类结果作为所述待分类电力客户的最终分类结果。本专利技术还提供一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述任一种所述电力客户分类方法的步骤。本专利技术还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述电力客户分类方法的步骤。本专利技术提供的电力客户分类方法及装置,通过根据每个特征指标的权重,对每个待分类电力客户的每个特征指标对应的距离进行加权相加,获取所述每个待分类电力客户与每个聚类中心之间的距离,并将与每个待分类电力客户之间的距离最近的聚类中心的类别作为每个待分类电力客户的类别,不仅通过增加权重的方式,充分考虑每个特征指标的重要程度,使得分类结果更加准确;还可以实现在待分类电力客户的特征指标密度差异大,且分布不均匀情况下,也能对待分类电力客户进行自动准确的分类,具有较好的鲁棒性。附图说明为了更清楚地说明本专利技术或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术提供的电力客户分类方法的流程示意图之一;图2是本专利技术提供的电力客户分类方法的流程示意图之二;图3是本专利技术提供本文档来自技高网...

【技术保护点】
1.一种电力客户分类方法,其特征在于,包括:/n计算每个待分类电力客户的任一特征指标与上一次获取的每个聚类中心的该特征指标之间的距离,并将该特征指标对应的距离与该特征指标的权重相乘;其中,所述待分类电力客户的特征指标与所述待分类电力客户的用电信息相关;/n将每个待分类电力客户的所有特征指标相对于每个聚类中心对应的权重相乘结果相加,获取所述每个待分类电力客户与每个聚类中心之间的距离;/n将与每个待分类电力客户之间的距离最近的聚类中心的类别作为每个待分类电力客户的类别,对每个聚类中心进行更新,直到满足预设终止条件,并将最后一次的聚类结果作为所述待分类电力客户的最终分类结果。/n

【技术特征摘要】
1.一种电力客户分类方法,其特征在于,包括:
计算每个待分类电力客户的任一特征指标与上一次获取的每个聚类中心的该特征指标之间的距离,并将该特征指标对应的距离与该特征指标的权重相乘;其中,所述待分类电力客户的特征指标与所述待分类电力客户的用电信息相关;
将每个待分类电力客户的所有特征指标相对于每个聚类中心对应的权重相乘结果相加,获取所述每个待分类电力客户与每个聚类中心之间的距离;
将与每个待分类电力客户之间的距离最近的聚类中心的类别作为每个待分类电力客户的类别,对每个聚类中心进行更新,直到满足预设终止条件,并将最后一次的聚类结果作为所述待分类电力客户的最终分类结果。


2.根据权利要求1所述的电力客户分类方法,其特征在于,在所述将该特征指标对应的距离与该特征指标的权重相乘之前,还包括:
将所有待分类电力客户的特征指标作为样本,将所有待分类电力客户在预设时段的用电量作为样本标签,对机器学习模型进行训练;
将训练后的机器学习模型的参数作为所述待分类电力客户的特征指标的权重。


3.根据权利要求2所述的电力客户分类方法,其特征在于,所述将所有待分类电力客户的特征指标作为样本,将所有待分类电力客户在预设时段的用电量作为样本标签,对机器学习模型进行训练,包括:
基于因子分析方法对每个待分类电力客户的特征指标进行降维;
将所有待分类电力客户的降维后的特征指标作为所述样本,将所有待分类电力客户在预设时段的用电量作为所述样本标签,对所述机器学习模型进行训练。


4.根据权利要求1-3任一所述的电力客户分类方法,其特征在于,每个待分类电力客户与每个聚类中心之间的距离的计算公式为:



其中,dist(Cp·xi)为第i个待分类电力客户到第p个聚类中心的距离,h为第i个待分类电力客户的特征指标的总数量,xij为第i个待分类电力客户的第j个特征指标,wj为i个待分类电力客户的第j个特征指标的权重,cpj为第p个聚类中心的第j个特征指标。


5.根据权利要求1-3任一所述的电力客户分类方法,其特征在于,所述对每个聚类中心进行更新,直到满足预设终止条件,包括:
计算每个类别对应的待分类电力客户的特征指标的标准差,获取每个类别对应的标准差;
将每个类别对应的待分类电力客户的数量与所有待分类电力客户...

【专利技术属性】
技术研发人员:周李京周建宏喻娴侯晓
申请(专利权)人:邦道科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1