电力客户分类方法及装置制造方法及图纸

技术编号：29255969 阅读：17 留言：0更新日期：2021-07-13 17:27

本发明专利技术提供一种电力客户分类方法及装置，该方法包括：计算每个待分类电力客户的任一特征指标与上一次获取的每个聚类中心的该特征指标之间的距离，将该特征指标对应的距离与该特征指标的权重相乘；将每个待分类电力客户的所有特征指标相对于每个聚类中心对应的权重相乘结果相加，获取每个待分类电力客户与每个聚类中心之间的距离；将与每个待分类电力客户之间的距离最近的聚类中心的类别作为每个待分类电力客户的类别，对每个聚类中心进行更新，直到满足预设终止条件，将最后一次的聚类结果作为最终分类结果。本发明专利技术考虑各特征指标的重要程度，准确获取分类结果；且适用于待分类电力客户的特征指标密度差异大和分布不均匀的情况，鲁棒性好。

全部详细技术资料下载

【技术实现步骤摘要】
电力客户分类方法及装置
本专利技术涉及数据挖掘
，尤其涉及一种电力客户分类方法及装置。
技术介绍
客户分类是基于大数据技术以客户的特征指标作为依据对客户进行分类的一种方法。不仅可以根据客户的类别评估客户的价值，为信贷服务提供参考依据，还可以根据客户的类别制定相应的营销策略。现有的基于大数据的客户分类方法可分为两类，有标签的客户分类方法和无标签的客户分类方法。若训练样本(客户的特征指标)已进行了标注，则可以直接对分类器进行训练，获取客户分类模型。若训练样本为无标签，通常需要按照专家打分或者基于模型的方式对客户的行为指标进行打分后再进行分类。上述客户分类方法存在专家或人工干涉，不能保证分类结果的客观正确性，很难满足在电力大数据高维度场景下的客户分类。而且客户的行为指标种类多和数量大，人工标注或分析时，不仅工作量大，还容易引起标度专家反感和判断混乱，导致标注不准确，使得训练模型的性能差，进而导致分类结果不准确。现有技术还采用传统K-means(K均值)聚类算法对客户进行分类，但是电力客户的特征指标数据分布密度不均衡，直接采用传统K-means聚类算法，会造成高密度小群瓜分低密度大群的现象，难以保证分类的准确性。
技术实现思路
本专利技术提供一种电力客户分类方法及装置，用以解决现有技术中标注的工作量大和标注准确性低，以及存在高密度小群瓜分低密度大群的现象，导致分类准确性低的缺陷，实现自动对客户进行准确分类。本专利技术提供一种电力客户分类方法，包括：计算每个待分...

【技术保护点】
1.一种电力客户分类方法，其特征在于，包括：/n计算每个待分类电力客户的任一特征指标与上一次获取的每个聚类中心的该特征指标之间的距离，并将该特征指标对应的距离与该特征指标的权重相乘；其中，所述待分类电力客户的特征指标与所述待分类电力客户的用电信息相关；/n将每个待分类电力客户的所有特征指标相对于每个聚类中心对应的权重相乘结果相加，获取所述每个待分类电力客户与每个聚类中心之间的距离；/n将与每个待分类电力客户之间的距离最近的聚类中心的类别作为每个待分类电力客户的类别，对每个聚类中心进行更新，直到满足预设终止条件，并将最后一次的聚类结果作为所述待分类电力客户的最终分类结果。/n

【技术特征摘要】
1.一种电力客户分类方法，其特征在于，包括：
计算每个待分类电力客户的任一特征指标与上一次获取的每个聚类中心的该特征指标之间的距离，并将该特征指标对应的距离与该特征指标的权重相乘；其中，所述待分类电力客户的特征指标与所述待分类电力客户的用电信息相关；
将每个待分类电力客户的所有特征指标相对于每个聚类中心对应的权重相乘结果相加，获取所述每个待分类电力客户与每个聚类中心之间的距离；
将与每个待分类电力客户之间的距离最近的聚类中心的类别作为每个待分类电力客户的类别，对每个聚类中心进行更新，直到满足预设终止条件，并将最后一次的聚类结果作为所述待分类电力客户的最终分类结果。

2.根据权利要求1所述的电力客户分类方法，其特征在于，在所述将该特征指标对应的距离与该特征指标的权重相乘之前，还包括：
将所有待分类电力客户的特征指标作为样本，将所有待分类电力客户在预设时段的用电量作为样本标签，对机器学习模型进行训练；
将训练后的机器学习模型的参数作为所述待分类电力客户的特征指标的权重。

3.根据权利要求2所述的电力客户分类方法，其特征在于，所述将所有待分类电力客户的特征指标作为样本，将所有待分类电力客户在预设时段的用电量作为样本标签，对机器学习模型进行训练，包括：
基于因子分析方法对每个待分类电力客户的特征指标进行降维；
将所有待分类电力客户的降维后的特征指标作为所述样本，将所有待分类电力客户在预设时段的用电量作为所述样本标签，对所述机器学习模型进行训练。

4.根据权利要求1-3任一所述的电力客户分类方法，其特征在于，每个待分类电力客户与每个聚类中心之间的距离的计算公式为：

其中，dist(Cp·xi)为第i个待分类电力客户到第p个聚类中心的距离，h为第i个待分类电力客户的特征指标的总数量，xij为第i个待分类电力客户的第j个特征指标，wj为i个待分类电力客户的第j个特征指标的权重，cpj为第p个聚类中心的第j个特征指标。

5.根据权利要求1-3任一所述的电力客户分类方法，其特征在于，所述对每个聚类中心进行更新，直到满足预设终止条件，包括：
计算每个类别对应的待分类电力客户的特征指标的标准差，获取每个类别对应的标准差；
将每个类别对应的待分类电力客户的数量与所有待分类电力客户...

【专利技术属性】
技术研发人员：周李京，周建宏，喻娴，侯晓，
申请(专利权)人：邦道科技有限公司，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人