【技术实现步骤摘要】
基于Stacking集成学习模型的电力用户画像方法
[0001]本申请涉及电力数据处理
,尤其涉及一种基于Stacking集成学习模型的电力用户画像方法。
技术介绍
[0002]随着人们生活水平的不断提高,人们对于生活质量越发地注重,这也对各行各业的服务提出了新的挑战,尤其对于关系国计民生的电力行业。据统计,过去一年中,电力行业投诉占全部投诉数量的95%以上。随着智能电网和信息化建设,用户反映问题渠道拓宽,间接导致投诉数量的上升,更精准地服务用户减少投诉迫在眉睫。
[0003]近年来,用户画像正逐渐广泛应用于医疗、自媒体、电商等多个领域。智能电网的发展推动了用户画像在电力领域的应用,精准地绘制用户画像有助于提高对用户的服务质量,降低用户的投诉行为。
[0004]用户的电力投诉数据包括文本类数据和数值类数据,现有的电力用户画像方法大多对文本类数据和数值类数据一起处理,得到的电力用户画像偏差较大。
技术实现思路
[0005]本申请提供了一种基于Stacking集成学习模型的电力用户画像方法,以解决现有的电力用户画像方法大多对文本类数据和数值类数据一起处理,得到的电力用户画像偏差较大的问题。
[0006]第一方面,本申请提供了一种基于Stacking集成学习模型的电力用户画像方法,包括:
[0007]获取电力用户的电力工单数据集,电力工单数据集包括文本类数据和数值类数据;
[0008]对电力工单数据集进行特征提取,得到文本类数据的多层特征向量和数值类数据的多源特 ...
【技术保护点】
【技术特征摘要】
1.一种基于Stacking集成学习模型的电力用户画像方法,其特征在于,包括:获取电力用户的电力工单数据集,所述电力工单数据集包括文本类数据和数值类数据;对所述电力工单数据集进行特征提取,得到所述文本类数据的多层特征向量和所述数值类数据的多源特征向量;基于Stacking集成学习模型,根据所述多层特征向量和所述多源特征向量预测所述电力用户的敏感度,并根据所述敏感度确定所述电力用户的用户画像,其中,所述Stacking集成学习模型包括一阶段预测层和二阶段预测层。2.根据权利要求1所述的基于Stacking集成学习模型的电力用户画像方法,其特征在于,所述对所述电力工单数据集进行特征提取,得到所述文本类数据的多层特征向量和所述数值类数据的多源特征向量,包括:对所述文本类数据进行多层特征提取,得到所述文本类数据的词语特征向量、用户特征向量和全局特征向量;对所述数值类数据进行多源特征提取,得到所述数值类数据的字段特征向量。3.根据权利要求2所述的基于Stacking集成学习模型的电力用户画像方法,其特征在于,所述对所述文本类数据进行多层特征提取,得到所述文本类数据的词语特征向量、用户特征向量和全局特征向量,包括:利用CBOW算法对所述文本类数据进行处理,得到所述词语特征向量;利用UDoc2vec算法对所述文本信息进行处理,得到所述用户特征向量;利用UTF
‑
IDF算法,计算文本类数据中各个词语的频率,并根据所述各个词语的频率确定所述全局特征向量。4.根据权利要求3所述的基于Stacking集成学习模型的电力用户画像方法,其特征在于,所述根据所述各个词语的频率确定所述全局特征向量,包括:对于每一个词语,若所述词语的频率大于预设频率,则将所述词语作为全局特征词语;根据所述的全局特征词语确定所述全局特征向量。5.根据权利要求2所述的基于Stacking集成学习模型的电力用户画像方法,其特征在于,所述基于Stacking集成学习模型,根据所述多层特征向量和所述多源特征向量预测所述电力用户的敏感度,包括:将所述字段特征向量分别与所述词语特征向量、所述用户特征向量和所述全局特征向量进行拼接,得到所述电力用户的第一敏感度预测向量、第二敏感度预测向量和第三敏感度预测向量;分别将所述第一敏感度预测向量、所述第二敏感度预测向量和所述第三敏感度预测向量输入Stacking集成学习模型进行预测,得到所述电力用户的敏感度。6.根据权利要求5所述的基于Stacking集成学习模型的电力用户画像方法,其特征在于,所述Stacking集成学习模型的一阶段预测层包括MLP模型、CNN
‑
LSTM模型和XGB模型,所述Stacking集成学习模型的二阶段预测层包括RF模型;所述分别将所述第一敏感度预测向量、所述第二敏感度预测向量和所述第三敏感度预测向...
【专利技术属性】
技术研发人员:吴迪,杜鑫宝,蔡超志,彭菲,郑玉莹,程鹏,张乐,冯丽明,陈尧,王晓宇,
申请(专利权)人:河北工程大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。