基于Stacking集成学习模型的电力用户画像方法技术

技术编号:37443328 阅读:18 留言:0更新日期:2023-05-06 09:15
本申请提供一种基于Stacking集成学习模型的电力用户画像方法。该方法包括:获取电力用户的电力工单数据集,电力工单数据集包括文本类数据和数值类数据;对电力工单数据集进行特征提取,得到文本类数据的多层特征向量和数值类数据的多源特征向量;基于Stacking集成学习模型,根据多层特征向量和多源特征向量预测电力用户的敏感度,并根据敏感度确定电力用户的用户画像,其中,Stacking集成学习模型包括一阶段预测层和二阶段预测层。本申请能够提高电力用户画像的准确性。电力用户画像的准确性。电力用户画像的准确性。

【技术实现步骤摘要】
基于Stacking集成学习模型的电力用户画像方法


[0001]本申请涉及电力数据处理
,尤其涉及一种基于Stacking集成学习模型的电力用户画像方法。

技术介绍

[0002]随着人们生活水平的不断提高,人们对于生活质量越发地注重,这也对各行各业的服务提出了新的挑战,尤其对于关系国计民生的电力行业。据统计,过去一年中,电力行业投诉占全部投诉数量的95%以上。随着智能电网和信息化建设,用户反映问题渠道拓宽,间接导致投诉数量的上升,更精准地服务用户减少投诉迫在眉睫。
[0003]近年来,用户画像正逐渐广泛应用于医疗、自媒体、电商等多个领域。智能电网的发展推动了用户画像在电力领域的应用,精准地绘制用户画像有助于提高对用户的服务质量,降低用户的投诉行为。
[0004]用户的电力投诉数据包括文本类数据和数值类数据,现有的电力用户画像方法大多对文本类数据和数值类数据一起处理,得到的电力用户画像偏差较大。

技术实现思路

[0005]本申请提供了一种基于Stacking集成学习模型的电力用户画像方法,以解决现有的电力用户画像方法大多对文本类数据和数值类数据一起处理,得到的电力用户画像偏差较大的问题。
[0006]第一方面,本申请提供了一种基于Stacking集成学习模型的电力用户画像方法,包括:
[0007]获取电力用户的电力工单数据集,电力工单数据集包括文本类数据和数值类数据;
[0008]对电力工单数据集进行特征提取,得到文本类数据的多层特征向量和数值类数据的多源特征向量;
[0009]基于Stacking集成学习模型,根据多层特征向量和多源特征向量预测电力用户的敏感度,并根据敏感度确定电力用户的用户画像,其中,Stacking集成学习模型包括一阶段预测层和二阶段预测层。
[0010]在一种可能的实现方式中,对电力工单数据集进行特征提取,得到文本类数据的多层特征向量和数值类数据的多源特征向量,包括:
[0011]对文本类数据进行多层特征提取,得到文本类数据的词语特征向量、用户特征向量和全局特征向量;
[0012]对数值类数据进行多源特征提取,得到数值类数据的字段特征向量。
[0013]在一种可能的实现方式中,对文本类数据进行多层特征提取,得到文本类数据的词语特征向量、用户特征向量和全局特征向量,包括:
[0014]利用CBOW算法对文本类数据进行处理,得到词语特征向量;
[0015]利用UDoc2vec算法对文本信息进行处理,得到用户特征向量;
[0016]利用UTF

IDF算法,计算文本类数据中各个词语的频率,并根据各个词语的频率确定全局特征向量。
[0017]在一种可能的实现方式中,根据各个词语的频率确定全局特征向量,包括:
[0018]对于每一个词语,若词语的频率大于预设频率,则将词语作为全局特征词语;
[0019]根据的全局特征词语确定全局特征向量。
[0020]在一种可能的实现方式中,基于Stacking集成学习模型,根据多层特征向量和多源特征向量预测电力用户的敏感度,包括:
[0021]将字段特征向量分别与词语特征向量、用户特征向量和全局特征向量进行拼接,得到电力用户的第一敏感度预测向量、第二敏感度预测向量和第三敏感度预测向量;
[0022]分别将第一敏感度预测向量、第二敏感度预测向量和第三敏感度预测向量输入Stacking集成学习模型进行预测,得到电力用户的敏感度。
[0023]在一种可能的实现方式中,Stacking集成学习模型的一阶段预测层包括MLP模型、CNN

LSTM模型和XGB模型,Stacking集成学习模型的二阶段预测层包括RF模型;
[0024]分别将第一敏感度预测向量、第二敏感度预测向量和第三敏感度预测向量输入Stacking集成学习模型进行预测,得到电力用户的敏感度,包括:
[0025]将第一敏感度预测向量、第二敏感度预测向量和第三敏感度预测向量划分为敏感度测试集和敏感度验证集;
[0026]将敏感度测试集输入MLP模型,得到用户的多个第一测试敏感度;将敏感度验证集输入MLP模型,得到用户的多个第一验证敏感度,并将多个第一验证敏感度求平均,得到第一平均验证敏感度;
[0027]将敏感度测试集输入CNN

LSTM模型,得到用户的多个第二测试敏感度;将敏感度验证集输入CNN

LSTM模型,得到用户的多个第二验证敏感度,并将多个第二验证敏感度求平均,得到第二平均验证敏感度;
[0028]将敏感度测试集输入XGB模型,得到用户的多个第三测试敏感度;将敏感度验证集输入XGB模型,得到用户的多个第三验证敏感度,并将多个第三验证敏感度求平均,得到第三平均验证敏感度;
[0029]将多个第一测试敏感度、多个第二测试敏感度和多个第三测试敏感度组成全新敏感度测试集;将第一验证敏感度、第二验证敏感度和第三验证敏感度组成全新敏感度验证集;
[0030]根据全新敏感度测试集对RF模型进行训练,并将全新敏感度验证集输入训练好的RF模型,预测得到电力用户的敏感度。
[0031]在一种可能的实现方式中,根据敏感度确定电力用户的用户画像,包括:
[0032]将敏感度大于预设敏感度阈值的电力用户划分为敏感用户;
[0033]根据所有敏感用户的电力工单数据绘制人型词云,确定电力用户的用户画像。
[0034]第二方面,本申请提供了一种基于Stacking集成学习模型的电力用户画像方法装置,包括:
[0035]数据获取模块,用于获取电力用户的电力工单数据集,电力工单数据集包括文本类数据和数值类数据;
[0036]特征提取模块,用于对电力工单数据集进行特征提取,得到文本类数据的多层特征向量和数值类数据的多源特征向量;
[0037]敏感度预测模块,用于基于Stacking集成学习模型,根据多层特征向量和多源特征向量预测电力用户的敏感度,并根据敏感度确定电力用户的用户画像,其中,Stacking集成学习模型包括一阶段预测层和二阶段预测层。
[0038]第三方面,本申请提供了一种电子设备,包括存储器和处理器,存储器中存储有可在处理器上运行的计算机程序,处理器执行计算机程序时实现如上第一方面或第一方面的任一种可能的实现方式基于Stacking集成学习模型的电力用户画像方法的步骤。
[0039]第四方面,本申请提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现如上第一方面或第一方面的任一种可能的实现方式基于Stacking集成学习模型的电力用户画像方法的步骤。
[0040]本申请提供一种基于Stacking集成学习模型的电力用户画像方法,通过获取电力用户的电力工单数据集,电力工单数据集包括文本类数据和数值类数据;对电力工单数据集进行特征提取,得本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于Stacking集成学习模型的电力用户画像方法,其特征在于,包括:获取电力用户的电力工单数据集,所述电力工单数据集包括文本类数据和数值类数据;对所述电力工单数据集进行特征提取,得到所述文本类数据的多层特征向量和所述数值类数据的多源特征向量;基于Stacking集成学习模型,根据所述多层特征向量和所述多源特征向量预测所述电力用户的敏感度,并根据所述敏感度确定所述电力用户的用户画像,其中,所述Stacking集成学习模型包括一阶段预测层和二阶段预测层。2.根据权利要求1所述的基于Stacking集成学习模型的电力用户画像方法,其特征在于,所述对所述电力工单数据集进行特征提取,得到所述文本类数据的多层特征向量和所述数值类数据的多源特征向量,包括:对所述文本类数据进行多层特征提取,得到所述文本类数据的词语特征向量、用户特征向量和全局特征向量;对所述数值类数据进行多源特征提取,得到所述数值类数据的字段特征向量。3.根据权利要求2所述的基于Stacking集成学习模型的电力用户画像方法,其特征在于,所述对所述文本类数据进行多层特征提取,得到所述文本类数据的词语特征向量、用户特征向量和全局特征向量,包括:利用CBOW算法对所述文本类数据进行处理,得到所述词语特征向量;利用UDoc2vec算法对所述文本信息进行处理,得到所述用户特征向量;利用UTF

IDF算法,计算文本类数据中各个词语的频率,并根据所述各个词语的频率确定所述全局特征向量。4.根据权利要求3所述的基于Stacking集成学习模型的电力用户画像方法,其特征在于,所述根据所述各个词语的频率确定所述全局特征向量,包括:对于每一个词语,若所述词语的频率大于预设频率,则将所述词语作为全局特征词语;根据所述的全局特征词语确定所述全局特征向量。5.根据权利要求2所述的基于Stacking集成学习模型的电力用户画像方法,其特征在于,所述基于Stacking集成学习模型,根据所述多层特征向量和所述多源特征向量预测所述电力用户的敏感度,包括:将所述字段特征向量分别与所述词语特征向量、所述用户特征向量和所述全局特征向量进行拼接,得到所述电力用户的第一敏感度预测向量、第二敏感度预测向量和第三敏感度预测向量;分别将所述第一敏感度预测向量、所述第二敏感度预测向量和所述第三敏感度预测向量输入Stacking集成学习模型进行预测,得到所述电力用户的敏感度。6.根据权利要求5所述的基于Stacking集成学习模型的电力用户画像方法,其特征在于,所述Stacking集成学习模型的一阶段预测层包括MLP模型、CNN

LSTM模型和XGB模型,所述Stacking集成学习模型的二阶段预测层包括RF模型;所述分别将所述第一敏感度预测向量、所述第二敏感度预测向量和所述第三敏感度预测向...

【专利技术属性】
技术研发人员:吴迪杜鑫宝蔡超志彭菲郑玉莹程鹏张乐冯丽明陈尧王晓宇
申请(专利权)人:河北工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1