一种电网意见工单智能分类方法技术

技术编号:43587780 阅读:45 留言:0更新日期:2024-12-06 17:51
本发明专利技术涉及一种电网意见工单智能分类方法,包括以下步骤:收集电网供电服务工单数据,构建数据集,并进行预处理;将数据集中的文本数据进行分词,并转化为向量表示;预训练和微调BERT模块,动态获取需要分类的文本的前后语义信息,输出包含语义关系的文本向量;将Bert层输出的文本向量和文本输入词向量拼接后进行特征提取,输出包含更多特征和语义信息的文本向量;计算BiLSTM层输出的文本各词语的权重,对句子分类结果越重要的词,其权重越大;将加权后的输出映射到类别空间中,归一化处理,计算概率分布,概率值最大的类别即为文本数据最终所被分到的类别;本发明专利技术具有灵活性高、获取特征信息多、提升分类效果和准确性、减少人工分类时间的优点。

【技术实现步骤摘要】

本专利技术属于电力行业文本检测处理,具体涉及一种电网意见工单智能分类方法


技术介绍

1、随着信息化的快速发展,电网积累的数据越来越多,供电服务工单量每年海量增长,人工提取有效数据已经不能满足当前需要,高效快速的提取这些工单中的有效信息十分重要,电网的供电服务工单包括故障报修、查询咨询、业务申请、投诉、举报、意见建议、客户催办、营配稽查校核、疑似停电预警分析9个类别,对每个工单准确快速分类能够为电力行业供电服务工作者快速了解客户诉求提供有力的工作支撑,伴随着信息化时代的到来,目前的智能分类方法大多使用循环神经网络rnn模型分类,通过对输入的数据文本进行特征学习和特征提取,获取其中的重要信息,此方法文本向量的表示空间维度大,且泛化性不强,不保证特征获取的完整性,具有一定的局限性;因此,提供一种灵活性高、获取特征信息多、提升分类效果和准确性、减少人工分类时间的一种电网意见工单智能分类方法是非常有必要的。


技术实现思路

1、本专利技术的目的是为了克服现有技术的不足,而提供一种灵活性高、获取特征信息多、提升分类效果和本文档来自技高网...

【技术保护点】

1.一种电网意见工单智能分类方法,其特征在于:所述方法包括以下步骤:

2.如权利要求1所述的一种电网意见工单智能分类方法,其特征在于:所述步骤1具体包括以下步骤:

3.如权利要求1所述的一种电网意见工单智能分类方法,其特征在于:所述步骤2具体为:供电服务工单数据集中的数据由文本组成,每个文本中有一个或多个句子,Si代表第i个句子,用jieba分词工具对句子Si进行分词,得到该句子所对应的词序列{C1,C2,...,Cj},使用word2vector工具对这些词向量化后,得到对应的词向量

4.如权利要求1所述的一种电网意见工单智能分类方法,其特征在于:所...

【技术特征摘要】

1.一种电网意见工单智能分类方法,其特征在于:所述方法包括以下步骤:

2.如权利要求1所述的一种电网意见工单智能分类方法,其特征在于:所述步骤1具体包括以下步骤:

3.如权利要求1所述的一种电网意见工单智能分类方法,其特征在于:所述步骤2具体为:供电服务工单数据集中的数据由文本组成,每个文本中有一个或多个句子,si代表第i个句子,用jieba分词工具对句子si进行分词,得到该句子所对应的词序列{c1,c2,...,cj},使用word2vector工具对这些词向量化后,得到对应的词向量

4.如权利要求1所述的一种电网意见工单智能分类方法,其特征在于:所述步骤3中的二元交叉熵损失函数具体为:交叉熵损失函数l用于计算真实分类结果和模型预测结果的差值,作为模型训练的导向目标,其中,n是总样本数;xi、yi分别是第i个文本分类的真实值和预测值。

5.如权利要求4所述的一种电网意见工单智能分类方法,其特征在于:所述步骤3具体包括以下步骤:

6...

【专利技术属性】
技术研发人员:李雅笛李鑫侯文华郭歌成冬霞李向阳崔广涛魏政帅郑城市李健李军
申请(专利权)人:国网河南省电力公司济源供电公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1