一种基于LAV参数微调的电力工单层次文本分类方法及系统技术方案

技术编号:25599056 阅读:29 留言:0更新日期:2020-09-11 23:56
本发明专利技术公开了一种基于LAV参数微调的电力工单层次文本分类方法及系统,包括,利用注意力机制对文本特征向量分配不同的注意力权重并进行加权求和,获得标签特征向量;结合全连接神经网络和sigmoid函数计算标签特征向量的分类概率,输出分类预测结果;基于交叉熵构建损失函数训练文本特征向量、标签特征向量及分类概率;将训练完成的上层标签的标签特征向量的参数值作为下层标签的标签特征向量的初始值,对其进行训练微调,直至完成标签结构中全部的标签注意力向量训练,得到与其对应的分类结果。本发明专利技术通过参数微调改善下层标签因训练文本数据太少导致的分类效果较差的问题,实现了对层次结构标签电力工单文本的快速、准确分类。

【技术实现步骤摘要】
一种基于LAV参数微调的电力工单层次文本分类方法及系统
本专利技术涉及计算机自然语言文本分类的
,尤其涉及一种基于LAV参数微调的电力工单层次文本分类方法及系统。
技术介绍
通过文本分类技术实现电力工单的自动分类可加快电力工单的处理效率,有利于电力客户诉求的及时处理,从而提高客户对电力公司的满意度。电力工单的类别标签具有树形的层次结构,树中的父类标签与子类标签有依赖关系。例如:“低压架空线路故障”、“低压电缆线路故障”、“低压设备故障”,这三个标签有一个共同的父标签“低压故障”;而在“低压设备故障”这个标签下又有“熔断器故障”、“隔离开关故障”、“漏电保护器故障”、“断路器故障”等多个子标签。在分类时,属于某子标签的电力工单必然也同时属于其父标签。层次分类的这一特点,会造成层次结构中靠近根结点的上层标签如“低压故障”训练文本数据充足,而下层标签如“断路器故障”训练文本数据缺乏。机器学习方法需要大量的标记数据作为模型的训练数据。如果训练数据不足将直接导致不良的测试结果。现有的电力工单分类方法,因未考虑类别标签之间的层次结构,从而受到树形层次本文档来自技高网...

【技术保护点】
1.一种基于LAV参数微调的电力工单层次文本分类方法,其特征在于:包括,/n利用注意力机制对文本特征向量分配不同的注意力权重并进行加权求和,获得标签特征向量;/n结合全连接神经网络和sigmoid函数计算所述标签特征向量的分类概率,输出分类预测结果;/n基于交叉熵构建损失函数训练所述文本特征向量、所述标签特征向量及所述分类概率;/n将训练完成的上层标签的所述标签特征向量的参数值作为下层标签的所述标签特征向量的初始值,对其进行训练微调,直至完成标签结构中全部的所述标签注意力向量训练,得到与其对应的分类结果。/n

【技术特征摘要】
1.一种基于LAV参数微调的电力工单层次文本分类方法,其特征在于:包括,
利用注意力机制对文本特征向量分配不同的注意力权重并进行加权求和,获得标签特征向量;
结合全连接神经网络和sigmoid函数计算所述标签特征向量的分类概率,输出分类预测结果;
基于交叉熵构建损失函数训练所述文本特征向量、所述标签特征向量及所述分类概率;
将训练完成的上层标签的所述标签特征向量的参数值作为下层标签的所述标签特征向量的初始值,对其进行训练微调,直至完成标签结构中全部的所述标签注意力向量训练,得到与其对应的分类结果。


2.根据权利要求1所述的基于LAV参数微调的电力工单层次文本分类方法,其特征在于:获得所述文本特征向量,包括,
将待分类的电力工单文本进行分词以获得词序列;
依次转换所述词序列中每个词的语义信息对应成为词向量,集成词向量矩阵;
将所述词向量矩阵输入卷积神经网络中,利用卷积窗口矩阵提取所述文本特征向量。


3.根据权利要求1或2所述的基于LAV参数微调的电力工单层次文本分类方法,其特征在于:获得所述标签特征向量包括,
对类别标签层次结构中第一层的每个标签创建标签注意向量并随机初始化;
利用所述注意力机制为所述文本特征向量分配不同的所述注意力权重;
对每个所述文本特征向量与所述注意力权重进行加权求和,得到所述标签特征向量;
最终获得与所述标签层次结构中第一层的所有标签相对应的所述标签特征向量。


4.根据权利要求3所述的基于LAV参数微调的电力工单层次文本分类方法,其特征在于:计算所述分类概率包括,
将所述标签特征向量连接全连接神经网络;
利用所述sigmoid函数计算所述全连接网络的输出,得到每个所述标签的所述分类概率;
根据所述分类概率输出所述分类预测结果。


5.根据权利要求4所述的基于LAV参数微调的电力工单层次文本分类方法,其特征在于:进行所述训练微调,具体包括,
将所述标签分类预测结果与所述待分类电力工单文本的真实类别标签作为所述交叉熵,计算损失函数值;
利用Adam梯度下降最小化优化所述损伤函数值;
训练、更新、微调所述文本特征向量、所述标签特征向量及所述分类概率。


6.根据权利要求5所述的基于LAV参数微调的电力工单层次文本分类方法,其特征在于:所述微调包括,
将第一层标签的所述标签注意力向量的参数作为初始值赋给第二层中的子标签;
对其进行训练微调,待所述损伤函数收敛后,将第二层标签的所述标...

【专利技术属性】
技术研发人员:杜海舟钱金谷韩平张可可张少华
申请(专利权)人:上海电力大学
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1