基于卷积神经网络与多注意力机制的工单文本分类算法制造技术

技术编号：24497955 阅读：27 留言：0更新日期：2020-06-13 03:48

本发明专利技术提供基于卷积神经网络与多注意力机制的工单文本分类算法，包括训练集获取步骤，文本分词步骤，词向量训练步骤，句子拆分步骤，转换词向量步骤，句子级卷积神经网络步骤；句子级注意力机制步骤；句子级全连接步骤，文档处理步骤，类步骤，包括将步骤S9中获取的文档特征向量进行线性变换，然后用softmax函数产生在类集合C上各个分类的概率。将模型设计成两部分，即句子层级和文档层级。先在句子层级提取句子特征，然后在文档层级提取文档特征用于分类。这样的模型结构既能保证文本全部被输入模型，又能避免模型过于庞大而造成的计算上的浪费。

Work order text classification algorithm based on convolutional neural network and multi attention mechanism

全部详细技术资料下载

【技术实现步骤摘要】
基于卷积神经网络与多注意力机制的工单文本分类算法
本专利技术涉及计算机自然语言处理文本分类领域，特别涉及基于卷积神经网络与多注意力机制的工单文本分类算法。
技术介绍
对于供电公司来说，用户的投诉代表着机遇同时带来巨大挑战，庞大的投诉工单使得分流人员需要阅读全部工单的同时进行准确分配到合适的处理部门，不仅效率低正确率也无法保证。及时并高效地处理好用户的投诉可以高企业的形象、增加口碑、及时调整自己的业务方向改进服务质量、提高同等竞争力有很大帮助。反之如果用户诉求无法及时解决，或者分配到错误的处理人手上不仅企业形象大打折扣，还会造成投诉工单的积压，口碑下滑甚至由于用户恐慌造成大面积投诉，产生负面消息。因此怎么样快速准确的对电力投诉文本进行分类是当今各供电公司面临的巨大挑战。随着近年来人工神经网络方法的兴起，各种基于人工神经网络的算法也被应用于自然语言处理的文本分类领域，并展现出优于其他传统分类方法的性能。其中最常见的实现方式是通过卷积神经网络对文本进行分类。卷积神经网由于能够通过卷积窗口捕捉文本中不同位置的局部特征，因此具有强大的句子建模能力。与其他人工神经网络模型相比，卷积神经网络可以更好地捕获文本的语义。但是由于卷积窗口大小限制，卷积神经网络模型无法捕捉到远距离字词之间的依赖关系，从而造成在提取文本特征时的信息损失。其次，卷积神经网络默认提取的所有文本特征重要性是相等的，这导致与分类相关的重要特征无法发挥与其重要性相当的作用。而无关的噪音特征可能会对文本分类的效果造成干扰。第三，卷积神经网络输入文本长度固定，如...

【技术保护点】
1.基于卷积神经网络与多注意力机制的工单文本分类算法，其特征在于，所述工单文本分类算法包括：/nS1、训练集获取步骤，包括预先获取用于文本分类的训练集文件，包括电力投诉工单文本和对应标注好的的投诉类别标签；/nS2、文本分词步骤，包括使用python中文分词组件对通过步骤S1得到的文本进行分词，将每个文本都转换为词序列；/nS3、词向量训练步骤，包括使用gensim库中的word2vec组件中的skip-gram算法对通过步骤S2得到的词序列进行无监督训练，得到每个词对应的词向量；/nS4、句子拆分步骤，包括对获取到的词向量进行拆分得到词序列；/nS5、转换词向量步骤，包括将通过步骤S4得到的词序列中的每个词都转换为通过S3训练得到的对应的词向量；/nS6、句子级卷积神经网络步骤，包括将通过步骤S5中获取的2维矩阵分别作为句子级卷积神经网络的第一层；/nS7、句子级注意力机制步骤，包括通过注意力机制公式给在步骤S6中获取的中的卷积神经网络的输出的第一层中的各个词特征向量分配不同的注意力权重；/nS8、句子级全连接步骤，包括将将S7句子级注意力步骤的输出向量S通过全连接神经网络作线性变换...

【技术特征摘要】
1.基于卷积神经网络与多注意力机制的工单文本分类算法，其特征在于，所述工单文本分类算法包括：
S1、训练集获取步骤，包括预先获取用于文本分类的训练集文件，包括电力投诉工单文本和对应标注好的的投诉类别标签；
S2、文本分词步骤，包括使用python中文分词组件对通过步骤S1得到的文本进行分词，将每个文本都转换为词序列；
S3、词向量训练步骤，包括使用gensim库中的word2vec组件中的skip-gram算法对通过步骤S2得到的词序列进行无监督训练，得到每个词对应的词向量；
S4、句子拆分步骤，包括对获取到的词向量进行拆分得到词序列；
S5、转换词向量步骤，包括将通过步骤S4得到的词序列中的每个词都转换为通过S3训练得到的对应的词向量；
S6、句子级卷积神经网络步骤，包括将通过步骤S5中获取的2维矩阵分别作为句子级卷积神经网络的第一层；
S7、句子级注意力机制步骤，包括通过注意力机制公式给在步骤S6中获取的中的卷积神经网络的输出的第一层中的各个词特征向量分配不同的注意力权重；
S8、句子级全连接步骤，包括将将S7句子级注意力步骤的输出向量S通过全连接神经网络作线性变换，得到句子特征向量；
S9、文档处理步骤，包括将步骤S8中获取的句子特征向量拼接成一个向量作为文档级部分的输入；
S10、分类步骤，包括将步骤S9中获取的文档特征向量进行线性变换，然后用softmax函数产生在类集合C上各个分类的概率。

2.根据权利要求1所述的基于卷积神经网络与多注意力机制的工单文本分类算法，其特征在于，所述使用gensim库中的word2vec组件中的skip-gram算法对通过步骤S2得到的词序列进行无监督训练，得到每个词对应的词向量，包括：
使用python中的gensim库中的word2vec组件中的skip-gram算法对通过步骤S2得到的词序列进行无监...

【专利技术属性】
技术研发人员：王晓峰，周艳，范华，尉耀稳，霍凯龙，陈杰，翁利国，施凌震，徐舒妍，姜川，陶燕增，
申请(专利权)人：国网浙江杭州市萧山区供电有限公司，浙江中新电力工程建设有限公司自动化分公司，国网浙江省电力有限公司杭州供电公司，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人