基于双注意力神经网络的内容识别方法及装置制造方法及图纸

技术编号:37202064 阅读:20 留言:0更新日期:2023-04-20 22:57
本申请提供了一种基于双注意力神经网络的内容识别方法及装置,该基于双注意力神经网络的内容识别方法包括:获取通信运营商语料库,利用自动类别标签描述生成方式为每个类别标签生成对应的类别标签描述,计算通信运营商语料库中文本单词与类别标签之间的对应关系,得到标签表示矩阵;使用文本编码器对通信运营商的工单信息进行预处理,得到预处理文本表示;将预处理文本表示输入到自注意力机制网络,得到自注意力文本表示;将预处理文本表示输入到标签注意力神经网络,得到标签注意力文本表示;使用自适应门控制机制对自注意力文本表示和标签注意力文本表示处理,构建标签指导文本表示;将标签指导文本表示输入分类器,得到分类结果。到分类结果。到分类结果。

【技术实现步骤摘要】
基于双注意力神经网络的内容识别方法及装置


[0001]本申请涉及人工智能
,具体涉及一种基于双注意力神经网络的内容识别方法及装置。

技术介绍

[0002]在运营商客服作业流程中,产生了大量的客户反馈意见,每天需要花费大量的人力物力进行反馈意见的评定审查,对客户的投诉和要求进行传统的人工分类,并根据分类结果进行派单,这些工作占据了大量的人力和时间,并且人工的分类会出现分类效率低、准确率不高等问题。传统的文本分类方法基于人工提取有效特征,这些特征可用于有监督的学习方法或半监督的方法,如基于图的半监督算法。
[0003]但是,这些方法依赖于人工提取有效特征,在面对复杂的业务场景及不断增加的工单类型时,将会耗费大量的时间与精力,已经无法满足工单智能分类的需求。因此,需要使用深度学习对工单分类进行优化处理。一方面,通过获取历史工单处理情况训练神经网络模型,对实时工单做分类处理并预测对应接单班组,有助于提升工单流转效率,降低工单处理时长。另一方面,深度学习模型能够通过学习新的信息不断提升预测准确率,有助于降低运营成本、改善用户体验、提升企业竞本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于双注意力神经网络的内容识别方法,其特征在于,所述基于双注意力神经网络的内容识别方法包括:获取通信运营商语料库,利用自动类别标签描述生成方式为每个类别标签生成对应的类别标签描述,计算通信运营商语料库中文本单词与类别标签之间的对应关系,得到标签表示矩阵;使用文本编码器对通信运营商的工单信息进行预处理,得到预处理文本表示;将预处理文本表示输入到自注意力机制网络,得到自注意力文本表示;将预处理文本表示输入到标签注意力神经网络,得到标签注意力文本表示;使用自适应门控制机制对自注意力文本表示和标签注意力文本表示处理,构建标签指导文本表示;将标签指导文本表示输入分类器,得到分类结果。2.根据权利要求1所述的基于双注意力神经网络的内容识别方法,其特征在于,所述工单信息包括产品类型、服务类型以及服务内容,所述使用文本编码器对通信运营商的工单信息进行预处理,得到预处理文本表示,包括:使用下划线符号替换产品类型和服务类型中的正斜杠符号,使用连字符拼接产品类型和服务类型,生成工单类型;对服务内容进行文本预处理,过滤服务内容文本长度大于16或大于800的数据样本,将所有的字母转换为小写,将并使用Stanford CoreNLP对文本进行分词,得到文本单词;使用BiGRU作为文本编码器,将服务内容序列输入到文本编码器中,使用词向量矩阵把每个文本单词嵌入为词向量;将每个词向量输入到第1个BiGRU,其中,BiGRU由一个正向GRU和一个反向GRU组成;将正向GRU和后向GRU的隐藏状态拼接起来,得到整个服务内容文本的浅层隐藏状态;再将浅层隐藏状态输入到第2个BiGRU中,得到服务内容之间的交互作用信息,使用残差连接融合浅层隐藏状态和服务内容之间的交互作用信息,得到文本编码器输出的预处理文本表示。3.根据权利要求2所述的基于双注意力神经网络的内容识别方法,其特征在于,所述获取通信运营商语料库,利用自动类别标签描述生成方式为每个类别标签生成对应的类别标签描述,计算通信运营商语料库中文本单词与类别标签之间的对应关系,得到标签表示矩阵,包括:计算文本单词在服务内容文本中的TF

IDF值;根据TF

IDF值计算文本单词与类别标签的相关性得分;计算文本单词出现在相应服务内容文本中的不同类别标签的数量,根据文本单词与类别标签的相关性得分和文本单词出现在相应服务内容文本中的不同类别标签的数量确定文本单词相对于类别标签的基于逆类别标签频次的相关性分数;对每个类别标签选出相关性分数最高的多个文本单词作为类别标签的描述;使用词向量矩阵把每个描述类别标签的文本单词嵌入为词向量,通过词向量得到标签表示矩阵。4.根据权利要求3所述的基于双注意力神经网络的内容识别方法,其特征在于,所述将预处理文本表示输入到自注意力机制网络,得到自注意力文本表示,包括:采用自注意力机制计算预...

【专利技术属性】
技术研发人员:马晓亮安玲玲杜德泉宋灿辉赵搏文欧春雪黄淑婵罗睦军
申请(专利权)人:西安电子科技大学广州研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1