在文本识别领域训练神经网络的方法、文本识别方法技术

技术编号:37157934 阅读:34 留言:0更新日期:2023-04-06 22:20
本发明专利技术公开了一种在文本识别领域训练神经网络的方法、文本识别方法,涉及文本识别的技术领域,可以解决目前文本识别不能识别意图顺序的技术问题。在文本识别领域训练神经网络的方法包括:对训练文本执行分词操作,以将其转换为词向量组成的矩阵;重复执行以下步骤,直至连接时序分类方法的损失函数小于预定值,以得到训练好的神经网络:将词向量组成的矩阵输入神经网络,通过神经网络计算得到特征向量;使用连接时序分类方法接收特征向量,并计算连接时序分类方法的损失函数;判断损失函数是否小于预定值;在损失函数不小于预定值的情况下,使用损失函数更新神经网络的参数的权值。根据本发明专利技术技术方案,可以识别文本意图顺序。序。序。

【技术实现步骤摘要】
在文本识别领域训练神经网络的方法、文本识别方法


[0001]本专利技术涉及文本识别
,尤其涉及一种在文本识别领域训练神经网络的方法、文本识别方法。

技术介绍

[0002]随着深度学习的发展,文本分类的精度越来越高,比如常见的卷积神经网络模型、循环神经网络模型或者二者的组合模型,联合softmax损失函数,可以在文本分类任务上达到很高的精度。然而,在某些场合下,这种单分类的模型已经远远不能满足要求。比如,以自然语言处理领域中的意图识别为例。其中,一个文本可能不止一个意图,在需要将其中的意图全部识别出来时,需要用到多分类模型,即一个文本需要有多个分类标签。
[0003]针对上述需求,通过使用上述卷积神经网络模型、循环神经网络模型或者二者的组合模型,并改变其损失函数——将softmax函数改为多个sigmoid函数即可。由于sigmoid函数的取值范围是(0,1),因此可以为每个类别设定一个临界值。该临界值可以拟合得出,也可简单设为0.5,类别大于该临界值则认为文本属于此类别。如果有多个类别大于临界值,则认为文本有多个分类。
[本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种在文本识别领域训练神经网络的方法,包括:对训练文本执行分词操作,以将训练文本转换为词向量组成的矩阵;重复执行以下步骤,直至连接时序分类方法的损失函数小于预定值,以得到训练好的神经网络:将词向量组成的矩阵输入神经网络,通过神经网络计算得到特征向量;使用连接时序分类方法接收所述特征向量,并计算连接时序分类方法的损失函数;判断所述损失函数是否小于预定值;在损失函数不小于预定值的情况下,使用所述损失函数更新所述神经网络的参数的权值。2.如权利要求1所述的在文本识别领域训练神经网络的方法,其中,所述神经网络包括卷积神经网络和循环神经网络,且所述方法还包括:将所述词向量组成的矩阵扩展为三重张量,以输入至卷积神经网络中。3.如权利要求1所述的在文本识别领域训练神经网络的方法,其中,“对训练文本执行分词操作”包括:将组成一个词的两个以上的字,识别为一个词的组成部分。4.一种文本识别方法,包括:接收文本输入;对文本输入执行分词操作,以将文本输入转换为词向量组成的矩阵;将词向量组成的矩阵输入到如权利要求1所述的在文本识别领域训练神经网络的方法训练出来的神经网络,得到文本输入的意图。5.如权利要求4所述的文本识别方法,还包括:将所述意图输出至智能机器,以便于与智能机器展开对话。6.一种在文本识别领域训练神经网络的装置,包括:分词模块,用于对训练文本执行分词操作,以将训练文本转换为词向量组成的矩阵;训练模块,包括:神经网络子模块,用于接收词向量...

【专利技术属性】
技术研发人员:徐丞申刘荣黄萧喻杰李晓华张金伟
申请(专利权)人:天津车之家软件有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1