一种文本分类方法及系统技术方案

技术编号:21343504 阅读:39 留言:0更新日期:2019-06-13 22:28
本发明专利技术实施例提供一种文本分类方法及系统。其中,方法包括:获取待分类的文本;将所述待分类的文本输入至文本分类模型中,根据所述文本分类模型的输出结果,获取所述待分类的文本的类别;其中,所述文本分类模型基于若干个卷积神经网络和若干个循环神经网络构成,并基于样本文本以及预先确定的文本类别标签进行训练后得到。本发明专利技术实施例提供的方法及系统,通过将CNN和RNN进行融合以构成文本分类模型,进而通过文本分类模型对文本进行分类,克服了CNN不适合提取长序列语义信息,以及RNN对长序列全局语义信息的提取效果的不足,能够既适合提取局部语义信息,也适合提取长序列全局语义信息,从而使得文本分类准确率大大提高。

A Text Classification Method and System

The embodiment of the present invention provides a text classification method and system. Among them, the methods include: acquiring the text to be classified; inputting the text to be classified into the text classification model, obtaining the categories of the text to be classified according to the output of the text classification model; in which the text classification model is based on several convolutional neural networks and several cyclic neural networks, and is based on sample text and predefined. Text category labels are obtained after training. The method and system provided by the embodiment of the present invention, by fusing CNN and RNN to form a text classification model, and then classifying text by text classification model, overcomes the inadequacy of CNN in extracting long-sequence semantic information and RNN in extracting long-sequence global semantic information, and is suitable for extracting both local semantic information and long-sequence global semantic information. Semantic information greatly improves the accuracy of text categorization.

【技术实现步骤摘要】
一种文本分类方法及系统
本专利技术实施例涉及人工智能深度学习的自然语言处理
,尤其涉及一种文本分类方法及系统。
技术介绍
深度学习是现今实现文本分类任务效果最好的方式,其中卷积神经网络(ConvolutionalNeuralNetworks,CNN)和循环神经网络(RecurrentNeuralNetwork,RNN)是深度学习中应用范围最广的特征提取方法。CNN最早可追溯到1987年反向传播(Backpropagation,BP)算法的提出,然后于1989年YannLeCun将其用到多层神经网络中,直到1998年YannLeCun提出LeNet-5模型,CNN逐渐展露雏型。CNN可分为三个部分:输入层、隐藏层和输出层。在自然语言处理中,输入层的输入信息由预先训练好的词嵌入模型或词向量表示成输入序列,常用的词嵌入模型包括由Google在2013年提出的Word2vec模型和由StanfordNLPGroup于2014年提出的Glove模型等。隐藏层主要由卷积层、池化层和全连接层组成,其中卷积层负责提取输入序列的语义特征,池化层负责语义特征的选择和过滤,全连接层负责语义特征的组合本文档来自技高网...

【技术保护点】
1.一种文本分类方法,其特征在于,包括:获取待分类的文本;将所述待分类的文本输入至文本分类模型中,根据所述文本分类模型的输出结果,获取所述待分类的文本的类别;其中,所述文本分类模型基于若干个卷积神经网络和若干个循环神经网络构成,并基于样本文本以及预先确定的文本类别标签进行训练后得到。

【技术特征摘要】
1.一种文本分类方法,其特征在于,包括:获取待分类的文本;将所述待分类的文本输入至文本分类模型中,根据所述文本分类模型的输出结果,获取所述待分类的文本的类别;其中,所述文本分类模型基于若干个卷积神经网络和若干个循环神经网络构成,并基于样本文本以及预先确定的文本类别标签进行训练后得到。2.根据权利要求1所述的方法,其特征在于,将所述待分类的文本输入至文本分类模型中,根据所述文本分类模型的输出结果,获取所述待分类的文本的类别,包括:将所述待分类的文本输入至所述文本分类模型的输入层,获取所述输入层输出的所述待分类的文本以词向量表示的输入序列;将所述输入序列输入至所述文本分类模型的隐藏层,获取所述隐藏层输出的所述输入序列的融合特征向量对应的各文本类别标签的预测得分;将所述融合特征向量对应的各文本类别标签的预测得分输入至所述文本分类模型的输出层,获取所述输出层输出的所述融合特征向量对应的各文本类别标签的预测概率,并将预测概率最大的文本类别标签对应的类别作为所述待分类的文本的类别。3.根据权利要求2所述的方法,其特征在于,所述隐藏层包括若干个卷积神经网络和若干个循环神经网络;相应地,将所述输入序列输入至所述文本分类模型的隐藏层,获取所述隐藏层输出的所述输入序列的融合特征向量对应的各文本类别标签的预测得分,包括:将所述输入序列输入至每一所述卷积神经网络和每一所述循环神经网络,获取每一所述卷积神经网络提取到的所述输入序列的第一特征向量和每一所述循环神经网络提取到的所述输入序列的第二特征向量;将所有第一特征向量和所有第二特征向量进行拼接,将拼接得到的向量作为所述输入序列的融合特征向量,并获取所述融合特征向量对应的各文本类别标签的预测得分。4.根据权利要求1所述的方法,其特征在于,所述文本分类模型包括输入层、隐藏层和输出层,其中,所述隐藏层包括若干个卷积神经网络和若干个循环神经网络;相应地,所述文本分类模型的训练步骤,包括:将所述样本文本输入至所述文本分类模型的输入层,获取所述输入层输出的所述样本文本以词向量表示的输入序列;将所述输入序列输入至所述文本分类模型的隐藏层,获取所述隐藏层中每一所述卷积神经网络输出的所述输入序列的第一特征向量对应的各文本类别标签的预测得分、每一所述循环神经网络输出的所述输入序列的第二特征向量对应的各文本类别标签的预测得分以及所述输入序列的融合特征向量对应的各文本类别标签的预测得分;其中,所述融合特征向量为将所有第一特征向量和所有第二特征向量进行拼接得到;将每一第一特征向量对应的各文本类别标签的预测得分、每一第二特征向量对应的各文本类别标签的预测得分以及所述融合特征向量对应的各文本类别标签的预测得分输入至所述文本分类模型的输出层,获取所述输出层输出的每一第一特征向量对应的各文本类别标签的预测概率、每一第二特征向量对应的各文本类别标签的预测概率以及所述融合特征向量对应的各文本类别标...

【专利技术属性】
技术研发人员:双锴胡皓张文涛姚云腾
申请(专利权)人:北京邮电大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1