基于深度学习的问题分类模型训练方法、分类方法及装置制造方法及图纸

技术编号:16456220 阅读:129 留言:0更新日期:2017-10-25 20:42
本发明专利技术公开了一种基于深度学习的问题分类模型训练方法、问题分类方法以及装置。其中问题分类模型训练方法包括:提取问题文本样本中的特征信息样本,并生成对应的第一特征向量样本;对第一特征向量样本进行空间变换,得到第二特征向量样本;将第二特征向量样本输入至多层卷积神经网络中的多个卷积层和多个池化层,以通过叠加卷积操作和池化操作,得到第一融合特征向量样本;将第一融合特征向量样本输入至多层卷积神经网络中的全连接层,得到全局特征向量样本;根据全局特征向量样本对Softmax分类器进行训练,得到问题分类模型。该方法可免去大量人工设计特征的开销,通过该问题分类模型可以得到更加准确的分类结果,提高了标准问题与答案的定位。

Training method, classification method and device of problem classification model based on deep learning

The invention discloses a problem classification model training method, a problem classification method and a device based on deep learning. Including the classification model training method: extracting feature information of sample problems in the text sample, the first eigenvectors and generate a corresponding; space transformation for the first eigenvectors, obtained second eigenvectors; a plurality of volume second laminated sample feature vectors are input to the convolutional neural network in multilayer and multiple pool layer by superposition convolution operation and pool operation, get the first fusion feature vector samples; the first fusion feature vector sample input to the convolutional neural network in the multi connection layer, get the global feature vectors; according to the global feature vector samples to train the Softmax classifier, the classification model is obtained. This method can avoid the cost of a large number of artificial design features, and the classification model can get more accurate classification results, and improve the positioning of the standard questions and answers.

【技术实现步骤摘要】
基于深度学习的问题分类模型训练方法、分类方法及装置
本专利技术涉及计算机与互联网
,尤其涉及一种基于深度学习的问题分类模型训练方法、问题分类方法以及装置。
技术介绍
目前的问答系统面临人力资源消耗大、响应不及时等缺陷。自动问答系统的目标是在给定问题情况下,给出简短、精确的答案,无论是业界应用还是学术研究,问句的真实意图分析、问句与答案之间的匹配关系判别仍然是制约自动问答系统性能的两个关键难题。众所周知,问题分类根据预期答案对问题进行分类,可快速定位标准问题与答案的大概位置。所以,问题分类是自动问答系统中分析问句真实意图、判别问句与答案匹配关系的重要模块,问题分类的效率和精度显著地影响着问答系统的性能。相关技术中,目前的问题分类研究大多基于机器学习的方法,致力于从问题中提取词法、句法、语义特征,研究在人工定义特征之上的关系学习,模型的效果很依赖特征的设计,然后应用例如朴素贝叶斯、决策树、支持向量机、最大熵等各种监督学习的方法来构建分类器,进而进行预测。但是,目前存在的问题是,机器学习需要人工提取特征,模型的精度很依赖特征的设计,并且,问答系统中用户的输入问题通常属于短文本且用词多本文档来自技高网...
基于深度学习的问题分类模型训练方法、分类方法及装置

【技术保护点】
一种基于深度学习的问题分类模型训练方法,其特征在于,包括以下步骤:获取问题文本样本;提取所述问题文本样本中的特征信息样本,并根据所述特征信息样本生成对应的第一特征向量样本;对所述第一特征向量样本进行空间变换,得到第二特征向量样本;将所述第二特征向量样本输入至多层卷积神经网络中的多个卷积层和多个池化层,以通过叠加卷积操作和池化操作,得到第一融合特征向量样本;将所述第一融合特征向量样本输入至所述多层卷积神经网络中的全连接层,得到全局特征向量样本;根据所述全局特征向量样本对Softmax分类器进行训练,得到所述问题分类模型。

【技术特征摘要】
1.一种基于深度学习的问题分类模型训练方法,其特征在于,包括以下步骤:获取问题文本样本;提取所述问题文本样本中的特征信息样本,并根据所述特征信息样本生成对应的第一特征向量样本;对所述第一特征向量样本进行空间变换,得到第二特征向量样本;将所述第二特征向量样本输入至多层卷积神经网络中的多个卷积层和多个池化层,以通过叠加卷积操作和池化操作,得到第一融合特征向量样本;将所述第一融合特征向量样本输入至所述多层卷积神经网络中的全连接层,得到全局特征向量样本;根据所述全局特征向量样本对Softmax分类器进行训练,得到所述问题分类模型。2.如权利要求1所述的方法,其特征在于,所述提取所述问题文本样本中的特征信息样本,并根据所述特征信息样本生成对应的第一特征向量样本,包括:基于多通道卷积神经网络,提取所述问题文本样本中的特征信息样本,并根据所述特征信息样本生成对应的第一特征向量样本。3.如权利要求2所述的方法,其特征在于,其中,所述通道的个数为2个。4.如权利要求1所述的方法,其特征在于,所述卷积层为基于Garbor核函数的卷积神经网络;其中,所述Garbor核函数通过以下公式表示:其中,guv(x,y)为所述Garbor核函数,x和y分别为核的中心点,i为复数的虚部,k为高斯核的幅度的比例,其中,v为gabor滤波的波长,u为gabor核函数的方向,K为总的方向数,并且表示滤波器的高度。5.如权利要求1所述的方法,其特征在于,在所述将所述第二特征向量样本输入至多层卷积神经网络中的多个卷积层和多个池化层,以通过叠加卷积操作和池化操作,得到第一融合特征向量样本之后,所述方法还包括:分别将进行卷积操作和池化操作输出的中间隐藏层中的特征向量样本,通过加权计算进行特征融合,得到第二融合特征向量样本;其中,所述将所述第一融合特征向量样本输入至所述多层卷积神经网络中的全连接层,得到全局特征向量样本,包括:将所述第一融合特征向量样本和所述第二融合特征向量样本输入至所述多层卷积神经网络中的全连接层,得到所述全局特征向量样本。6.一种通过使用如权利要求1至5中任一项所述的问题分类模型进行问题分类的方法,其特征在于,包括以下步骤:获取用户的输入问题;对所述输入问题进行分词处理,并将分词处理后的输入问题输入至所述问题分类模型进行预测,确定所述输入问题所属的分类类别。7.一种...

【专利技术属性】
技术研发人员:鄂海红宋美娜王昕睿胡莺夕赵鑫禄白杨王宁
申请(专利权)人:北京邮电大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1