The invention discloses a network layer structure for short text intention recognition, including CNN layer, feature connection layer and full connection layer, wherein, CNN layer is used for convolution operation of input sentence matrix through convolution window containing N convolution kernels, and then maximum pooling operation is used to extract n features; feature connection layer is used for convolution operation after CNN layer completes convolution operation Vertical superposition forms m-dimensional features; the full connection layer is constructed by decreasing neurons in each layer, so that the deep neurons can represent more complex features. The full connection layer is used to input the characteristic values of m-dimensional features obtained from the feature connection layer, and calculate the final output calculation results. The network layer structure of the invention realizes a method of intention classification by combining CNN and a fully connected deep learning network. The test shows that the goal of intention recognition can be achieved within 10 milliseconds, and the accuracy is guaranteed to be more than 98%.
【技术实现步骤摘要】
用于短文本意图识别的网络层结构及短文本意图识别方法
本专利技术涉及自然语言处理
,特别涉及用于短文本意图识别的网络层结构及短文本意图识别方法。
技术介绍
近年来,AI计算迅猛发展,在很多方向上都有突破,特别是最近几年神经网络的崛起、google的深度学习框架tensorflow的飞速发展,给人工智能注入新的血液,同时传统机器学习方法在自然语言处理领域的应用也显得十分乏力,而深度学习在各种自然语言处理任务上显得十分得心应手,这使我们尝试使用深度学习来处理自然语言的任务,比如意图识别。意图识别可以转化为文本分类问题,以前处理文本分类的问题主要用传统的机器学习方法,比如SVM。但是目前文本分类有一些明显的特征:数据量大,训练数据几十万甚至上千万条、维度高,每行文本的维度可能高达200-800维、对于分类速度要求高,某些场景下需要分类速度在10ms以内。传统机器学习就不太适合处理这类分类任务,而神经网络可以很好地完成这类任务。目前,大部分的意图识别方法采用多层神经网络、lstm等网络结构,为了提高速度减少多层网络的层数,导致数据欠拟合,识别度低,虽然采用复杂的lstm识别度高,但是速度较慢,不能满足使用需求。
技术实现思路
本专利技术的目的是克服上述
技术介绍
中不足,提供用于短文本意图识别的网络层结构及短文本意图识别方法,通过设计一种结合CNN与全连接的一种深度学习网络,实现一种意图分类的方法,试验证明可达到在10毫秒以内完成意图识别的目标,且准确度保证在98%以上。为了达到上 ...
【技术保护点】
1.一种用于短文本意图识别的网络层结构,其特征在于,包括CNN层、特征连接层、全连接层,其中,所述CNN层用于对输入句矩阵通过包含n个卷积核的卷积窗口的卷积操作,然后使用最大池化操作,提取出n个特征;所述特征连接层用于在CNN层完成卷积操作后对得到的特征进行纵向叠加形成m维特征;所述全连接层采用每层神经元递减的方式搭建,使深层神经元能够代表更复杂的特征,全连接层用于将特征连接层得到的m维特征的特征值作为输入,并进行计算最终输出计算结果。/n
【技术特征摘要】
1.一种用于短文本意图识别的网络层结构,其特征在于,包括CNN层、特征连接层、全连接层,其中,所述CNN层用于对输入句矩阵通过包含n个卷积核的卷积窗口的卷积操作,然后使用最大池化操作,提取出n个特征;所述特征连接层用于在CNN层完成卷积操作后对得到的特征进行纵向叠加形成m维特征;所述全连接层采用每层神经元递减的方式搭建,使深层神经元能够代表更复杂的特征,全连接层用于将特征连接层得到的m维特征的特征值作为输入,并进行计算最终输出计算结果。
2.根据权利要求1所述的一种用于短文本意图识别的网络层结构,其特征在于,所述CNN层包括第一CNN层及第二CNN层,所述第一CNN层用于对输入句矩阵通过包含n个卷积核的卷积窗口的卷积操作,然后使用最大池化操作,提取出n个特征,所述第二CNN层用于对输入句矩阵通过包含n个卷积核的卷积窗口的卷积操作,然后使用最大池化操作,提取出n个特征。
3.根据权利要求2所述的一种用于短文本意图识别的网络层结构,其特征在于,所述特征连接层用于在CNN层完成卷积操作后对得到两组特征进行纵向叠加形成m维特征,m=2n。
4.根据权利要求2所述的一种用于短文本意图识别的网络层结构,其特征在于,所述全连接层包含一个输入层、一个输出层、二个隐藏层,其中,输入层维度为2n,输出层是N个分类的神经元节点,二个隐藏层分别为n个神经元和n/2个神经元。
5.根据权利要求2至4中任一所述的一种用于短文本意图识别的网络层结构,其特征在于,n=128。
6.根据权利要求5所述的一种用于短文本意图识别的网络层结构,其特征在于,所述第一CNN层的卷积窗口大小为1,所述第二CNN层的卷积窗口大小为2。
7.一种短文本...
【专利技术属性】
技术研发人员:周杰,李足红,贾川江,张清静,
申请(专利权)人:四川长虹电器股份有限公司,
类型:发明
国别省市:四川;51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。