【技术实现步骤摘要】
一种基于神经网络的自然语言处理方法和电子设备
本专利技术涉及人工智能
,特别是一种基于神经网络的自然语言处理方法和电子设备。
技术介绍
神经网络(特别是卷积神经网络)已广泛应用于自然语言处理领域。卷积的本质是用一种核函数对输入数据进行特征提取的过程,卷积的输出是提取出来的特征(以映射矩阵表示)。卷积的输入数据可以为NHWC格式,即[batch,in_height,in_width,in_channels],包括batch(批次)、height(高度)、width(宽度)、channels(通道)四个维度,其中高度维度表示输入数据的长度。现有技术中,在卷积神经网络的推理和训练过程中,卷积的输入数据的高度、宽度和输入通道数都被设计成固定的数值。例如,若输入数据为用户语句,则无论输入的用户语句的实际长度为多少,输入数据的高度均设定为固定的最大值(如60),如果用户语句的实际字数量少于60,则后面用特定值补齐到60个字,在进行卷积计算的时候仍然按照60个字来计算。然而,在自然语言处理领域,作为输入数据的用户语句(即用户讲话内容 ...
【技术保护点】
1.一种基于神经网络的自然语言处理方法,其特征在于,包括:/n接收输入的自然语句作为输入语句,根据所述输入语句中的字数量生成所述输入语句的长度信息;/n确定所述输入语句中各字的索引,根据各所述字的索引从字向量表中查找到各所述字的向量值,得到所述输入语句的字向量矩阵;/n采用卷积核对所述字向量矩阵进行卷积计算,得到特征映射矩阵,其中,在所述卷积计算中,根据所述输入语句的长度信息执行相应次数的所述字向量矩阵与所述卷积核之间的乘法运算;/n对所述特征映射矩阵进行激活和池化,得到降维特征映射矩阵;/n基于所述降维特征映射矩阵进行意图识别,得到所述输入语句的分类标签矩阵,所述分类标签 ...
【技术特征摘要】
1.一种基于神经网络的自然语言处理方法,其特征在于,包括:
接收输入的自然语句作为输入语句,根据所述输入语句中的字数量生成所述输入语句的长度信息;
确定所述输入语句中各字的索引,根据各所述字的索引从字向量表中查找到各所述字的向量值,得到所述输入语句的字向量矩阵;
采用卷积核对所述字向量矩阵进行卷积计算,得到特征映射矩阵,其中,在所述卷积计算中,根据所述输入语句的长度信息执行相应次数的所述字向量矩阵与所述卷积核之间的乘法运算;
对所述特征映射矩阵进行激活和池化,得到降维特征映射矩阵;
基于所述降维特征映射矩阵进行意图识别,得到所述输入语句的分类标签矩阵,所述分类标签矩阵包含各分类标签的概率值;
对所述分类标签矩阵中所有分类标签的概率值进行归一化,得到所述输入语句的意图识别结果。
2.根据权利要求1所述的自然语言处理方法,其特征在于,所述长度信息为布尔指针类型的掩码。
3.根据权利要求1所述的自然语言处理方法,其特征在于,在所述卷积计算中,根据所述输入语句的长度信息执行相应次数的所述字向量矩阵与所述卷积核之间的乘法运算,包括:
以边缘不填充、卷积步长为1的方式,令所述卷积核在所述字向量矩阵的高度维度上滑行,以执行相应次数的所述字向量矩阵与所述卷积核之间的乘法运算,其中,所述卷积核的滑行行程等于所述输入语句的长度信息所指示的所述输入语句的字数量,所述相应次数等于所述输入语句的长度信息所指示的所述输入语句的字数量与所述卷积核的尺寸的差加上1得到的数值。
4.根据权利要求1所述的自然语言处理方法,其特征在于,在所述卷积计算中,根据所述输入语句的长度信息执行相应次数的所述字向量矩阵与所述卷积核之间的乘法运算,包括:
以在所述输入语句的尾部进行边缘填充、卷积步长为1的方式,令所述卷积核在所述字向量矩阵的高度维度上滑行,以执行相应次数的所述字向量矩阵与所述卷积核之间的乘法运算,其中,所述卷积核在所述字向量矩阵的高度维度上的滑行行程等于所述输入语句的长度信息所指示的所述输入语句的字数量加上所述卷积核的尺寸减1;所述相应次数等于所述输入语句的长度信息所指示的所述输入语句的字数量。
5.根据权利要求1所述的自然语言处理方法,其特征在于,
在同一个加速器上执行所述采用卷积核对所述字向量矩阵进行卷积计算,得到特征...
【专利技术属性】
技术研发人员:黄海荣,李林峰,王靖宇,
申请(专利权)人:湖北亿咖通科技有限公司,
类型:发明
国别省市:湖北;42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。