车辆、车机设备及其基于神经网络的文本意图识别方法技术

技术编号:22166864 阅读:25 留言:0更新日期:2019-09-21 10:33
本申请提供一种车辆、车机设备及其基于神经网络的文本意图识别方法,神经网络获取输入的语言文本信息,根据预设置的占位符类型和字符长度对所述语言文本信息进行处理,对所述语言文本信息进行字符向量化处理,以得到每个字符的向量,对经过字符向量化处理的所述语言文本信息进行卷积处理以得到卷积矩阵,采用预设置的池化窗口对所述卷积矩阵进行池化处理,将经过池化处理的卷积矩阵中的负数值元素进行转换,拼接所述卷积矩阵以得到目标向量,丢弃拼接后的目标向量中的部分元素,神经网络对所述目标向量进行计算以识别得到与所述语言文本信息对应的文本意图。通过上述方式,本申请能够快速准确地识别中文短文本意图。

Vehicle, Locomotive Equipment and Text Intention Recognition Method Based on Neural Network

【技术实现步骤摘要】
车辆、车机设备及其基于神经网络的文本意图识别方法
本申请涉及语言识别
,具体涉及一种基于神经网络的文本意图识别方法,以及应用所述基于神经网络的文本意图识别方法的车机设备和车辆。
技术介绍
随着人工智能相关技术的更新迭代及快速发展,人机(人类与智能机器)之间的交互技术也取得了很大的进展,比如在汽车行业,人机多轮交互对话系统可以为车主提供顺畅和高效的人机互动。人机多轮交互对话系统操作简单,可提升车主在车内生活的便利性,同时,由于用户不再需要手动参与操作控制,所以不会分心、分神甚至转移视线去操作车辆,而只需要通过语音对话进行语音控制,这能够显著地增强车辆行驶中的安全性。一般而言,人机多轮对话系统包括语音识别(ASR)技术、自然语言理解(NLU)技术、对话管理(DM)技术、自然语言生成(NLG)技术和语音合成(TTS)技术几个主要部分,各个部分的技术相互之间是紧密相连的,特别而言,针对中文短文本意图的识别技术是该人机多轮对话系统能够实现自然语言理解的关键核心部分。但是,现有技术对于识别中文短文本意图的准确性以及识别速度都有待提高。
技术实现思路
本申请的目的在于,提供一种车辆、车机设备及其基于神经网络的文本意图识别方法,能够快速准确地识别中文短文本意图,便于人机多轮对话系统的自然语言理解。为解决上述技术问题,本申请提供一种基于神经网络的文本意图识别方法,作为其中一种实施方式,所述基于神经网络的文本意图识别方法包括:神经网络获取输入的语言文本信息;根据预设置的占位符类型和字符长度对所述语言文本信息进行处理;对所述语言文本信息进行字符向量化处理,以得到每个字符的向量;对经过字符向量化处理的所述语言文本信息进行卷积处理以得到卷积矩阵;采用预设置的池化窗口对所述卷积矩阵进行池化处理;将经过池化处理的卷积矩阵中的负数值元素进行转换;拼接所述卷积矩阵以得到目标向量;丢弃拼接后的目标向量中的部分元素;神经网络对所述目标向量进行计算以识别得到与所述语言文本信息对应的文本意图。作为其中一种实施方式,所述神经网络对所述目标向量进行计算以识别得到与所述语言文本信息对应的文本意图的步骤,还包括:对识别得到的至少多个文本意图进行损失值和/或准确率计算,以得到每个文本意图类别的概率;利用预训练得到的预测意图类别概率与实际意图类别的交叉熵处理得到用于输出的最终意图。作为其中一种实施方式,所述将经过池化处理的卷积矩阵中的负数值元素进行转换的步骤,具体包括:采用RELU激活函数将卷积矩阵中的负数值元素转换为零,并保持其他元素不变。作为其中一种实施方式,所述根据预设置的占位符类型和字符长度对所述语言文本信息进行处理的步骤,具体包括:根据预设置的与自然语言特征相匹配的占位符类型和字符长度对所述语言文本信息进行处理。作为其中一种实施方式,所述占位符类型为输入int25~输入int35、输出float25~输出float35,所述字符长度为60字节~80字节。作为其中一种实施方式,所述对所述语言文本信息进行字符向量化处理,以得到每个字符的向量的步骤中,每个字符的向量的维度为25~35之间。作为其中一种实施方式,所述对经过字符向量化处理的所述语言文本信息进行卷积处理以得到卷积矩阵的步骤,具体包括:采用卷积核为3*32*128、4*32*128和5*32*128,偏置为1*128对所述语言文本信息进行卷积处理以得到75*1*128、74*1*128和73*1*128的三类卷积矩阵,其中,卷积核的3、4和5表示自然语言中每个词的字符个数。作为其中一种实施方式:所述采用预设置的池化窗口对所述卷积矩阵进行池化处理的步骤,具体包括:采用预设置的大小分别为75*1*128、74*1*128和73*1*128的池化窗口对三类卷积矩阵进行最大池化处理,以形成三个1*128的向量;所述拼接所述卷积矩阵以得到目标向量的步骤,具体包括:拼接卷积矩阵的三个1*128的向量以形成一个1*384的向量;所述丢弃拼接后的目标向量中的部分元素的步骤,具体包括:运用dropout_prob函数随机丢弃拼接后的目标向量中的一半元素;所述神经网络对所述目标向量进行计算以识别得到与所述语言文本信息对应的文本意图的步骤,具体包括:神经网络运用公式argmax(y)和y=x*w+b计算以识别得到与所述语言文本信息对应的文本意图,其中,输入值x=n*384,权重w=384*m,偏置b=1*m计算m个文本意图的分数y,n为所述语言文本信息中的n句话或n个语言文本信息,m为预设值的m种意图类别,argmax(y)函数为求最大得分的意图类别。为解决上述技术问题,本申请还提供一种车机设备,作为其中一种实施方式,所述车机设备配置有处理器,所述处理器用于执行计算机程序,以实现如上所述的基于神经网络的文本意图识别方法。为解决上述技术问题,本申请还提供一种车辆,作为其中一种实施方式,所述车辆配置有如上所述的车机设备,以通过所述车机设备进行人车之间的多轮语音交互。本申请车辆、车机设备及其基于神经网络的文本意图识别方法,神经网络获取输入的语言文本信息,根据预设置的占位符类型和字符长度对所述语言文本信息进行处理,对所述语言文本信息进行字符向量化处理,以得到每个字符的向量,对经过字符向量化处理的所述语言文本信息进行卷积处理以得到卷积矩阵,采用预设置的池化窗口对所述卷积矩阵进行池化处理,将经过池化处理的卷积矩阵中的负数值元素进行转换,拼接所述卷积矩阵以得到目标向量,丢弃拼接后的目标向量中的部分元素,神经网络对所述目标向量进行计算以识别得到与所述语言文本信息对应的文本意图。通过上述方式,本申请能够快速准确地识别中文短文本意图,便于人机多轮对话系统的自然语言理解。上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其他目的、特征和优点能够更明显易懂,以下特举较佳实施例,并配合附图,详细说明如下。附图说明图1为本申请基于神经网络的文本意图识别方法一实施方式的流程示意图。图2为本申请实现文本意图识别方法的神经网络一实施方式的实现方式示意图。图3A是本申请另一实施方式的神经网络的部分的层结构及其部分计算的网络系数。图3B是图2所示的神经网络的部分的层结构及其部分计算的网络系数。图4是本申请车机设备一实施例的模块示意图。具体实施方式为更进一步阐述本申请为达成预定申请目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本申请车辆、车机设备及其用于文本意图识别的神经网络结构的具体实施方式、方法、步骤、特征及其效果,详细说明如下。有关本申请的前述及其他
技术实现思路
、特点及功效,在以下配合参考图式的较佳实施例的详细说明中将可清楚呈现。通过具体实施方式的说明,当可对本申请为达成预定目的所采取的技术手段及效果得以更加深入且具体的了解,然而所附图式仅是提供参考与说明之用,并非用来对本申请加以限制。请参阅图1,图1为本申请基于神经网络的文本意图识别方法一实施方式的流程示意图。在本实施方式中,所述基于神经网络的文本意图识别方法包括但不限于如下几个步骤。步骤S101,神经网络获取输入的语言文本信息;步骤S102,根据预设置的占位符类型和字符长度对所述语言文本信息进本文档来自技高网
...

【技术保护点】
1.一种基于神经网络的文本意图识别方法,其特征在于,所述基于神经网络的文本意图识别方法包括:神经网络获取输入的语言文本信息;根据预设置的占位符类型和字符长度对所述语言文本信息进行处理;对所述语言文本信息进行字符向量化处理,以得到每个字符的向量;对经过字符向量化处理的所述语言文本信息进行卷积处理以得到卷积矩阵;采用预设置的池化窗口对所述卷积矩阵进行池化处理;将经过池化处理的卷积矩阵中的负数值元素进行转换;拼接所述卷积矩阵以得到目标向量;丢弃拼接后的目标向量中的部分元素;神经网络对所述目标向量进行计算以识别得到与所述语言文本信息对应的文本意图。

【技术特征摘要】
1.一种基于神经网络的文本意图识别方法,其特征在于,所述基于神经网络的文本意图识别方法包括:神经网络获取输入的语言文本信息;根据预设置的占位符类型和字符长度对所述语言文本信息进行处理;对所述语言文本信息进行字符向量化处理,以得到每个字符的向量;对经过字符向量化处理的所述语言文本信息进行卷积处理以得到卷积矩阵;采用预设置的池化窗口对所述卷积矩阵进行池化处理;将经过池化处理的卷积矩阵中的负数值元素进行转换;拼接所述卷积矩阵以得到目标向量;丢弃拼接后的目标向量中的部分元素;神经网络对所述目标向量进行计算以识别得到与所述语言文本信息对应的文本意图。2.根据权利要求1所述的基于神经网络的文本意图识别方法,其特征在于,所述神经网络对所述目标向量进行计算以识别得到与所述语言文本信息对应的文本意图的步骤,还包括:对识别得到的至少多个文本意图进行损失值和/或准确率计算,以得到每个文本意图类别的概率;利用预训练得到的预测意图类别概率与实际意图类别的交叉熵处理得到用于输出的最终意图。3.根据权利要求1所述的基于神经网络的文本意图识别方法,其特征在于,所述将经过池化处理的卷积矩阵中的负数值元素进行转换的步骤,具体包括:采用RELU激活函数将卷积矩阵中的负数值元素转换为零,并保持其他元素不变。4.根据权利要求1-3任一项所述的基于神经网络的文本意图识别方法,其特征在于,所述根据预设置的占位符类型和字符长度对所述语言文本信息进行处理的步骤,具体包括:根据预设置的与自然语言特征相匹配的占位符类型和字符长度对所述语言文本信息进行处理。5.根据权利要求4所述的基于神经网络的文本意图识别方法,其特征在于,所述占位符类型为输入int25~输入int35、输出float25~输出float35,所述字符长度为60字节~80字节。6.根据权利要求5所述的基于神经网络的文本意图识别方法,其特征在于,所述对所述语言文本信息进行字符向量化处理,以得到每个字符...

【专利技术属性】
技术研发人员:朱亚杰黄海荣
申请(专利权)人:湖北亿咖通科技有限公司
类型:发明
国别省市:湖北,42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1