意图识别方法、装置、对话机器人和计算机可读存储介质制造方法及图纸

技术编号:26792099 阅读:37 留言:0更新日期:2020-12-22 17:07
本申请涉及一种意图识别方法、装置、对话机器人、计算机设备和计算机可读存储介质,其中,该意图识别方法包括:待识别文本获取步骤,用于获取一待识别文本并设置候选意图,所述候选意图个数为N;向量表示步骤,用于经一文本转换器将所述待识别文本中每一字转换为相应的字向量后,通过一双向循环神经网络及池化层对所述字向量进行特征提取、池化得到所述待识别文本的句向量,并经一复合线性层将所述句向量的维度转换为N,得到一N维句向量;归一化步骤,用于将所述N维句向量经一Softmax层进行归一化处理,从而识别得到每一候选意图及其概率,从而得到用户问句所对应的意图。通过本申请,提高意图识别精确度,同时降低训练成本、提高训练效率。

【技术实现步骤摘要】
意图识别方法、装置、对话机器人和计算机可读存储介质
本申请涉及人工智能
,特别是涉及意图识别方法、装置、对话机器人、计算机设备和计算机可读存储介质。
技术介绍
近年来,随着深度学习技术的发展,各种基于深度学习的前沿技术被应用于自然语言处理中。其中,对话机器人是自然语言处理的一个分支,特别是垂直领域下的对话机器人,如淘宝购物中的阿里小蜜,已在业界有广泛的应用。意图识别属于自然语言处理中的文本分类问题,是对话机器人中一个重要的模块,它负责从用户的输入中提取意图,并给后续操作,如知识图谱推理,提供明确的方向,因此该模块需要极高的精确度。文本分类问题主要包括:第一部分为特征提取,其在该领域下主要有两种方案:基于词频的特征、基于embedding的特征,词频特征可以通过统计词在每句中出现的概率得到,而embedding特征需要通过一些技术如Word2Vec或BERT(BidirectionalEncoderRepresentationfromTransformers)词向量化模型实现文本转换。第二部分为模型分类器,其主要可以分为两块:基于传本文档来自技高网...

【技术保护点】
1.一种意图识别方法,其特征在于,包括:/n待识别文本获取步骤,用于获取一待识别文本并设置候选意图,所述候选意图个数为N;/n向量表示步骤,用于经一文本转换器将所述待识别文本中每一字转换为相应的字向量后,通过一双向循环神经网络及池化层对所述字向量进行特征提取、池化得到所述待识别文本的句向量,并经一复合线性层将所述句向量的维度转换为N,得到一N维句向量;/n归一化步骤,用于将所述N维句向量经一Softmax层进行归一化处理,从而识别得到每一候选意图及其概率;/n其中,所述N为自然数。/n

【技术特征摘要】
1.一种意图识别方法,其特征在于,包括:
待识别文本获取步骤,用于获取一待识别文本并设置候选意图,所述候选意图个数为N;
向量表示步骤,用于经一文本转换器将所述待识别文本中每一字转换为相应的字向量后,通过一双向循环神经网络及池化层对所述字向量进行特征提取、池化得到所述待识别文本的句向量,并经一复合线性层将所述句向量的维度转换为N,得到一N维句向量;
归一化步骤,用于将所述N维句向量经一Softmax层进行归一化处理,从而识别得到每一候选意图及其概率;
其中,所述N为自然数。


2.如权利要求1所述的意图识别方法,其特征在于,所述方法进一步包括:
结果输出步骤,用于选取所述候选意图中概率最高的候选意图作为识别结果。


3.如权利要求2所述的意图识别方法,其特征在于,所述向量表示步骤进一步包括:
字向量获取步骤,用于经一文本转换器将所述待识别文本映射为对应的字向量,具体的,所述文本转换器包括但不限于ALBERT模型、XLNET模型、ERINE模型;
句向量获取步骤,用于经所述双向循环神经网络获取所述字向量的前向信息向量和后向信息向量并将二者拼接为一特征向量,再经一池化层对所述特征向量进行池化,池化后的所述特征向量为所述待识别文本的句向量;
向量维度转换步骤,用于经一复合线性层将所述句向量转换为所述N维向量。


4.如权利要求3所述的意图识别方法,其特征在于,所述句向量获取步骤中,所述双向循环神经网络采用但不限于双向GRU网络。


5.如权利要求3所述的意图识别方法,其特征在于,所述池化层进一步包括:最大池化层MaxPooling、平均池化层AvgPooling,用于对所述特征向量中每一列分别取最大...

【专利技术属性】
技术研发人员:郑悦江丹丹景艳山
申请(专利权)人:北京明略昭辉科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1