意图识别方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:33082724 阅读:22 留言:0更新日期:2022-04-15 10:39
本发明专利技术公开了一种意图识别方法、装置、计算机设备及存储介质,其中,方法部分包括:获取用户输入的待识别文本,并对待识别文本进行编码,以获得待识别文本的多个字向量;获取意图识别模型,意图识别模型为根据预设训练样本集训练获得的神经网络模型,训练样本集中的每一输入样本对应一个意图标签链,意图标签链包括意图层级不同的多个标准意图标签;将多个字向量输入意图识别模型进行多层级的意图识别,以获得意图层级不同的多个意图识别标签;根据多个意图识别标签确定待识别文本的意图;本发明专利技术的意图识别模型,能够充分挖掘出不同层级意图之间的关联关系,提高了意图识别模型的识别精度,进而提高了对用户意图识别的准确性。进而提高了对用户意图识别的准确性。进而提高了对用户意图识别的准确性。

【技术实现步骤摘要】
意图识别方法、装置、计算机设备及存储介质


[0001]本专利技术涉及语言处理领域,尤其涉及一种意图识别方法、装置、计算机设备及存储介质。

技术介绍

[0002]在自然语言处理领域中,用户意图理解作为语义理解的重要一环,对用户意图表达信息的挖掘具有重要意义。而智能对话系统是自然语言处理中的一项非常具有挑战的任务,在对话系统中,需要根据用户输入的信息准确识别出用户意图,从而根据用户意图为客户提供对应的信息。
[0003]在实际意图识别过程中,一般是采用多类别分类模型对用户输入的信息进行不同类别的意图识别,这种方式直接将用户意图平铺开来,进行多标签的意图分类处理,从而识别出不同属性的多个用户意图。但在实际场景中,用户输入的信息所包含为多个意图,多个意图之间可能具有关联性,多个意图可能具有上下层级的关系,还可以细分为同一属性意图下的不同细分类别,例如情感标签下包括高兴和不高兴两个标签。但采用传统的多类别分类模型,无法识别出不同意图标签之间的关系,每个意图标签之间相互独立互不影响,导致识别出的用户意图不够准确。
专利技术内容
[0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种意图识别方法,其特征在于,包括:获取待识别文本,并对所述待识别文本进行编码,以获得所述待识别文本的多个字向量;获取意图识别模型,所述意图识别模型为根据预设训练样本集训练获得的神经网络模型,所述训练样本集中的每个输入样本对应一个意图标签链,所述意图标签链包括意图层级不同的多个标准意图标签;将所述多个字向量输入所述意图识别模型进行多层级的意图识别,以获得意图层级不同的多个意图识别标签;根据所述多个意图识别标签确定所述待识别文本的意图。2.如权利要求1所述的意图识别方法,其特征在于,所述将所述多个字向量输入所述意图识别模型进行多层级的意图识别,以获得意图层级不同的多个意图识别标签,包括:将所述多个字向量输入所述意图识别模型进行向量转换中,以获得所述待识别文本的上下文向量,以及多个所述字向量对应的隐态编码向量;将所述上下文向量进行多次解码循环,以获得每一解码循环的隐态解码向量,上一解码循环的输出为下一解码循环的输入;对多个所述隐态编码向量、所述每一解码循环的隐态解码向量进行基于注意力机制的处理,以获得多个目标向量;依次对所述多个目标向量进行意图预测,以获得所述多个意图识别标签。3.如权利要求2所述的意图识别方法,其特征在于,所述对多个所述隐态编码向量、所述每一解码循环的隐态解码向量进行基于注意力机制的处理,以获得多个目标向量,包括:基于软注意力机制,对当前解码循环的隐态解码向量和多个所述隐态编码向量进行处理,得到当前解码循环对应的注意力向量,以获得多个所述注意力向量;将各所述注意力向量与当前解码循环的所述隐态解码向量进行拼接,以获得多个拼接向量;将多个拼接向量作为所述多个目标向量。4.如权利要求3所述的意图识别方法,其特征在于,所述基于软注意力机制,对当前解码循环的隐态解码向量和多个所述隐态编码向量进行处理,得到当前解码循环对应的注意力向量,以获得多个所述注意力向量,包括:根据当前解码循环的隐态解码向量对多个所述隐态编码向量进行加权求和,以获得初始权重矩阵;对所述初始权重矩阵进行归一化处理,以获得目标权重矩阵;根据所述目标权重矩阵对多个所述隐态编码向量进行加权求和,以获得当前解码循环对应的注意力向量;遍历所有解码循环的隐态解码向量,以获得多个所述注意力向量。5.如权利要求1所述的意图识别方法,其特征在于,所述根据所述多个意图识别标签确定所述待识别文本...

【专利技术属性】
技术研发人员:喻祥左珑
申请(专利权)人:深圳市普渡科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1