意图识别方法、装置、电子设备及可读存储介质制造方法及图纸

技术编号:37642751 阅读:26 留言:0更新日期:2023-05-25 10:09
本申请提供了一种意图识别方法、装置、电子设备及可读存储介质,用于提升意图识别的准确率。该方法包括:获取意图识别文本并进行向量化处理,得到意图识别文本向量;将意图识别文本向量输入意图识别模型;获取意图识别模型针对意图识别文本输出的第一意图标签以及第二意图标签;根据第二意图标签,确定意图识别文本对应的初始意图类型;在确定初始意图类型识别错误的情况下,根据第一意图标签,确定意图识别文本对应的更新意图类型,根据更新意图类型确定意图识别文本的目标意图。由此可见,该方法根据标签层级结构信息实现多分类的层级分类学习,从而提升意图识别模型在多意图场景下的性能,进一步提升意图识别的准确率。进一步提升意图识别的准确率。进一步提升意图识别的准确率。

【技术实现步骤摘要】
意图识别方法、装置、电子设备及可读存储介质


[0001]本申请涉及自然语言处理领域,特别涉及一种意图识别方法、装置、电子设备及可读存储介质。

技术介绍

[0002]意图识别指识别文本中蕴含的主题和意图,是偏向于应用层的自然语言理解任务。意图识别主要应用于智能问答客服系统,自动回答用户提出的问题,以减少人工成本。最早的意图识别主要使用规则匹配,通过正则项匹配用户的输入,以推荐相关的问题,随着NLP(Natural Language Processing,自然语言处理)技术的发展,目前基于深度学习的意图识别获得了巨大成功。但意图识别的样本来源存在类别数量庞大、各个类别之间存在一定的相似性、用户输入不规范,输入方式多样化甚至输入非标准的自然语言等问题,因此基于深度学习的意图识别方法也存在性能的不足。如何解决多意图场景下性能不足的问题,是工业界研究的重点。

技术实现思路

[0003]本申请提供了一种意图识别方法、装置、电子设备及可读存储介质,用于提升意图识别准确率。
[0004]第一方面,本申请提供了一种意图识别方法,包括以下步骤:
[0005]获取意图识别文本,针对意图识别文本进行向量化处理,得到意图识别文本向量;
[0006]将意图识别文本向量输入意图识别模型;其中,意图识别模型根据已标注的意图识别样本以及用于标注已标注的意图识别样本的标签层级结构信息中的目标标签训练得到,标签层级结构信息为用于对已标注的意图识别样本的意图类型进行标注的树状结构信息,且标签层级结构信息至少包括属于第一层级的多个意图标签以及属于第二层级的多个意图标签;其中,第一层级的意图标签为树状结构信息中的根节点,第二层级的意图标签为树状结构信息中的叶子节点;
[0007]获取意图识别模型针对意图识别文本输出的第一意图标签以及第二意图标签;其中,第一意图标签属于标签层级结构信息中的第一层级,第二意图标签属于标签层级结构信息中的第二层级;
[0008]根据第二意图标签,确定意图识别文本对应的初始意图类型,初始意图类型用于表示在初次识别过程中确定的意图识别文本的意图类型;
[0009]在确定初始意图类型识别错误的情况下,根据第一意图标签,确定意图识别文本对应的更新意图类型,根据更新意图类型确定意图识别文本的目标意图;其中,更新意图类型是在二次识别过程中确定的意图识别文本的意图类型。
[0010]第二方面,本申请提供了一种意图识别装置,包括:
[0011]文本处理模块,用于获取意图识别文本,针对意图识别文本进行向量化处理,得到意图识别文本向量;
[0012]模型输入模块,用于将意图识别文本向量输入意图识别模型;其中,意图识别模型根据已标注的意图识别样本以及用于标注已标注的意图识别样本的标签层级结构信息中的目标标签训练得到,标签层级结构信息为用于对已标注的意图识别样本的意图类型进行标注的树状结构信息,且标签层级结构信息至少包括属于第一层级的多个意图标签以及属于第二层级的多个意图标签;其中,第一层级的意图标签为树状结构信息中的根节点,第二层级的意图标签为树状结构信息中的叶子节点;
[0013]标签获取模块,用于获取意图识别模型针对意图识别文本输出的第一意图标签以及第二意图标签;其中,第一意图标签属于标签层级结构信息中的第一层级,第二意图标签属于标签层级结构信息中的第二层级;
[0014]意图确定模块,用于根据第二意图标签,确定意图识别文本对应的初始意图类型,初始意图类型用于表示在初次识别过程中确定的意图识别文本的意图类型;
[0015]意图更新模块,用于在确定初始意图类型识别错误的情况下,根据第一意图标签,确定意图识别文本对应的更新意图类型,根据更新意图类型确定意图识别文本的目标意图;其中,更新意图类型是在二次识别过程中确定的意图识别文本的意图类型。
[0016]第三方面,本申请提供了一种电子设备,该电子设备包括:至少一个处理器;至少一个存储器;以及一个或多个I/O接口,连接在处理器与存储器之间;其中,存储器存储有可被至少一个处理器执行的一个或多个计算机程序,一个或多个计算机程序被至少一个处理器执行,以使至少一个处理器能够执行如上述的意图识别方法。
[0017]第四方面,本申请提供了一种计算机可读存储介质,其上存储有计算机程序,其中,计算机程序在被处理器/处理核执行时实现上述意图识别方法。
[0018]根据本申请提供的一种意图识别的方法,获取意图识别文本并进行向量化处理,得到意图识别文本向量;将意图识别文本向量输入意图识别模型;其中,意图识别模型根据已标注的意图识别样本以及用于标注已标注的意图识别样本的标签层级结构信息中的目标标签训练得到;获取意图识别模型针对意图识别文本输出的第一意图标签以及第二意图标签;其中,第一意图标签属于标签层级结构信息中的第一层级,第二意图标签属于标签层级结构信息中的第二层级;根据第二意图标签,确定意图识别文本对应的初始意图类型;在确定初始意图类型识别错误的情况下,根据第一意图标签,确定意图识别文本对应的更新意图类型,根据更新意图类型确定意图识别文本的目标意图;其中,更新意图类型是在二次识别过程中确定的意图识别文本的意图类型。由此可见,该方法通过意图识别模型输出意图识别文本对应的至少两级意图标签,得到意图识别文本的标签层级结构信息,进而确定意图识别文本对应的意图类型,根据标签层级结构信息实现多分类的层级分类学习,从而提升意图识别模型在多意图场景下的性能,进一步提升意图识别的准确率。
[0019]应当理解,本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征,也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0020]附图用来提供对本申请的进一步理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本申请,并不构成对本申请的限制。通过参考附图对详细示例实施例进行描述,以上和其他特征和优点对本领域技术人员将变得更加显而易见,在附图中:
[0021]图1为本申请实施例一提供的一种意图识别方法的流程图;
[0022]图2为本申请实施例二提供的一种意图识别方法的流程图;
[0023]图3为本申请实施例二的具体示例提供的一种意图识别方法的整体流程图;
[0024]图4为本申请实施例二的具体示例提供的一种意图识别方法的模型训练流程图;
[0025]图5为本申请实施例二的具体示例提供的一种意图识别方法的流程图;
[0026]图6为本申请实施例三提供的一种意图识别装置的框图;
[0027]图7为本申请实施例四提供的一种电子设备的框图。
具体实施方式
[0028]为使本领域的技术人员更好地理解本申请的技术方案,以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种意图识别方法,其特征在于,包括:获取意图识别文本,针对所述意图识别文本进行向量化处理,得到意图识别文本向量;将所述意图识别文本向量输入意图识别模型;其中,所述意图识别模型根据已标注的意图识别样本以及用于标注所述已标注的意图识别样本的标签层级结构信息中的目标标签训练得到,所述标签层级结构信息为用于对所述已标注的意图识别样本的意图类型进行标注的树状结构信息,且所述标签层级结构信息至少包括属于第一层级的多个意图标签以及属于第二层级的多个意图标签;其中,所述第一层级的意图标签为所述树状结构信息中的根节点,所述第二层级的意图标签为所述树状结构信息中的叶子节点;获取所述意图识别模型针对所述意图识别文本输出的第一意图标签以及第二意图标签;其中,所述第一意图标签属于所述标签层级结构信息中的第一层级,所述第二意图标签属于所述标签层级结构信息中的第二层级;根据所述第二意图标签,确定所述意图识别文本对应的初始意图类型,所述初始意图类型用于表示在初次识别过程中确定的所述意图识别文本的意图类型;在确定所述初始意图类型识别错误的情况下,根据所述第一意图标签,确定所述意图识别文本对应的更新意图类型,根据所述更新意图类型确定所述意图识别文本的目标意图;其中,所述更新意图类型是在二次识别过程中确定的所述意图识别文本的意图类型。2.根据权利要求1所述的方法,其特征在于,所述意图识别模型针对所述意图识别文本输出的第二意图标签的数量为多个;所述根据所述第二意图标签,确定所述意图识别文本对应的初始意图类型包括:获取所述意图识别模型针对所述意图识别文本输出的每个第二意图标签的预测分值;其中,所述预测分值用于表征对应的第二意图标签的置信率;从所述多个第二意图标签中提取预测分值最大的一个第二意图标签作为目标意图标签;根据所述目标意图标签确定所述意图识别文本对应的初始意图类型。3.根据权利要求2所述的方法,其特征在于,所述根据所述第一意图标签,确定所述意图识别文本对应的更新意图类型包括:根据所述标签层级结构信息,获取隶属于所述第一意图标签的多个二级意图标签;计算所述隶属于所述第一意图标签的多个二级意图标签与所述目标意图标签之间的相似度,得到多个相似度计算结果;根据所述多个相似度计算结果,从所述隶属于所述第一意图标签的多个二级意图标签中选取一个二级意图标签,并根据选取出的二级意图标签确定所述意图识别文本对应的更新意图类型。4.根据权利要求3所述的方法,其特征在于,所述根据所述更新意图类型确定所述意图识别文本的目标意图之后,还包括:根据所述意图识别文本的目标意图,生成对应于所述意图识别文本的响应指令;获取用户针对所述响应指令触发的反馈信息;在所述反馈信息为负反馈的情况下,从所述意图识别模型针对所述意图识别文本输出的除所述目标意图标签之外的多个第二意图标签中,选取预测分值最大的一个第二意图标签,根据选取出的第二意图标签重新确定所述意图识别文本的意图;其中,所述选取出的第
二意图标签不同于所述选取出的二级意图标签。5.根据权利要求1

4任一所述的方法,其特征在于,所述意图识别模型通过以下方式训练得到:获取多个已标注的意图识别样本,将每个意图识别样本进行向量化处理,得到多个意图识别样本向量;针对所述标签层级结构信息进行向量化处理,得到标签层级结构向量;其中,所述标签层级结构向量中包含多个结构向量片段,且每个结构向量片段对应于所述标签层级结构信息中的一个意图标签;针对每个意图识别样本向量,将所述意图识别样本向量划分为多个局部向量片段,利用注意力机制确定所述意图识别样本向量中...

【专利技术属性】
技术研发人员:陈文俊蒋宁夏粉肖冰李宽
申请(专利权)人:马上消费金融股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1