【技术实现步骤摘要】
意图识别方法、装置、电子设备及可读存储介质
[0001]本申请涉及自然语言处理领域,特别涉及一种意图识别方法、装置、电子设备及可读存储介质。
技术介绍
[0002]意图识别指识别文本中蕴含的主题和意图,是偏向于应用层的自然语言理解任务。意图识别主要应用于智能问答客服系统,自动回答用户提出的问题,以减少人工成本。最早的意图识别主要使用规则匹配,通过正则项匹配用户的输入,以推荐相关的问题,随着NLP(Natural Language Processing,自然语言处理)技术的发展,目前基于深度学习的意图识别获得了巨大成功。但意图识别的样本来源存在类别数量庞大、各个类别之间存在一定的相似性、用户输入不规范,输入方式多样化甚至输入非标准的自然语言等问题,因此基于深度学习的意图识别方法也存在性能的不足。如何解决多意图场景下性能不足的问题,是工业界研究的重点。
技术实现思路
[0003]本申请提供了一种意图识别方法、装置、电子设备及可读存储介质,用于提升意图识别准确率。
[0004]第一方面,本申请提供了一种意图识别方法,包括以下步骤:
[0005]获取意图识别文本,针对意图识别文本进行向量化处理,得到意图识别文本向量;
[0006]将意图识别文本向量输入意图识别模型;其中,意图识别模型根据已标注的意图识别样本以及用于标注已标注的意图识别样本的标签层级结构信息中的目标标签训练得到,标签层级结构信息为用于对已标注的意图识别样本的意图类型进行标注的树状结构信息,且标签层级结构信息至少包括属于第 ...
【技术保护点】
【技术特征摘要】
1.一种意图识别方法,其特征在于,包括:获取意图识别文本,针对所述意图识别文本进行向量化处理,得到意图识别文本向量;将所述意图识别文本向量输入意图识别模型;其中,所述意图识别模型根据已标注的意图识别样本以及用于标注所述已标注的意图识别样本的标签层级结构信息中的目标标签训练得到,所述标签层级结构信息为用于对所述已标注的意图识别样本的意图类型进行标注的树状结构信息,且所述标签层级结构信息至少包括属于第一层级的多个意图标签以及属于第二层级的多个意图标签;其中,所述第一层级的意图标签为所述树状结构信息中的根节点,所述第二层级的意图标签为所述树状结构信息中的叶子节点;获取所述意图识别模型针对所述意图识别文本输出的第一意图标签以及第二意图标签;其中,所述第一意图标签属于所述标签层级结构信息中的第一层级,所述第二意图标签属于所述标签层级结构信息中的第二层级;根据所述第二意图标签,确定所述意图识别文本对应的初始意图类型,所述初始意图类型用于表示在初次识别过程中确定的所述意图识别文本的意图类型;在确定所述初始意图类型识别错误的情况下,根据所述第一意图标签,确定所述意图识别文本对应的更新意图类型,根据所述更新意图类型确定所述意图识别文本的目标意图;其中,所述更新意图类型是在二次识别过程中确定的所述意图识别文本的意图类型。2.根据权利要求1所述的方法,其特征在于,所述意图识别模型针对所述意图识别文本输出的第二意图标签的数量为多个;所述根据所述第二意图标签,确定所述意图识别文本对应的初始意图类型包括:获取所述意图识别模型针对所述意图识别文本输出的每个第二意图标签的预测分值;其中,所述预测分值用于表征对应的第二意图标签的置信率;从所述多个第二意图标签中提取预测分值最大的一个第二意图标签作为目标意图标签;根据所述目标意图标签确定所述意图识别文本对应的初始意图类型。3.根据权利要求2所述的方法,其特征在于,所述根据所述第一意图标签,确定所述意图识别文本对应的更新意图类型包括:根据所述标签层级结构信息,获取隶属于所述第一意图标签的多个二级意图标签;计算所述隶属于所述第一意图标签的多个二级意图标签与所述目标意图标签之间的相似度,得到多个相似度计算结果;根据所述多个相似度计算结果,从所述隶属于所述第一意图标签的多个二级意图标签中选取一个二级意图标签,并根据选取出的二级意图标签确定所述意图识别文本对应的更新意图类型。4.根据权利要求3所述的方法,其特征在于,所述根据所述更新意图类型确定所述意图识别文本的目标意图之后,还包括:根据所述意图识别文本的目标意图,生成对应于所述意图识别文本的响应指令;获取用户针对所述响应指令触发的反馈信息;在所述反馈信息为负反馈的情况下,从所述意图识别模型针对所述意图识别文本输出的除所述目标意图标签之外的多个第二意图标签中,选取预测分值最大的一个第二意图标签,根据选取出的第二意图标签重新确定所述意图识别文本的意图;其中,所述选取出的第
二意图标签不同于所述选取出的二级意图标签。5.根据权利要求1
‑
4任一所述的方法,其特征在于,所述意图识别模型通过以下方式训练得到:获取多个已标注的意图识别样本,将每个意图识别样本进行向量化处理,得到多个意图识别样本向量;针对所述标签层级结构信息进行向量化处理,得到标签层级结构向量;其中,所述标签层级结构向量中包含多个结构向量片段,且每个结构向量片段对应于所述标签层级结构信息中的一个意图标签;针对每个意图识别样本向量,将所述意图识别样本向量划分为多个局部向量片段,利用注意力机制确定所述意图识别样本向量中...
【专利技术属性】
技术研发人员:陈文俊,蒋宁,夏粉,肖冰,李宽,
申请(专利权)人:马上消费金融股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。