【技术实现步骤摘要】
对话意图识别方法、装置、存储介质及电子设备
[0001]本说明书涉及计算机
,尤其涉及一种对话意图识别方法、装置、存储介质及电子设备。
技术介绍
[0002]随着AI技术的发展,社会上涌现了很多对话机器人,比如微软小冰,谷歌助手等。对话机器人通常是基于大量样本对神经网络模型经过迭代训练后得到,在此过程中需要大量训练样本使得模型收敛。
[0003]然而,在某些需要对话的场景中,由于场景存在时间较短,场景活跃用户较少,可能不存在较多的训练样本供模型进行训练,此时对话机器人就无法在此类场景中进行对话。
技术实现思路
[0004]本说明书实施例提供的一种对话意图识别方法、装置、存储介质及电子设备,通过对话意图匹配表、小样本子模型和主分类子模型分别对对话数据进行对话意图识别,可以在零样本训练数据、少量样本训练数据、大量样本训练数据场景下,实现对对话数据的对话意图识别,实现对话意图识别的全场景覆盖,提升用户使用体验。所述技术方案如下:
[0005]第一方面,本说明书实施例提供了一种对话意图识别方法,应用于对话意图匹配表和对话意图识别模型,所述对话意图识别模型包括小样本子模型以及主分类子模型,所述对话意图匹配表包括指定对话数据和对话意图的对应关系,所述小样本子模型为基于少量样本训练数据训练的识别模型,所述主分类子模型为基于大量样本训练数据训练的识别模型,所述方法包括:
[0006]实时采集用户输入的对话数据;
[0007]基于所述对话意图匹配表、所述小样本子模型以及所述主分类子 ...
【技术保护点】
【技术特征摘要】
1.一种对话意图识别方法,应用于对话意图匹配表和对话意图识别模型,所述对话意图识别模型包括小样本子模型以及主分类子模型,所述对话意图匹配表包括指定对话数据和对话意图的对应关系,所述小样本子模型为基于少量样本训练数据训练的识别模型,所述主分类子模型为基于大量样本训练数据训练的识别模型,所述方法包括:实时采集用户输入的对话数据;基于所述对话意图匹配表、所述小样本子模型以及所述主分类子模型分别对所述对话数据进行对话意图识别,得到所述对话意图匹配表、所述小样本子模型以及所述主分类子模型分别对应的对话意图识别结果;基于所述对话意图匹配表、所述小样本子模型对应的第一识别范围以及所述主分类子模型对应的第二识别范围从各所述对话意图识别结果中确定所述对话数据对应的对话意图,所述第一识别范围包括所述小样本子模型可识别的对话意图,所述第二识别范围包括所述主分类子模型可识别的对话意图。2.根据权利要求1所述的方法,若所述小样本子模型不存在第一识别范围且所述主分类子模型不存在第二识别范围,在所述基于所述对话意图匹配表、所述小样本子模型以及所述主分类子模型分别对所述对话数据进行对话意图识别之前,还包括:基于所述对话意图匹配表对所述对话数据进行对话意图匹配,确定所述对话数据对应的对话意图。3.根据权利要求1所述的方法,所述基于所述对话意图匹配表、所述小样本子模型对应的第一识别范围以及所述主分类子模型对应的第二识别范围从各所述对话意图识别结果中确定所述对话数据对应的对话意图,包括:若所述对话意图匹配表对应的对话意图识别结果为确定的对话意图,则将所述对话意图匹配表对应的对话意图识别结果作为所述对话数据对应的对话意图;若所述对话意图匹配表对应的对话意图识别结果指示所述对话意图匹配表无法识别所述对话数据,则基于所述第一识别范围以及所述第二识别范围从所述小样本子模型、所述主分类子模型分别对应的对话意图识别结果中确定所述对话数据对应的对话意图。4.根据权利要求3所述的方法,所述基于所述第一识别范围以及所述第二识别范围从所述小样本子模型、所述主分类子模型分别对应的对话意图识别结果中确定所述对话数据对应的对话意图,包括:若所述小样本子模型对应的对话意图识别结果存在于所述第一识别范围中且所述主分类子模型对应的对话意图识别结果不存在于所述第二识别范围中,则将所述小样本子模型对应的对话意图识别结果作为所述对话数据对应的对话意图;若所述小样本子模型对应的对话意图识别结果存在于所述第一识别范围中且所述主分类子模型对应的对话意图识别结果存在于所述第二识别范围中,则将所述主分类子模型对应的对话意图识别结果作为所述对话数据对应的对话意图;若所述小样本子模型对应的对话意图识别结果不存在于所述第一识别范围中且所述主分类子模型对应的对话意图识别结果存在于所述第二识别范围中,则将所述主分类子模型对应的对话意图识别结果作为所述对话数据对应的对话意图。5.一种对话意图识别模型训练方法,所述对话意图识别模型包括小样本子模型以及主分类子模型,包括:
当对话日志中新记录的对话数据达到预设数量后,从对话日志中提取所述预设数量的对话数据以及各所述对话数据分别对应的对话意图,所述对话数据为用户在会话系统中输入的文本数据;基于所述对话数据以及所述对话数据分别对应的对话意图生成样本训练数据;基于各所述样本训练数据训练所述小样本子模型,得到训练结束的小样本子模型,并确定训练结束的所述小样本子模型对应的第一识别范围,所述第一识别范围包括所述小样本子模型可识别的对话意图;基于各所述样本训练数据训练所述主分类子模型,得到训练结束的主分类子模型,并确定训练结束的所述主分类子模型对应的第二识别范围,所述第二识别范围包括所述主分类子模型可识别的对话意图。6.根据权利要求5所述的方法,所述基于各所述样本训练数据训练所述小样本子模型,得到训练结束的小样本子模型,并确定训练结束的所述小样本子模型对应的第一识别范围,包括:将各所述样本训练数据按照对话意图进行分类,得到各对话意图分别对应的样本训练数据集合...
【专利技术属性】
技术研发人员:杜冰竹,王永亮,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。