对话意图识别方法、装置、存储介质及电子设备制造方法及图纸

技术编号:39050673 阅读:8 留言:0更新日期:2023-10-12 19:43
本说明书公开了一种对话意图识别方法、装置、存储介质及电子设备,其中方法包括:实时采集用户输入的对话数据,基于所述对话意图匹配表、所述小样本子模型以及所述主分类子模型分别对所述对话数据进行对话意图识别,得到所述对话意图匹配表、所述小样本子模型以及所述主分类子模型分别对应的对话意图识别结果,然后基于所述对话意图匹配表、所述小样本子模型对应的第一识别范围以及所述主分类子模型对应的第二识别范围从各所述对话意图识别结果中确定所述对话数据对应的对话意图,所述第一识别范围包括所述小样本子模型可识别的对话意图,所述第二识别范围包括所述主分类子模型可识别的对话意图。识别的对话意图。识别的对话意图。

【技术实现步骤摘要】
对话意图识别方法、装置、存储介质及电子设备


[0001]本说明书涉及计算机
,尤其涉及一种对话意图识别方法、装置、存储介质及电子设备。

技术介绍

[0002]随着AI技术的发展,社会上涌现了很多对话机器人,比如微软小冰,谷歌助手等。对话机器人通常是基于大量样本对神经网络模型经过迭代训练后得到,在此过程中需要大量训练样本使得模型收敛。
[0003]然而,在某些需要对话的场景中,由于场景存在时间较短,场景活跃用户较少,可能不存在较多的训练样本供模型进行训练,此时对话机器人就无法在此类场景中进行对话。

技术实现思路

[0004]本说明书实施例提供的一种对话意图识别方法、装置、存储介质及电子设备,通过对话意图匹配表、小样本子模型和主分类子模型分别对对话数据进行对话意图识别,可以在零样本训练数据、少量样本训练数据、大量样本训练数据场景下,实现对对话数据的对话意图识别,实现对话意图识别的全场景覆盖,提升用户使用体验。所述技术方案如下:
[0005]第一方面,本说明书实施例提供了一种对话意图识别方法,应用于对话意图匹配表和对话意图识别模型,所述对话意图识别模型包括小样本子模型以及主分类子模型,所述对话意图匹配表包括指定对话数据和对话意图的对应关系,所述小样本子模型为基于少量样本训练数据训练的识别模型,所述主分类子模型为基于大量样本训练数据训练的识别模型,所述方法包括:
[0006]实时采集用户输入的对话数据;
[0007]基于所述对话意图匹配表、所述小样本子模型以及所述主分类子模型分别对所述对话数据进行对话意图识别,得到所述对话意图匹配表、所述小样本子模型以及所述主分类子模型分别对应的对话意图识别结果;
[0008]基于所述对话意图匹配表、所述小样本子模型对应的第一识别范围以及所述主分类子模型对应的第二识别范围从各所述对话意图识别结果中确定所述对话数据对应的对话意图,所述第一识别范围包括所述小样本子模型可识别的对话意图,所述第二识别范围包括所述主分类子模型可识别的对话意图。
[0009]第二方面,本说明书实施例提供了一种对话意图识别模型训练方法,所述对话意图识别模型包括小样本子模型以及主分类子模型,所述方法包括:
[0010]当对话日志中新记录的对话数据达到预设数量后,从对话日志中提取所述预设数量的对话数据以及各所述对话数据分别对应的对话意图,所述对话数据为用户在会话系统中输入的文本数据;
[0011]基于所述对话数据以及所述对话数据分别对应的对话意图生成样本训练数据;
[0012]基于各所述样本训练数据训练所述小样本子模型,得到训练结束的小样本子模型,并确定训练结束的所述小样本子模型对应的第一识别范围,所述第一识别范围包括所述小样本子模型可识别的对话意图;
[0013]基于各所述样本训练数据训练所述主分类子模型,得到训练结束的主分类子模型,并确定训练结束的所述主分类子模型对应的第二识别范围,所述第二识别范围包括所述主分类子模型可识别的对话意图。
[0014]第三方面,本说明书实施例提供了一种对话意图识别装置,所述装置包括:
[0015]对话数据采集模块,用于实时采集用户输入的对话数据;
[0016]对话意图识别模块,用于基于所述对话意图匹配表、所述小样本子模型以及所述主分类子模型分别对所述对话数据进行对话意图识别,得到所述对话意图匹配表、所述小样本子模型以及所述主分类子模型分别对应的对话意图识别结果;
[0017]对话意图确定模块,用于基于所述对话意图匹配表、所述小样本子模型对应的第一识别范围以及所述主分类子模型对应的第二识别范围从各所述对话意图识别结果中确定所述对话数据对应的对话意图,所述第一识别范围包括所述小样本子模型可识别的对话意图,所述第二识别范围包括所述主分类子模型可识别的对话意图。
[0018]第四方面,本说明书实施例提供了一种对话意图识别模型训练装置,所述装置包括:
[0019]对话数据提取模块,用于当对话日志中新记录的对话数据达到预设数量后,从对话日志中提取所述预设数量的对话数据以及各所述对话数据分别对应的对话意图,所述对话数据为用户在会话系统中输入的文本数据;
[0020]训练数据生成模块,用于基于所述对话数据以及所述对话数据分别对应的对话意图生成样本训练数据;
[0021]第一模型训练模块,用于基于各所述样本训练数据训练所述小样本子模型,得到训练结束的小样本子模型,并确定训练结束的所述小样本子模型对应的第一识别范围,所述第一识别范围包括所述小样本子模型可识别的对话意图;
[0022]第二模型训练模块,用于基于各所述样本训练数据训练所述主分类子模型,得到训练结束的主分类子模型,并确定训练结束的所述主分类子模型对应的第二识别范围,所述第二识别范围包括所述主分类子模型可识别的对话意图。
[0023]第五方面,本说明书实施例提供一种计算机程序产品,所述计算机程序产品存储有至少一条指令,所述至少一条指令适于由处理器加载并执行上述的方法步骤。
[0024]第六方面,本说明书实施例提供一种存储介质,所述存储介质存储有计算机程序,所述计算机程序适于由处理器加载并执行上述的方法步骤。
[0025]第七方面,本说明书实施例提供一种电子设备,可包括:处理器和存储器;其中,所述存储器存储有计算机程序,所述计算机程序适于由所述处理器加载并执行上述的方法步骤。
[0026]本说明书一些实施例提供的技术方案带来的有益效果至少包括:
[0027]采用本说明书实施例提供的对话意图识别方法,首先实时采集用户输入的对话数据,基于对话意图匹配表、小样本子模型以及主分类子模型分别对对话数据进行对话意图识别,得到对话意图匹配表、小样本子模型以及主分类子模型分别对应的对话意图识别结
果,然后基于对话意图匹配表、小样本子模型对应的第一识别范围以及主分类子模型对应的第二识别范围从各对话意图识别结果中确定对话数据对应的对话意图,通过对话意图匹配表、小样本子模型和主分类子模型分别对对话数据进行对话意图识别,可以在零样本训练数据、少量样本训练数据、大量样本训练数据场景下,实现对对话数据的对话意图识别,实现对话意图识别的全场景覆盖,提升用户使用体验。
附图说明
[0028]为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0029]图1为本说明书实施例提供的一种对话意图识别方法的流程示意图;
[0030]图2为本说明书实施例提供的一种对话意图识别的举例示意图;
[0031]图3为本说明书实施例提供的一种对话意图识别的举例示意图;
[0032]图4为本说明书实施例提供的一种对话意图识别方法的流程示意图;
[0033]本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种对话意图识别方法,应用于对话意图匹配表和对话意图识别模型,所述对话意图识别模型包括小样本子模型以及主分类子模型,所述对话意图匹配表包括指定对话数据和对话意图的对应关系,所述小样本子模型为基于少量样本训练数据训练的识别模型,所述主分类子模型为基于大量样本训练数据训练的识别模型,所述方法包括:实时采集用户输入的对话数据;基于所述对话意图匹配表、所述小样本子模型以及所述主分类子模型分别对所述对话数据进行对话意图识别,得到所述对话意图匹配表、所述小样本子模型以及所述主分类子模型分别对应的对话意图识别结果;基于所述对话意图匹配表、所述小样本子模型对应的第一识别范围以及所述主分类子模型对应的第二识别范围从各所述对话意图识别结果中确定所述对话数据对应的对话意图,所述第一识别范围包括所述小样本子模型可识别的对话意图,所述第二识别范围包括所述主分类子模型可识别的对话意图。2.根据权利要求1所述的方法,若所述小样本子模型不存在第一识别范围且所述主分类子模型不存在第二识别范围,在所述基于所述对话意图匹配表、所述小样本子模型以及所述主分类子模型分别对所述对话数据进行对话意图识别之前,还包括:基于所述对话意图匹配表对所述对话数据进行对话意图匹配,确定所述对话数据对应的对话意图。3.根据权利要求1所述的方法,所述基于所述对话意图匹配表、所述小样本子模型对应的第一识别范围以及所述主分类子模型对应的第二识别范围从各所述对话意图识别结果中确定所述对话数据对应的对话意图,包括:若所述对话意图匹配表对应的对话意图识别结果为确定的对话意图,则将所述对话意图匹配表对应的对话意图识别结果作为所述对话数据对应的对话意图;若所述对话意图匹配表对应的对话意图识别结果指示所述对话意图匹配表无法识别所述对话数据,则基于所述第一识别范围以及所述第二识别范围从所述小样本子模型、所述主分类子模型分别对应的对话意图识别结果中确定所述对话数据对应的对话意图。4.根据权利要求3所述的方法,所述基于所述第一识别范围以及所述第二识别范围从所述小样本子模型、所述主分类子模型分别对应的对话意图识别结果中确定所述对话数据对应的对话意图,包括:若所述小样本子模型对应的对话意图识别结果存在于所述第一识别范围中且所述主分类子模型对应的对话意图识别结果不存在于所述第二识别范围中,则将所述小样本子模型对应的对话意图识别结果作为所述对话数据对应的对话意图;若所述小样本子模型对应的对话意图识别结果存在于所述第一识别范围中且所述主分类子模型对应的对话意图识别结果存在于所述第二识别范围中,则将所述主分类子模型对应的对话意图识别结果作为所述对话数据对应的对话意图;若所述小样本子模型对应的对话意图识别结果不存在于所述第一识别范围中且所述主分类子模型对应的对话意图识别结果存在于所述第二识别范围中,则将所述主分类子模型对应的对话意图识别结果作为所述对话数据对应的对话意图。5.一种对话意图识别模型训练方法,所述对话意图识别模型包括小样本子模型以及主分类子模型,包括:
当对话日志中新记录的对话数据达到预设数量后,从对话日志中提取所述预设数量的对话数据以及各所述对话数据分别对应的对话意图,所述对话数据为用户在会话系统中输入的文本数据;基于所述对话数据以及所述对话数据分别对应的对话意图生成样本训练数据;基于各所述样本训练数据训练所述小样本子模型,得到训练结束的小样本子模型,并确定训练结束的所述小样本子模型对应的第一识别范围,所述第一识别范围包括所述小样本子模型可识别的对话意图;基于各所述样本训练数据训练所述主分类子模型,得到训练结束的主分类子模型,并确定训练结束的所述主分类子模型对应的第二识别范围,所述第二识别范围包括所述主分类子模型可识别的对话意图。6.根据权利要求5所述的方法,所述基于各所述样本训练数据训练所述小样本子模型,得到训练结束的小样本子模型,并确定训练结束的所述小样本子模型对应的第一识别范围,包括:将各所述样本训练数据按照对话意图进行分类,得到各对话意图分别对应的样本训练数据集合...

【专利技术属性】
技术研发人员:杜冰竹王永亮
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1