识别模型训练方法及装置、意图类别识别方法及装置制造方法及图纸

技术编号:34960492 阅读:27 留言:0更新日期:2022-09-17 12:40
本申请实施例提供一种识别模型训练方法及装置、意图类别识别方法及装置,该方法包括:对多条询问信息进行聚类处理,得到至少一个聚类集合,并确定聚类集合对应的意图类别。针对意图类别中的第一意图类别,将第一意图类别对应聚类集合中的询问信息确定为样本询问信息,将第一意图类别确定为样本询问信息对应的样本意图类别,得到至少一组训练数据。根据至少一组训练数据,训练识别模型,识别模型用于识别询问语句对应的意图类别。本申请的技术方案可以有效的提升模型训练的效率。可以有效的提升模型训练的效率。可以有效的提升模型训练的效率。

【技术实现步骤摘要】
识别模型训练方法及装置、意图类别识别方法及装置


[0001]本申请实施例涉及计算机技术,尤其涉及一种识别模型训练方法及装置、意图类别识别方法及装置。

技术介绍

[0002]智能客服通常可以根据用户的询问语句给出相应的回答,那么智能客服在特定的对象类别下准确理解用户的意图就是非常重要的。
[0003]目前通常是通过训练识别模型,来识别用户的询问语句所对应的意图。现有技术中在训练识别模型的时候,通常需要业务人员手动的标注询问语句所对应的意图,以及标注的意图也是由业务人员人工的来进行梳理的,然后根据标注的数据对识别模型进行训练。
[0004]然而,业务人员手动标注询问信息的意图的实现方式,会导致识别模型的训练效率低下。

技术实现思路

[0005]本申请实施例提供一种识别模型训练方法及装置、意图类别识别方法及装置,以克服识别模型的训练效率低下的问题。
[0006]第一方面,本申请实施例提供一种识别模型训练方法,包括:
[0007]对多条询问信息进行聚类处理,得到至少一个聚类集合,并确定所述聚类集合对应的意图类别;
[0008]针对所述意图类别中的第一意图类别,将所述第一意图类别对应聚类集合中的询问信息确定为样本询问信息,将所述第一意图类别确定为所述样本询问信息对应的样本意图类别,得到至少一组训练数据;
[0009]根据所述至少一组训练数据,训练识别模型,所述识别模型用于识别询问语句对应的意图类别。
[0010]第二方面,本申请实施例提供一种意图类别识别方法,包括:
[0011]获取询问语句;
[0012]根据所述识别模型对所述询问语句进行处理,得到所述询问语句对应的意图类别;
[0013]其中,所述识别模型为根据上述第一方面所述的方法训练得到的模型。
[0014]第三方面,本申请实施例提供一种识别模型训练装置,包括:
[0015]第一处理模块,用于对多条询问信息进行聚类处理,得到至少一个聚类集合,并确定所述聚类集合对应的意图类别;
[0016]确定模块,用于针对所述意图类别中的第一意图类别,将所述第一意图类别对应聚类集合中的询问信息确定为样本询问信息,将所述第一意图类别确定为所述样本询问信息对应的样本意图类别,得到至少一组训练数据;
[0017]第二处理模块,用于根据所述至少一组训练数据,训练识别模型,所述识别模型用于识别询问语句对应的意图类别。
[0018]第四方面,本申请实施例提供一种意图类别识别装置,包括:
[0019]获取模块,用于获取询问语句;
[0020]处理模块,用于根据所述识别模型对所述询问语句进行处理,得到所述询问语句对应的意图类别;
[0021]其中,所述识别模型为根据上述第一方面所述的方法训练得到的模型。
[0022]第五方面,本申请实施例提供一种电子设备,包括:
[0023]存储器,用于存储程序;
[0024]处理器,用于执行所述存储器存储的所述程序,当所述程序被执行时,所述处理器用于执行如上第一方面所述的方法。
[0025]第六方面,本申请实施例提供一种计算机可读存储介质,包括指令,当其在计算机上运行时,使得计算机执行如上第一方面所述的方法。
[0026]第七方面,本申请实施例提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上第一方面所述的方法。
[0027]本申请实施例提供一种识别模型训练方法及装置、意图类别识别方法及装置,该方法通过对多条询问语句首先进行聚类,得到至少一个聚类集合,然后以一个聚类集合为单位来确定一个意图类别,从而可以有效减少确定意图类别所需要处理的数据量,之后再针对每一个意图类别,根据意图类别本身以及意图类别所对应的聚类集合中的询问信息,确定意图类别对应的训练数据,然后根据训练数据实现对识别模型的训练,从而可以有效的减少生成训练数据的过程中所需要处理的数据量,以有效的提升模型训练的效率。
附图说明
[0028]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0029]图1为本申请实施例提供的标注数据的实现示意图;
[0030]图2为本申请实施例提供的识别模型训练方法的流程图;
[0031]图3为本申请实施例提供的识别模型训练方法的流程图二;
[0032]图4为本申请实施例提供的聚类集合的实现示意图;
[0033]图5为本申请实施例提供的训练数据的实现示意图;
[0034]图6为本申请实施例提供的确定目标评估参数的实现示意图;
[0035]图7为本申请实施例提供的识别模型的训练示意图;
[0036]图8为本申请实施例提供的识别模型训练方法的执行流程示意图;
[0037]图9为本申请实施例提供的意图类别识别方法的流程图;
[0038]图10为本申请实施例提供的识别模型训练装置的结构示意图;
[0039]图11为本申请实施例提供的意图类别识别装置的结构示意图;
[0040]图12为本申请实施例提供的电子设备的硬件结构示意图。
具体实施方式
[0041]为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0042]为了更好的理解本申请的技术方案,下面对本申请所涉及的相关技术进行进一步的详细介绍。
[0043]目前智能客服在非常多的行业都得到了应用,其中智能客服可以根据用户的询问语句给出相应的回答,比如说用户询问“xx手机的屏幕尺寸是多少”,智能客服可以给出“xx手机的屏幕尺寸是6.5英寸”的回答。
[0044]可以理解的是,智能客服能否在特定的对象类别下准确的理解用户意图,直接影响了问题的效果,此处的对象类别也可以理解为行业,比如说手机、美妆、医药、零食等等,这些都可以作为此处的对象类别,对应的也就代表的是不同的行业。以手机行业为例,此处的理解用户意图也就是说,智能客服要确定用户当前问的是手机的颜色,还是手机的电池,实际上就是说智能客服要理解用户具体在问什么内容。
[0045]因此行业知识的扩充是构建智能客服的一个重要环节,此处的行业知识就是询问语句对应的意图。目前电商领域所覆盖的对象类别非常多,因此对于新增的对象类别如何快速的挖掘热点知识,以完成行业知识库的构建,是一项非常重要的任务。
[0046]现有技术中通常是通过训练识别模型,来识别用户的询问语句所对应的意图本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种识别模型训练方法,其特征在于,包括:对多条询问信息进行聚类处理,得到至少一个聚类集合,并确定所述聚类集合对应的意图类别;针对所述意图类别中的第一意图类别,将所述第一意图类别对应聚类集合中的询问信息确定为样本询问信息,将所述第一意图类别确定为所述样本询问信息对应的样本意图类别,得到至少一组训练数据;根据所述至少一组训练数据,训练识别模型,所述识别模型用于识别询问语句对应的意图类别。2.根据权利要求1所述的方法,其特征在于,确定所述聚类集合对应的意图类别,包括:将所述聚类集合中携带有聚类中心标识的询问信息,确定为示例询问信息;根据所述示例询问信息,确定所述聚类集合对应的意图类别。3.根据权利要求2所述的方法,其特征在于,根据所述示例询问信息,确定所述聚类集合对应的意图类别,包括:对所述示例询问信息进行语义解析,将语义解析结果确定为所述聚类集合对应的意图类别;或者,获取所述示例询问信息对应的标注信息,将所述标注信息确定为所述聚类集合对应的意图类别。4.根据权利要求1

3任一项所述的方法,其特征在于,根据所述至少一组训练数据,训练识别模型,包括:根据所述至少一组训练数据,确定所述第一意图类别对应的训练数据的数量;如果所述训练数据的数量小于预设阈值,则对所述第一意图类别对应的训练数据进行扩充处理,得到所述第一意图类别的目标训练数据;根据所述目标训练数据,训练识别模型。5.根据权利要求4所述的方法,其特征在于,对所述第一意图类别对应的训练数据进行扩充处理,得到所述第一意图类别的目标训练数据,包括:在不属于任一个所述聚类集合的询问信息中,确定所述第一意图类别对应的第一备选询问信息;对所述第一备选询问信息进行数据增强处理,得到所述第一意图类别对应的第二备选询问信息;对所述第二备选询问信息进行数据去噪处理,得到所述第一意图类别对应的第三备选询问信息;根据所述第三备选询问信息以及所述第一意图类别对应的训练数据,确定所述第一意图类别的目标训练数据。6.根据权利要求5所述的方法,其特征在于,对所述第二备选询问信息进行数据去噪处理,得到所述第一意图类别对应的第三备选询问信息,包括:针对每个所述第二备选询问信息,根据至少一个评估模型对所述第二备选询问信息以及所述第一意图类别进行处理,得到每个所述评估模型输出的评估参数;根据每个所述评估模型输出的评估参数,确定所述第二备选询问信息对应的目标评估参数;
如果所述目标评估参数指示所述第二备选询问信息对应...

【专利技术属性】
技术研发人员:万里胡云华崔恒斌陈志钊
申请(专利权)人:阿里巴巴中国有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1