识别模型训练方法及装置、意图类别识别方法及装置制造方法及图纸

技术编号：34960492 阅读：27 留言：0更新日期：2022-09-17 12:40

本申请实施例提供一种识别模型训练方法及装置、意图类别识别方法及装置，该方法包括：对多条询问信息进行聚类处理，得到至少一个聚类集合，并确定聚类集合对应的意图类别。针对意图类别中的第一意图类别，将第一意图类别对应聚类集合中的询问信息确定为样本询问信息，将第一意图类别确定为样本询问信息对应的样本意图类别，得到至少一组训练数据。根据至少一组训练数据，训练识别模型，识别模型用于识别询问语句对应的意图类别。本申请的技术方案可以有效的提升模型训练的效率。可以有效的提升模型训练的效率。可以有效的提升模型训练的效率。

全部详细技术资料下载

【技术实现步骤摘要】
识别模型训练方法及装置、意图类别识别方法及装置

[0001]本申请实施例涉及计算机技术，尤其涉及一种识别模型训练方法及装置、意图类别识别方法及装置。

技术介绍

[0002]智能客服通常可以根据用户的询问语句给出相应的回答，那么智能客服在特定的对象类别下准确理解用户的意图就是非常重要的。
[0003]目前通常是通过训练识别模型，来识别用户的询问语句所对应的意图。现有技术中在训练识别模型的时候，通常需要业务人员手动的标注询问语句所对应的意图，以及标注的意图也是由业务人员人工的来进行梳理的，然后根据标注的数据对识别模型进行训练。
[0004]然而，业务人员手动标注询问信息的意图的实现方式，会导致识别模型的训练效率低下。

技术实现思路

[0005]本申请实施例提供一种识别模型训练方法及装置、意图类别识别方法及装置，以克服识别模型的训练效率低下的问题。
[0006]第一方面，本申请实施例提供一种识别模型训练方法，包括：
[0007]对多条询问信息进行聚类处理，得到至少一个聚类集合，并确定所述聚类集合对应的意图类别；
[0008]针对所述意图类别中的第一意图类别，将所述第一意图类别对应聚类集合中的询问信息确定为样本询问信息，将所述第一意图类别确定为所述样本询问信息对应的样本意图类别，得到至少一组训练数据；
[0009]根据所述至少一组训练数据，训练识别模型，所述识别模型用于识别询问语句对应的意图类别。
[0010]第二方面，本申请实施例提供一种意图类别识别方...

【技术保护点】

【技术特征摘要】
1.一种识别模型训练方法，其特征在于，包括：对多条询问信息进行聚类处理，得到至少一个聚类集合，并确定所述聚类集合对应的意图类别；针对所述意图类别中的第一意图类别，将所述第一意图类别对应聚类集合中的询问信息确定为样本询问信息，将所述第一意图类别确定为所述样本询问信息对应的样本意图类别，得到至少一组训练数据；根据所述至少一组训练数据，训练识别模型，所述识别模型用于识别询问语句对应的意图类别。2.根据权利要求1所述的方法，其特征在于，确定所述聚类集合对应的意图类别，包括：将所述聚类集合中携带有聚类中心标识的询问信息，确定为示例询问信息；根据所述示例询问信息，确定所述聚类集合对应的意图类别。3.根据权利要求2所述的方法，其特征在于，根据所述示例询问信息，确定所述聚类集合对应的意图类别，包括：对所述示例询问信息进行语义解析，将语义解析结果确定为所述聚类集合对应的意图类别；或者，获取所述示例询问信息对应的标注信息，将所述标注信息确定为所述聚类集合对应的意图类别。4.根据权利要求1
‑
3任一项所述的方法，其特征在于，根据所述至少一组训练数据，训练识别模型，包括：根据所述至少一组训练数据，确定所述第一意图类别对应的训练数据的数量；如果所述训练数据的数量小于预设阈值，则对所述第一意图类别对应的训练数据进行扩充处理，得到所述第一意图类别的目标训练数据；根据所述目标训练数据，训练识别模型。5.根据权利要求4所述的方法，其特征在于，对所述第一意图类别对应的训练数据进行扩充处理，得到所述第一意图类别的目标训练数据，包括：在不属于任一个所述聚类集合的询问信息中，确定所述第一意图类别对应的第一备选询问信息；对所述第一备选询问信息进行数据增强处理，得到所述第一意图类别对应的第二备选询问信息；对所述第二备选询问信息进行数据去噪处理，得到所述第一意图类别对应的第三备选询问信息；根据所述第三备选询问信息以及所述第一意图类别对应的训练数据，确定所述第一意图类别的目标训练数据。6.根据权利要求5所述的方法，其特征在于，对所述第二备选询问信息进行数据去噪处理，得到所述第一意图类别对应的第三备选询问信息，包括：针对每个所述第二备选询问信息，根据至少一个评估模型对所述第二备选询问信息以及所述第一意图类别进行处理，得到每个所述评估模型输出的评估参数；根据每个所述评估模型输出的评估参数，确定所述第二备选询问信息对应的目标评估参数；
如果所述目标评估参数指示所述第二备选询问信息对应...

【专利技术属性】
技术研发人员：万里，胡云华，崔恒斌，陈志钊，
申请(专利权)人：阿里巴巴中国有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人