意图特征提取模型训练方法、意图识别方法及相关装置制造方法及图纸

技术编号:37664069 阅读:23 留言:0更新日期:2023-05-26 04:21
本申请提供了一种意图特征提取模型训练方法、意图识别方法及相关装置,方法包括:获取初始语料集合,并根据初始语料集合构建意图知识图谱;根据意图知识图谱中的各个路径及其对应的意图信息,对各个路径进行分类,得到多个意图类别以及每个意图类别所对应的至少一个路径;根据多个意图类别以及每个意图类别所对应的至少一个路径,生成训练样本集合,并使用训练样本集合对待训练的意图特征提取模型进行迭代训练,得到训练后的意图特征提取模型;将初始语料集合中的多个初始语料输入到训练后的意图特征提取模型,得到多个初始语料对应的第一意图向量,并由多个初始语料对应的第一意图向量组成的意图向量空间。本申请有利于提高意图识别的准确率。高意图识别的准确率。高意图识别的准确率。

【技术实现步骤摘要】
意图特征提取模型训练方法、意图识别方法及相关装置


[0001]本申请涉及知识图谱领域,尤其涉及一种意图特征提取模型训练方法、意图识别方法及相关装置。

技术介绍

[0002]在智能客服场景中,意图识别可以有效分析用户的核心需求。准确的意图识别可以有效提高搜索的准确性和对话的智能性,从而提高智能客服场景中的用户体验。
[0003]现有技术中,主流的意图识别通常采用将用户的问题转化为文本分类任务的方式,实现用户意图的识别。该文本分类任务的分类器通常使用机器学习或者深度学习模型训练得到。
[0004]然而,基于机器学习或者深度学习的分类模型通常需要使用大量的标注数据进行训练,在标注数据的数据量不足或者数据质量差等情况下,容易导致该分类模型的意图分类准确性差的问题。

技术实现思路

[0005]本申请提供一种意图特征提取模型训练方法、意图识别方法及相关装置,用以解决在标注数据的数据量不足或者数据质量差等情况下,容易导致的分类模型的意图分类准确性差的问题。
[0006]第一方面,本申请提供一种意图识别方法,包括:...

【技术保护点】

【技术特征摘要】
1.一种意图特征提取模型训练方法,其特征在于,所述方法包括:获取初始语料集合,并根据所述初始语料集合构建意图知识图谱,所述意图知识图谱中的各个节点为所述初始语料集合中各个初始语料的关键词,所述意图知识图谱中的各个边用于指示连接的两个相邻节点之间的关联关系,由节点和边组成的各个路径用于指示所述各个初始语料的意图信息;根据所述意图知识图谱中的各个路径及其对应的意图信息,对各个所述路径进行分类,得到多个意图类别以及每个意图类别所对应的至少一个路径;根据所述多个意图类别以及每个意图类别所对应的至少一个路径,生成训练样本集合,并使用所述训练样本集合对待训练的意图特征提取模型进行迭代训练,得到训练后的意图特征提取模型;将所述初始语料集合中的多个初始语料输入到所述训练后的意图特征提取模型,得到所述多个初始语料对应的第一意图向量,并由所述多个初始语料对应的第一意图向量组成的意图向量空间。2.根据权利要求1所述的方法,其特征在于,所述根据所述多个意图类别以及每个意图类别所对应的至少一个路径,生成训练样本集合,并使用所述训练样本集合对待训练的意图特征提取模型进行迭代训练,得到训练后的意图特征提取模型,具体包括:获取所述意图知识图谱中的多个路径以及每个路径所对应的意图类别;将所述多个路径中意图类别相同的路径两两组合得到正样本集合,将所述多个路径中意图类别不同的路径两两组合得到负样本集合,所述训练样本集合包括所述正样本集合和所述负样本集合;将所述训练样本集合输入到待训练的意图特征提取模型进行训练,得到训练后的意图特征提取模型。3.根据权利要求1所述的方法,其特征在于,所述将所述初始语料集合中的多个初始语料输入到所述训练后的意图特征提取模型,得到所述多个初始语料对应的第一意图向量,并由所述多个初始语料对应的第一意图向量组成的意图向量空间,具体包括:使用所述意图特征提取模型对所述初始语料进行特征提取,得到每一所述初始语料对应的第一意图向量;计算每一所述意图类别中全部第一意图向量的均值,并将所述均值作为所述意图类别对应的第二意图向量;使用各个所述意图类别的所述第一意图向量组成意图向量空间。4.根据权利要求1

3中任一项所述的方法,其特征在于,所述获取初始语料集合,并根据所述初始语料集合构建意图知识图谱,具体包括:获取初始语料集合;从所述初始语料集合中的每一初始语料中提取至少一个关键词和所述至少一个关键词之间的关联关系;根据所述初始语料集合中的每一初始语料的关键词和关键词之间的关联关系,构建意图知识图谱。5.根据权利要求1

3中任一项所述的方法,其特征在于,所述根据所述意图知识图谱中的各个路径及其对应的意图信息,对各个所述路径进行分类,得到多个意图类别以及每个
意图类别所对应的至少一个路径,具体包括:对所述意图知识图谱进行聚类,得到多个聚类中心,所述聚类中心对应于所述意图知识图谱中的一个节点,每一所述聚类中心对应于一个意图类别,所述聚类中心对应的所述节点所指示的所述关键词为所述意图类别的意图关键词;将包括所述聚类中心的路径分类到一个意图类别。6.一种意图识别方法,其特征在于,所述方法包括:将待识别语句输入如权利要求1

5任一项所述的训练后的意图特征提取模型,得到所述待识别语句的第一意图向量,所述待识别语句为包括用户意图信息的语句,所述意图特征提取模型用于对所述待识别语句进行特征提取得到第一意图向量,所述第一意图向量用于确定所述待识别语句的意图;将所述第一意图向量投影到如权利要求1

5任一项所述的所述意图向量空间,并计算所述第一意图向量与所述意图向量空间中每一第二意图向量的匹配度,所述意图向量空间中包括多个第二意图向量,每一所述第二意图向量对应于一个意图类别,每一所述意图类别对应于一个意图关键词;将所述匹配度最高的所述第二意图向量所对应的所述意图类别的所述意图关键词作为识别结果,所述识别结果用于指示所述待识别语句的意图。7.根据权利要求6所述的方法,其特征在于,所述将待识别语句输入如权利要求1

5任一项所述的训练后的意图特征提取模型,得到所述待...

【专利技术属性】
技术研发人员:范智超蒋宁吴海英
申请(专利权)人:马上消费金融股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1