意图推理模型训练方法、意图识别方法及其装置、设备制造方法及图纸

技术编号:37455931 阅读:31 留言:0更新日期:2023-05-06 09:28
本申请提供一种意图推理模型训练方法、意图识别方法及其装置、设备,涉及数据处理领域。该意图推理模型训练方法包括:获取预设业务场景的多个样本查询文本,采用预设的意图识别模型,对每个样本查询文本,得到每个样本查询文本的意图识别结果,根据多个意图类别的样本识别概率和多个意图类别对应的概率阈值,确定每个样本查询文本对应的样本识别意图,根据多个样本查询文本对应的样本识别意图,以及意图类别标签,对意图识别模型的模型参数和领域知识图谱中的各意图类别的概率阈值进行更新,得到意图推理模型。本申请的方法,通过将意图识别模型和业务知识图谱进行结合可以提高样本识别意图的准确率。别意图的准确率。别意图的准确率。

【技术实现步骤摘要】
意图推理模型训练方法、意图识别方法及其装置、设备


[0001]本专利技术涉及数据处理领域,具体而言,涉及一种意图推理模型训练方法、意图识别方法及其装置、设备。

技术介绍

[0002]随着保险业务的不断发展,保险客服领域积累了大量的文本数据。知识图谱作为人类对世界知识的数字化、系统化和结构化的体现,可以利用描述客观世界的概念、实体、事件及其之间的关系,将信息表达成更接近人类认知世界的方式,是一种典型的知识驱动方法。意图识别是保险领域对话系统中的重要组成部分,意图识别可以看作一个多标签分类任务。保险领域的多标签意图分类大多数是指识别查询保单、查询理赔进度、购买保险、查询出险次数,查询保险受益人等意图。
[0003]目前现有的意图识别系统大多采用分类的方法来识别意图。针对意图多标签分类,即给一个文本打上一个标签,可以使用神经网络单独做意图分类,采用动态阈值来控制多标签意图分类的标签相关性,但是只采用动态阈值对意图的分类,使得最终的意图分类结果准确率低。
[0004]因此,需要提出一种用户意图识别系统可以结合业务领域的用户数据,使得可以本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种意图推理模型训练方法,其特征在于,所述方法包括:获取预设业务场景的多个样本查询文本;采用预设的意图识别模型,对所述多个样本查询文本中的每个样本查询文本进行意图识别,得到所述每个样本查询文本的意图识别结果,所述每个样本查询文本的意图识别结果包括:多个意图类别的样本识别概率;根据所述多个意图类别,从预先构建的业务知识图谱中查询所述多个意图类别对应的概率阈值;其中,所述业务知识图谱中预先存储有:多条业务数据以及所述多个意图类别的概率阈值,每条业务数据由业务标识、业务属性和业务属性参数组成,所述业务属性包括:所述多个意图类别中的至少一个意图类别;根据所述多个意图类别的样本识别概率和所述多个意图类别对应的概率阈值,确定所述每个样本查询文本对应的样本识别意图;根据所述多个样本查询文本对应的样本识别意图,以及所述多个样本查询文本对应的意图类别标签,对所述意图识别模型的模型参数和所述业务知识图谱中的所述各意图类别的概率阈值进行更新,得到包括目标意图识别模型和目标业务知识图谱的意图推理模型。2.根据权利要求1所述的方法,其特征在于,所述根据所述多个意图类别的样本识别概率和所述多个意图类别对应的概率阈值,确定所述每个样本查询文本对应的样本识别意图,包括:根据所述多个意图类别的样本识别概率和所述多个意图类别对应的概率阈值,计算所述每个样本查询文本对应的所述多个意图类别的样本识别权重;根据所述每个样本查询文本对应的所述多个意图类别的样本识别权重,从所述多个意图类别中确定识别权重大于或等于预设权重阈值的意图类别为所述每个样本查询文本对应的样本识别意图。3.根据权利要求1所述的方法,其特征在于,所述根据所述多个样本查询文本对应的样本识别意图,以及所述多个样本查询文本对应的意图类别标签,对所述意图识别模型的模型参数和所述业务知识图谱中的所述各意图类别的概率阈值进行更新,得到包括目标意图识别模型和目标业务知识图谱的意图推理模型,包括:根据所述多个样本查询文本对应的样本识别意图,以及所述多个样本查询文本对应的意图类别标签,计算识别准确度;根据所述识别准确度,对所述意图识别模型的模型参数和所述业务知识图谱中的所述各意图类别的概率阈值进行更新;继续采用更新后的所述意图识别模型和所述业务知识图谱,对所述多个样本查询文本进行处理,直至达到预设停止迭代条件;确定达到所述预设停止迭代条件时的意图识别模型和业务知识图谱分别为所述目标意图识别模型和所述目标业务知识图谱,得到包括所述目标意图识别模型和所述目标业务知识图谱的意图推理模型。4.根据权利要求1所述的方法,其特征在于,所述业务知识图谱中还存储有:所述根据所述多个意图类别,从预先构建的业务知识图谱中查询所述多个意图类别对应的概率阈值之前,所述方法还包括:对所述预设业务场景的用户数据和所述预设业务场景的业务条款数据进行处理;
根据所述用户数据和所述业务条款数据的处理结果,得到所述多条业务数据;根据所述多条业务数据和所述多个意图类别设置对应的初始概率阈值,构建所述业务知识图谱。5.根据权利要求4所述的方法,其特征在于,所述对所述预设业务场景的用户数据和所述预设业务场景的业务条款数据进行处理,包括:对所述用户数据进行处理,得到用户标识;对所述业务条款数据进行实体识别和实体关系提取,得到多个条款数据,每个条款数据由:业务名称、业务属性以及业务属性参数组成;所述根据所述用户数据和所述业务条款数据的处理结果,得到所述多条业务数据,包括:根据所述多个条款数据中的业务名称和所述用户标识,分别生成多个业务标识;根据所述多个业务标识,和所述多个条款数据中业务标识对应的业务属性以及对应的业务...

【专利技术属性】
技术研发人员:孙雅琳杜新凯吕超韩权杰
申请(专利权)人:阳光保险集团股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1