智能对话中多意图语义识别方法技术

技术编号:37213569 阅读:16 留言:0更新日期:2023-04-20 23:02
本发明专利技术公开了一种智能对话中多意图语义识别方法,包括:模型初始化、模型调用、模型更新;所述模型初始化对于每一类对话场景,训练一个独立的意图模型,模型分类分别为:情感分类模型、意图分类模型、意图模型;模型调用意图处理服务步骤如下:(1)文本清洗,(2)意图分类,(3)意图分拆,(4)意图筛选,(5)意图排序,(6)多意图合并。模型更新训练的输入为:对话质检、真实对话学习。本发明专利技术实现了一种针对复杂意图的智能识别算法,提高了智能对话的意图识别准确率,极大提升了对话效果。极大提升了对话效果。极大提升了对话效果。

【技术实现步骤摘要】
智能对话中多意图语义识别方法


[0001]本专利技术涉及一种智能对话中多意图语义识别方法,属于语义识别


技术介绍

[0002]人工智能技术目前已普遍应用于各行各业。在企业通讯领域,智能对话相关应用已可以大规模的代替人工,大大节约了企业用人成本。而其中自然语义理解(NLP)技术成为最关键的因素,是否能准确识别用户意图,很大程度上决定了对话的质量。对于客户意图的识别,目前有许多算法在使用。但这些算法或模型都存在一个典型的问题,即对于越复杂的用户对话,越难以准确理解客户的意图。或者客户在对话中表达了多种意图,但是现有技术只能识别出其中某种意图。

技术实现思路

[0003]本专利技术的目的在于提供一种智能对话中多意图语义识别方法,更加有效和准确的应用于自然语义处理(NLP,NativeLanguageProcess)过程中的复杂意图识别,以解决目前在智能对话领域客户意图识别不准,导致对话效果不佳、影响对话质量的问题。通过对意图识别模型的学习与训练,以提升意图识别准确率,给客户带来更好的对话体验。
[0004]本专利技术的目的通过以下技术方案予以实现:
[0005]一种智能对话中多意图语义识别方法,包括:模型初始化、模型调用、模型更新;
[0006]1)模型初始化:对于每一类对话场景,训练一个独立的意图模型,所需语料为问题库或聚类,聚类即相似文本的集合;语料来源于历史语料整理、历史对话学习;
[0007]模型分类:模型分为三类,分别为:情感分类模型、意图分类模型、意图模型;
[0008]意图分类模型用以判断客户对话的意愿方向,分为:肯定、否定、中性,不同对话场景只需维护一个模型;
[0009]情感分类模型用以判断客户对话的情感极性,分为:消极、积极、中性,不同对话场景只需维护一个模型;
[0010]意图模型用以判断客户具体的细分意图,意图模型因对话场景不同而不同,需要针对不同的对话场景单独训练,每个问题或聚类都是一个意图,意图模型会输出其中一个或多个意图,意图附有分值,分值区间为0

100,与训练语料近似度越接近分值越高;
[0011]2)模型调用:
[0012]发起一个智能外呼任务时,调用意图处理服务,意图处理服务访问训练好的模型,意图处理服务步骤如下:
[0013](1)文本清洗:
[0014]在处理文本之前,去除无用词汇;
[0015](2)意图分类:
[0016]经过文本清洗后的完整客户对话,称为整句;
[0017]将整句送入意图分类模型,得到整句的意图分类为肯定、否定、中性中的某一种;
[0018]将整句送入情感分类模型,得到整句的情感极性为积极、消极、中性中的某一种;
[0019](3)意图分拆:
[0020]对整句按照标点符号进行分拆,得到多个分句;将整句和每一个分句送入意图模型,根据与不同意图的模型近似度打分,即计算各句与模型文本的向量值,计算值越接近分值越高,从而得到多个意图,以及对应意图的分值,分值范围为0

100;
[0021](4)意图筛选:
[0022]剔除分数较低者:剔除意图分值低于65分的意图;
[0023]剔除极性相反者:如果分拆后的分句意图与整句意图极性相反,将意图极性相反的分句删除;
[0024](5)意图排序:
[0025]在意图分拆步骤中,每一个意图都有分值;
[0026]若筛选后的意图均为聚类,则取聚类最高分者作为最终意图;
[0027]若筛选后的意图均为问题,则取问题最高分者作为最终意图;
[0028]若筛选后的意图同时包含聚类和问题,则取决于对话流程中定义的优先级,即问题回答优先还是聚类回答优先,按照优先级设定取最高分者作为最终意图;
[0029](6)多意图合并:
[0030]若对话中设定问题回答优先,则拼接所有问题的答案作为客户回复,但意图判定仍取最高分者。
[0031]3)模型更新:
[0032]模型更新训练的输入为:对话质检、真实对话学习。
[0033]本专利技术的目的还可以通过以下技术措施来进一步实现:
[0034]前述智能对话中多意图语义识别方法,步骤3)模型更新中,所述对话质检即通过人工质检机器人实际与客户的真实对话文本,发现其中意图识别不准确的对话片断,重新进行标注和修正,再把这部分文本重新放到模型训练集中进行训练,提高模型的精确性。
[0035]前述智能对话中多意图语义识别方法,步骤3)模型更新中,针对意图未识别者,对未识别者进行全量的自动化归类,即自动检索生成全量的未识别文本库,然后对这部分内容进行人工标注,重新投入模型训练。
[0036]与现有技术相比,本专利技术的有益效果是:
[0037]1.意图模型仅需少量语料即可实现冷启动,传统的做法需要大量的人工标注,需要耗费较多的人力。
[0038]2.意图模型的语料更新,可以通过系统的自动归类进行整理,结合人工审核后批量添加,可维护性高。
[0039]3.意图模型结合意图分类模型,对意图进行分拆,可以准确得到客户真实意图,在复杂对话的意图判定时具有更高的识别准确率。
[0040]本专利技术可用于智能语音外呼、智能在线客服、呼入式机器人等智能对话场景。本专利技术实现了一种针对复杂意图的智能识别算法,提高了智能对话的意图识别准确率,极大提升了对话效果,可以有效增加客户成单率、提升客户满意度,从而达成企业业务目标。
附图说明
[0041]图1是本专利技术的模型生成算法流程图;
[0042]图2是模型调用流程图;
[0043]图3是多意图模型生成流程示意图;
[0044]图4是模型优化更新流程图;
[0045]图5是模型应用的产品架构图;
[0046]图6是业务流程图;
[0047]图7是平台系统架构图;
[0048]图8是多意图模型产品软件架构图。
具体实施方式
[0049]下面结合附图和具体实施例对本专利技术作进一步说明。
[0050]本专利技术提供了如下技术方案:由业务人员或系统发起意图识别模型的训练,模型经验证发布后,在对话流程中调用,再结合多意图判定方法,最终得到用户真实意图。
[0051]该过程主要分为三个阶段:模型初始化、模型调用、模型更新。
[0052]1.模型初始化,如图1所示;
[0053]模型训练的基础数据来源于谷歌BERT(BidrectionalEncoderRepresentationsfrom Transformer)语言模型开源预训练数据库、行业知识库以及历史对话数据,具有通用性。
[0054]对于每一类对话场景,均需要训练一个独立的意图模型。为了获得一个可用的意图模型,首先必须准备充足的语料。语料的表现形式一般是问题库或聚类(相似文本的集合)。语料的来源主要有两种,一种是历史语料本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种智能对话中多意图语义识别方法,其特征在于,包括:模型初始化、模型调用、模型更新;1)模型初始化:对于每一类对话场景,训练一个独立的意图模型,所需语料为问题库或聚类,聚类即相似文本的集合;语料来源于历史语料整理、历史对话学习;模型分类:模型分为三类,分别为:情感分类模型、意图分类模型、意图模型;意图分类模型用以判断客户对话的意愿方向,分为:肯定、否定、中性,不同对话场景只需维护一个模型;情感分类模型用以判断客户对话的情感极性,分为:消极、积极、中性,不同对话场景只需维护一个模型;意图模型用以判断客户具体的细分意图,意图模型因对话场景不同而不同,需要针对不同的对话场景单独训练,每个问题或聚类都是一个意图,意图模型会输出其中一个或多个意图,意图附有分值,分值区间为0

100,与训练语料近似度越接近分值越高;2)模型调用:发起一个智能外呼任务时,调用意图处理服务,意图处理服务访问训练好的模型,意图处理服务步骤如下:(1)文本清洗:在处理文本之前,去除无用词汇;(2)意图分类:经过文本清洗后的完整客户对话,称为整句;将整句送入意图分类模型,得到整句的意图分类为肯定、否定、中性中的某一种;将整句送入情感分类模型,得到整句的情感极性为积极、消极、中性中的某一种;(3)意图分拆:对整句按照标点符号进行分拆,得到多个分句;将整句和每一个分句送入意图模型,根据与不同意图的模型近似度打分,即计算各句与...

【专利技术属性】
技术研发人员:周立汪聪任语高兴武李传虎
申请(专利权)人:南京易米云通网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1