一种多意图识别方法及系统技术方案

技术编号:32266204 阅读:12 留言:0更新日期:2022-02-12 19:28
本发明专利技术提供了一种多意图识别方法及系统,所述方法包括如下步骤:步骤S1:根据业务需求收集相应用户语料并进行预处理;步骤S2:根据用户语料定义相应意图;步骤S3:训练和优化多意图识别模型;步骤S4:通过多意图识别模型识别该用户语料的意图个数;步骤S5:如果意图个数是单个则该意图是最佳意图,如果意图个数是多个,可结合业务对多个意图筛选出最佳意图。本发明专利技术通过采用多意图识别提升意图识别的准确率和增强人机对话的用户体验;不仅支持用户单意图识别同时也解决人机对话中用户多意图识别问题,从而提升了意图识别准确率同时保证人机对话的用户体验,极大的提高了问答效率,有效的避免了对用户多意图问答不能识别或较差的现象。差的现象。差的现象。

【技术实现步骤摘要】
一种多意图识别方法及系统


[0001]本专利技术涉及人工智能自然语言处理领域,具体地,涉及一种一种多意图识别方法及系统,尤其涉及一种多意图识别方法。

技术介绍

[0002]对话管理(Dialog Management,DM)控制着人机对话的过程,DM根据对话上下文状态信息,决定此刻对用户的响应。目前,最常见的还是任务驱动的多轮对话。以金融行业为例,用户带着明确的目的如汇款、缴费等,对话系统需要与客户进行多轮交互,以确定在不同条件下,客户应该携带什么材料、如何办理业务。在同一个话题范围内,客户可能会依据该话题衍生出许多其他的子问题,同时,客户的询问顺序并不一致,且包含大量的省略式问句,因此,目前依据于单意图识别,在处理客户复杂的需求时往往力不从心。
[0003]在公开号为CN109933654A的专利文献中公开了一种基于状态树的对话管理方法,将对话过程中的话题状态存储在状态树结构中,可以在更大程度上利用上下文来理解客户的真实意图,极大的提高了问答效率,有效的避免了对客户各种省略问答无法响应的现象,同时该对话管理方法可实现基于上下文省略的多种对话模式,方便的对数据进行增删查改,极大的减少了数据维护量。
[0004]针对上述中的相关技术,专利技术人认为上述方案虽然能够支持人机对话的业务持续进行,但却不能识别出用户的多个意图和提升人机对话的用户体验;因此,需要提出一种技术方案以改善上述技术问题。

技术实现思路

[0005]针对现有技术中的缺陷,本专利技术的目的是提供一种多意图识别方法及系统。<br/>[0006]根据本专利技术提供的一种多意图识别方法,所述方法包括如下步骤:
[0007]步骤S1:根据业务需求收集相应用户语料并进行预处理;
[0008]步骤S2:根据用户语料定义相应意图;
[0009]步骤S3:训练和优化多意图识别模型;
[0010]步骤S4:通过多意图识别模型识别该用户语料的意图个数;
[0011]步骤S5:如果意图个数是单个则该意图是最佳意图,如果意图个数是多个,可结合业务对多个意图筛选出最佳意图。
[0012]优选地,所述步骤S1中的语料收集通过生产环境收集用户语料,车载语音对话系统在车上开始运营;语料预处理是清洗脏乱差和没有实际语义的用户语料。
[0013]优选地,所述步骤S2中通过用户语料获得语料所对应的领域,结合业务需求定义相应意图。
[0014]优选地,所述步骤S3中每种意图的语料按照比例进行划分,把每种意图语料分别作为训练集、验证集和测试集;通过测试集的结果,分析模型对每个意图语料识别效果,从语料、算法和参数迭代优化模型;通过训练获得多意图识别模型。
[0015]优选地,所述步骤S4中对于多意图识别模型,输入是文本,输出是文本所对应的意图,如果文本所对应的意图没有多意图label,则意图个数为单个;如果文本所对应的意图有多意图label,则意图个数为多个。
[0016]本专利技术还提供一种多意图识别系统,所述系统包括如下模块:
[0017]模块M1:根据业务需求收集相应用户语料并进行预处理;
[0018]模块M2:根据用户语料定义相应意图;
[0019]模块M3:训练和优化多意图识别模型;
[0020]模块M4:通过多意图识别模型识别该用户语料的意图个数;
[0021]模块M5:如果意图个数是单个则该意图是最佳意图,如果意图个数是多个,可结合业务对多个意图筛选出最佳意图。
[0022]优选地,所述模块M1中的语料收集通过生产环境收集用户语料,车载语音对话系统在车上开始运营;语料预处理是清洗脏乱差和没有实际语义的用户语料。
[0023]优选地,所述模块M2中通过用户语料获得语料所对应的领域,结合业务需求定义相应意图。
[0024]优选地,所述模块M3中每种意图的语料按照比例进行划分,把每种意图语料分别作为训练集、验证集和测试集;通过测试集的结果,分析模型对每个意图语料识别效果,从语料、算法和参数迭代优化模型;通过训练获得多意图识别模型。
[0025]优选地,所述模块M4中对于多意图识别模型,输入是文本,输出是文本所对应的意图,如果文本所对应的意图没有多意图label,则意图个数为单个;如果文本所对应的意图有多意图label,则意图个数为多个。
[0026]与现有技术相比,本专利技术具有如下的有益效果:
[0027]1、本专利技术通过采用多意图识别提升意图识别的准确率和增强人机对话的用户体验;
[0028]2、本专利技术不仅支持用户单意图识别同时也解决人机对话中用户多意图识别问题,从而提升了意图识别准确率同时保证人机对话的用户体验,极大的提高了问答效率,有效的避免了对用户多意图问答不能识别或较差的现象。
附图说明
[0029]通过阅读参照以下附图对非限制性实施例所作的详细描述,本专利技术的其它特征、目的和优点将会变得更明显:
[0030]图1为本专利技术的流程示意图。
具体实施方式
[0031]下面结合具体实施例对本专利技术进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本专利技术,但不以任何形式限制本专利技术。应当指出的是,对本领域的普通技术人员来说,在不脱离本专利技术构思的前提下,还可以做出若干变化和改进。这些都属于本专利技术的保护范围。
[0032]参照图1,本专利技术提供一种多意图识别方法及系统,本专利技术通过采用多意图识别提升意图识别的准确率和增强人机对话的用户体验,包括如下步骤:
[0033]步骤S1:根据业务需求收集相应用户语料并进行预处理。语料收集:通过生产环境收集用户语料,车载语音对话系统在实际的车上已经运营。例如:新能源汽车上都有车载语音对话机器人。语料预处理:清洗脏乱差和没有实际语义的用户语料。例如:一个字的、符合的和没有实际语义的句子等。
[0034]步骤S2:根据用户语料定义相应意图;通过用户语料可以知道这些语料所对应的领域,结合业务需求定义相应意图。例如:用户语料有明天的天气、我要导航去外滩和播放周杰伦的千里之外,则对应意图为天气、导航和音乐。
[0035]步骤S3:训练和优化多意图识别模型。训练:首先,每种意图的语料按照8:1:1的比例进行划分,其次,把每种意图语料的8份作为训练集,每种意图语料的1份作为验证集,另每种意图语料的1份作为测试集。优化:通过测试集的结果,分析该模型对每个意图语料识别效果,从语料、算法和参数迭代优化该模型。多意图识别模型通过训练获得。
[0036]步骤S4:通过多意图识别模型识别该用户语料的意图个数。对于多意图识别模型,输入是文本,输出是该文本所对应的意图,如果该文本所对应的意图没有多意图label,则意图个数为单个,如果该文本所对应的意图有多意图label则意图个数为多个,具体意图个数是在步骤S2定义好的。总之,对于多意图识别模型,输入是文本,如果输出是单意图label则意图的个数为单个,如果是多意图label则需要要映射一下该label所对应本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种多意图识别方法,其特征在于,所述方法包括如下步骤:步骤S1:根据业务需求收集相应用户语料并进行预处理;步骤S2:根据用户语料定义相应意图;步骤S3:训练和优化多意图识别模型;步骤S4:通过多意图识别模型识别该用户语料的意图个数;步骤S5:如果意图个数是单个则该意图是最佳意图,如果意图个数是多个,可结合业务对多个意图筛选出最佳意图。2.根据权利要求1所述的多意图识别方法,其特征在于,所述步骤S1中的语料收集通过生产环境收集用户语料,车载语音对话系统在车上开始运营;语料预处理是清洗脏乱差和没有实际语义的用户语料。3.根据权利要求1所述的多意图识别方法,其特征在于,所述步骤S2中通过用户语料获得语料所对应的领域,结合业务需求定义相应意图。4.根据权利要求1所述的多意图识别方法,其特征在于,所述步骤S3中每种意图的语料按照比例进行划分,把每种意图语料分别作为训练集、验证集和测试集;通过测试集的结果,分析模型对每个意图语料识别效果,从语料、算法和参数迭代优化模型;通过训练获得多意图识别模型。5.根据权利要求1所述的多意图识别方法,其特征在于,所述步骤S4中对于多意图识别模型,输入是文本,输出是文本所对应的意图,如果文本所对应的意图没有多意图label,则意图个数为单个;如果文本所对应的意图有多意图label,则意图个数为多个。6.一种...

【专利技术属性】
技术研发人员:朱亚杰卢宏涛
申请(专利权)人:上海交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1