多轮对话中意图识别的方法、介质、装置和计算设备制造方法及图纸

技术编号:29401092 阅读:16 留言:0更新日期:2021-07-23 22:38
本公开的实施方式提供了一种多轮对话中意图识别的方法、介质、装置和计算设备。该方法包括:获取多轮对话中首轮对话所包含的初始问句,确定对应于所述初始问句的多个候选实体,基于所述初始问句和所述多个候选实体生成候选问句,根据所述候选问句以及预先配置有明确意图的参考例句,确定所述首轮对话的意图识别结果。本公开实施例由于在识别候选实体的基础上进行意图识别,有效地将意图识别和实体识别结合起来使用,与单纯进行意图识别的方式相比,考虑了实体影响的因素,极大地提高了多轮对话中意图识别的准确率。

【技术实现步骤摘要】
多轮对话中意图识别的方法、介质、装置和计算设备
本公开的实施方式涉及意图识别
,更具体地,本公开的实施方式涉及多轮对话中意图识别的方法、介质、装置和计算设备。
技术介绍
本部分旨在为权利要求书中陈述的本公开的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是相关技术。多轮对话一般分为闲聊型多轮对话和任务型多轮对话。闲聊型多轮对话一般见于闲聊机器人,如微软小冰,小爱同学等,能在开放领域与用户进行“天马行空”式的对话,聊天话题是无限定的。任务型多轮对话一般见于客服机器人,如阿里小蜜,网易七鱼等,旨在帮助用户解决某领域的特定问题或达成某一特定目的。任务型多轮对话的用户一般带着一个或多个明确的意图如“预定机票”或“自助健康诊断”等,与系统进行交互。该类意图无法简单地用一问一答式的对话方案即单轮对话得到满足,而是需要通过用户和客服机器人的多轮次对话,逐步确认用户意图和补全相关属性信息,才能达到最终目的。例如,在预定机票意图下,多轮对话系统需要先明确用户意图为“预定机票”,再补全用户的出发地、目的地、出发时间和舱位类型等相关信息,才能为用户实现最终的预定机票服务。目前,现有的多轮对话通常是在用户的首轮会话中确定用户进入会话的意图,例如确认用户是需要“预定机票”还是需要“机票改签”;然后再进行槽位填充,收集完成用户意图识别所需的其它信息,如“预定机票”意图需要收集用户的“出发地”和“目的地”等实体信息。但是,上述现有技术把意图识别和实体识别两个步骤独立开来进行,导致整个会话流程的正误强依赖于第一个执行的步骤。如果先进行的意图识别环节发生错误,则后续的实体识别任务毫无意义。例如在机场场景中有两个意图“预定机票”和“机票改签”,如果在意图识别环节,把用户意图从“预定机票”误认为“机票改签”,那么后续去抽取“改签日期”这个实体则毫无意义。
技术实现思路
本公开期望提供一种多轮对话中意图识别的方法和装置。在本公开实施方式的第一方面中,提供了一种多轮对话中意图识别的方法,包括:获取多轮对话中首轮对话所包含的初始问句;确定对应于所述初始问句的多个候选实体;基于所述初始问句和所述多个候选实体生成候选问句;根据所述候选问句以及预先配置有明确意图的参考例句,确定所述首轮对话的意图识别结果。在本公开的一个实施例中,所述候选实体的类型包括:预置型实体、枚举型实体、正则型实体和描述型实体,所述预置型实体为预先配置好且直接封装的实体类型,所述枚举型实体为实体值可枚举的实体类型,所述正则型实体为可用正则表达式归纳实体值的实体类型,所述描述型实体为对事物属性或状态进行描述的实体类型。在本公开的一个实施例中,所述确定对应于所述初始问句的多个候选实体,包括:使用预先训练的第一识别模型,识别出对应于所述初始问句的多个候选实体,所述多个候选实体包括预置型实体、枚举型实体和正则型实体。在本公开的一个实施例中,所述基于所述初始问句和所述多个候选实体生成候选问句,包括:对所述多个候选实体进行组合形成对应于所述初始问句的多个候选实体集合,其中,所述候选实体集合以至少一个所述候选实体作为其元素;分别将各个候选实体集合中的元素配置于所述初始问句的对应位置中,以形成多个对应于所述初始问句的候选问句。在本公开的一个实施例中,所述分别将各个候选实体集合中的元素配置于所述初始问句的对应位置中,以形成多个对应于所述初始问句的候选问句,包括:分别将各个候选实体集合中的元素配置于所述初始问句的对应位置中,过滤掉元素数目少于指定数目的句子后,得到多个对应于所述初始问句的候选问句。在本公开的一个实施例中,所述分别将各个候选实体集合中的元素配置于所述初始问句的对应位置中,以形成多个对应于所述初始问句的候选问句,包括:分别将各个候选实体集合中的元素配置于所述初始问句的对应位置中,过滤掉未出现在预先配置有明确意图的参考例句中的句子,得到多个对应于所述初始问句的候选问句。在本公开的一个实施例中,所述分别将各个候选实体集合中的元素配置于所述初始问句的对应位置中,以形成多个对应于所述初始问句的候选问句,包括:分别将各个候选实体集合中的元素配置于所述初始问句的对应位置中,在得到的句子总数达到预设的上限值时,以当前所得到的句子为限,在其中随机选取多个句子作为对应于所述初始问句的候选问句。在本公开的一个实施例中,所述对所述多个候选实体进行组合形成对应于所述初始问句的多个候选实体集合之前,还包括:对于存在多个实体值的候选实体,获取对应于该候选实体的各个实体值的字符串长度,并确定相应实体值在所述初始问句中的起始位置,根据所述字符串长度和所述起始位置筛选出用于进行组合的相应实体值。在本公开的一个实施例中,所述根据所述字符串长度和所述起始位置筛选出用于进行组合的相应实体值,包括:若该候选实体的多个实体值的字符串长度不同,则选择字符串长度最长的实体值用于进行组合;若该候选实体的多个实体值的字符串长度均相同,则在该多个实体值所包含的字符串有重叠的情况下,选择起始位置最靠前的实体值用于进行组合。在本公开的一个实施例中,所述根据所述候选问句以及预先配置有明确意图的参考例句,确定所述首轮对话的意图识别结果,包括:若预先配置有明确意图的参考例句中存在包括描述型实体的参考例句,将该参考例句中所述描述型实体的实体值进行扩展,得到扩展例句,并将得到的所述扩展例句补充到所述意图中;根据所述候选问句以及所述意图的参考例句和扩展例句,确定所述首轮对话的意图识别结果。在本公开的一个实施例中,所述将该参考例句中所述描述型实体的实体值进行扩展,得到扩展例句,包括:在预先为所述描述型实体配置的多个实体值中,获取除当前出现在所述参考例句中的实体值以外的其他实体值;将所述参考例句中的当前实体值,依次替换为获取的所述其他实体值,分别得到对应的扩展例句。在本公开的一个实施例中,所述根据所述候选问句以及预先配置有明确意图的参考例句,确定所述首轮对话的意图识别结果,包括:分别对所述候选问句及预先配置有明确意图的参考例句进行编码;对编码后的候选问句与参考例句进行相似度计算;根据相似度计算的结果确定所述首轮对话的意图识别结果。在本公开的一个实施例中,所述方法由预先训练的第一识别模型执行,且在所述多轮对话开始前,采用配对框架构造三元组的训练数据对所述第一识别模型进行训练。在本公开的一个实施例中,所述三元组包括第一文本串、第二文本串和第三文本串,所述训练的目标为所述第一文本串和第二文本串的相似度,高于所述第一文本串和第三文本串的相似度。在本公开的一个实施例中,所述采用配对框架构造三元组的训练数据对所述第一识别模型进行训练,包括:若所述三元组中的第一文本串和第二文本串中包含相同的实体,且所述第一文本串和第三文本串中无相同的实体,则训练所述第一识别模型识别所述第一本文档来自技高网
...

【技术保护点】
1.一种多轮对话中意图识别的方法,其特征在于,包括:/n获取多轮对话中首轮对话所包含的初始问句;/n确定对应于所述初始问句的多个候选实体;/n基于所述初始问句和所述多个候选实体生成候选问句;/n根据所述候选问句以及预先配置有明确意图的参考例句,确定所述首轮对话的意图识别结果。/n

【技术特征摘要】
1.一种多轮对话中意图识别的方法,其特征在于,包括:
获取多轮对话中首轮对话所包含的初始问句;
确定对应于所述初始问句的多个候选实体;
基于所述初始问句和所述多个候选实体生成候选问句;
根据所述候选问句以及预先配置有明确意图的参考例句,确定所述首轮对话的意图识别结果。


2.根据权利要求1所述的方法,其特征在于,所述候选实体的类型包括:预置型实体、枚举型实体、正则型实体和描述型实体,所述预置型实体为预先配置好且直接封装的实体类型,所述枚举型实体为实体值可枚举的实体类型,所述正则型实体为可用正则表达式归纳实体值的实体类型,所述描述型实体为对事物属性或状态进行描述的实体类型。


3.根据权利要求1所述的方法,其特征在于,所述基于所述初始问句和所述多个候选实体生成候选问句,包括:
对所述多个候选实体进行组合形成对应于所述初始问句的多个候选实体集合,其中,所述候选实体集合以至少一个所述候选实体作为其元素;
分别将各个候选实体集合中的元素配置于所述初始问句的对应位置中,以形成多个对应于所述初始问句的候选问句。


4.根据权利要求3所述的方法,其特征在于,所述分别将各个候选实体集合中的元素配置于所述初始问句的对应位置中,以形成多个对应于所述初始问句的候选问句,包括:
分别将各个候选实体集合中的元素配置于所述初始问句的对应位置中,过滤掉元素数目少于指定数目的句子后,得到多个对应于所述初始问句的候选问句。


5.根据权利要求1所述的方法,其特征在于,所述根据所述候选问句以及预先配置有明确意图的参考例句,确定所述首轮对话的意图识别结果,包括:
若预先配置有明确意图的参考例句中存在包括描述型实体的参考例句,将该...

【专利技术属性】
技术研发人员:沙雨辰俞霖霖胡光龙汪源刘秀颖
申请(专利权)人:网易杭州网络有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1