本公开提供了一种意图识别方法、对话文本挖掘方法及装置、设备、介质,该方法包括基于当前对话文本以及与当前对话文本关联的关联对话文本获取当前对话文本的初始语义信息;其中,当前对话文本和关联对话文本是一次会话中的对话文本,每个对话文本对应一个语句;基于当前对话文本的初始语义信息,以及关联对话文本的初始语义信息,利用注意力机制确定当前对话文本的增强语义信息;基于当前对话文本的增强语义信息,确定当前对话文本的意图。根据本公开的实施例能够提高意图识别的准确性和泛化能力。化能力。化能力。
【技术实现步骤摘要】
意图识别方法、对话文本挖掘方法及装置、设备、介质
[0001]本公开涉及人工智能
,特别涉及一种意图识别方法、对话文本挖掘方法及装置、设备、介质。
技术介绍
[0002]从全量的业务会话中挖掘出优秀对话有利于提高员工的业务能力,也有利于新员工的培训,因此,挖掘优秀对话成为一些企业的迫切需求。传统的挖掘方式是通过人工识别,但挖掘效率低,人工成本高。随着人工智能技术的发展,优秀对话的挖掘逐渐向智能化发展,以期望提高优秀对话的挖掘效率,降低人工成本。
技术实现思路
[0003]本公开提供一种意图识别方法、对话文本挖掘方法及装置、设备、介质,可以提高意图识别的准确性,以及对话文本挖掘的准确性和泛化能力。
[0004]第一方面,本公开提供了一种意图识别方法,包括:
[0005]基于当前对话文本以及与所述当前对话文本关联的关联对话文本获取所述当前对话文本的初始语义信息;其中,所述当前对话文本和所述关联对话文本是一次会话中的对话文本,每个所述对话文本对应一个语句;
[0006]基于所述当前对话文本的初始语义信息,以及与所述当前对话文本关联的关联对话文本的初始语义信息,利用注意力机制确定所述当前对话文本的增强语义信息;
[0007]基于所述当前对话文本的增强语义信息,确定所述当前对话文本的意图。
[0008]可以看出,在本申请实施例中,获得当前对话文本和关联对话文本的初始语义信息后,基于所述当前对话文本的初始语义信息,以及与所述当前对话文本关联的关联对话文本的初始语义信息,利用注意力机制确定所述当前对话文本的增强语义信息,由于关联对话文本与当前对话文本来自于同一个会话,关联对话文本与当前对话文本具有一定的关联性,在注意力机制下使当前对话文本的增强语义信息包含有关联对话文本的初始语义信息,由此得到的当前对话文本的增强语义信息相比于仅通过当前对话文本的初始语义信息得到的增强语义信息更全面,在增强语义信息的基础上确定的对话文本的意图也更准确,意图识别的泛化能力也更强。
[0009]第二方面,本公开提供了一种对话文本挖掘方法,包括:
[0010]获取会话中的多个对话文本,每个所述对话文本对应一个语句;
[0011]利用第一方面提供的所述意图识别方法预测各个所述对话文本的意图;
[0012]基于各个所述对话文本的意图,确定所述多个对话文本是否是目标对话文本。
[0013]可以看出,在本申请实施例中,当前对话文本的增强语义信息是基于当前对话文本的初始语义信息和关联对话文本的初始语义信息并利用注意力机制确定的,由于当前对话文本和关联对话文本来自于同一个会话,因此,关联对话文本与当前对话文本具有一定的关联性,在注意力机制下,使当前对话文本的增强语义信息包含有关联对话文本的初始
语义信息,由此得到的当前对话文本的增强语义信息相比于仅通过当前对话文本的初始语义信息得到的增强语义信息更全面,在增强语义信息的基础上确定的对话文本的意图更准确,此基础上选择的目标对话文本也更准确;而且,由于增强语义信息不仅包含当前对话文本的初始语义信息,还包括关联对话文本的初始语义信息,增强了意图识别的泛化能力,此基础上选择目标对话文本的泛化能力也更强。
[0014]第三方面,本公开提供了一种意图识别装置,包括:
[0015]提取模块,用于基于当前对话文本以及与所述当前对话文本关联的关联对话文本获取所述当前对话文本的初始语义信息;其中,所述当前对话文本和所述关联对话文本是一次会话中的对话文本,每个所述对话文本对应一个语句;
[0016]第一确定模块,用于基于所述当前对话文本的初始语义信息,以及所述关联对话文本的初始语义信息,利用注意力机制确定所述当前对话文本的增强语义信息;
[0017]第二确定模块,用于基于所述当前对话文本的增强语义信息,确定所述当前对话文本的意图。
[0018]第四方面,本公开提供了一种对话文本挖掘装置,包括:
[0019]获取模块,用于获取会话中的多个对话文本,每个所述对话文本对应一个语句;
[0020]意图识别模块,用于预测各个所述对话文本的意图,其中,所述意图识别模块采用第三方面提供的所述意图识别装置;
[0021]判断模块,用于基于各个所述对话文本的意图,判断所述多个对话文本是否是目标对话文本。
[0022]第五方面,本公开提供了一种电子设备,该电子设备包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的一个或多个计算机程序,一个或多个所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述的对话文本挖掘方法。
[0023]第六方面,本公开提供了一种计算机可读存储介质,其上存储有计算机程序,其中,所述计算机程序在被处理器/处理核执行时实现上述的对话文本挖掘方法。
[0024]第七方面,本公开提供了一种计算机程序或计算机程序产品,该计算机程序产品包括计算机程序,计算机程序存储在计算机可读存储介质中,所述计算机程序在被处理器执行时实现上述的对话文本挖掘方法。
[0025]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0026]附图用来提供对本公开的进一步理解,并且构成说明书的一部分,与本公开的实施例一起用于解释本公开,并不构成对本公开的限制。通过参考附图对详细示例实施例进行描述,以上和其他特征和优点对本领域技术人员将变得更加显而易见,在附图中:
[0027]图1为本公开实施例提供的一种意图识别方法的流程图;
[0028]图2为本公开实施例提供的一种意图识别模型的结构示意图;
[0029]图3为本公开实施例提供的一种对话文本挖掘方法的流程图;
[0030]图4为本公开实施例中判断目标对话文本的流程图;
[0031]图5为本公开实施例提供的一种意图识别装置的示意框图;
[0032]图6为本公开实施例提供的一种对话文本挖掘装置的示意框图;
[0033]图7为本公开实施例提供的一种电子设备的框图。
具体实施方式
[0034]为使本领域的技术人员更好地理解本公开的技术方案,以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0035]在不冲突的情况下,本公开各实施例及实施例中的各特征可相互组合。
[0036]如本文所使用的,术语“和/或”包括一个或多个相关列举条目的任何和所有组合。
[0037]本文所使用的术语仅用于描述特定实施例,且不意欲限制本公开。如本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种意图识别方法,其特征在于,包括:基于当前对话文本以及与所述当前对话文本关联的关联对话文本获取所述当前对话文本的初始语义信息;其中,所述当前对话文本和所述关联对话文本是一次会话中的对话文本,每个所述对话文本对应一个语句;基于所述当前对话文本的初始语义信息,以及所述关联对话文本的初始语义信息,利用注意力机制确定所述当前对话文本的增强语义信息;基于所述当前对话文本的增强语义信息,确定所述当前对话文本的意图。2.根据权利要求1所述的方法,其特征在于,所述基于当前对话文本以及与所述当前对话文本关联的关联对话文本获取所述当前对话文本的初始语义信息,包括:获取所述当前对话文本和所述关联对话文本的角色;基于所述当前对话文本和所述关联对话文本的角色,以及所述当前对话文本和所述关联对话文本确定所述当前对话文本的初始语义信息。3.根据权利要求1所述的方法,其特征在于,所述基于所述当前对话文本的初始语义信息,以及所述关联对话文本的初始语义信息,利用注意力机制确定所述当前对话文本的增强语义信息,包括:基于所述当前对话文本的初始语义信息、以及所述关联对话文本的初始语义信息,利用注意力机制确定各个所述关联对话文本与所述当前对话文本的相关性;基于各个所述关联对话文本与所述当前对话文本的相关性确定各个所述关联对话文本对于所述当前对话文本的权重系数;基于所述当前对话文本的初始语义信息、各个所述关联对话文本的初始语义信息、以及各个所述关联对话文本对于所述当前对话文本的权重系数确定所述当前对话文本的增强语义信息。4.一种对话文本挖掘方法,其特征在于,包括:获取会话中的多个对话文本,每个所述对话文本对应一个语句;利用权利要求1至3任一所述意图识别方法预测各个所述对话文本的意图;基于各个所述对话文本的意图,确定所述多个对话文本是否是目标对话文本。5.根据权利要求4所述的方法,其特征在于,所述获取多个对话文本,包括:基于预设的召回规则从全量会话中召回候选会话;其中,所述全量会话是从业务系统获取的预设时间段内的全部会话;基于所述候选会话获得所述多个对话文本。6.根据权利要求5所述的方法,其特征在于,所述召回规则包括固定对话规则、对话属性规则和对话文本规则中的一种或多种;其中,所述固定对话规则是指基于业务领域确定的具有通用性的对话制定的规则;所述对话属性规则是指基于对话角色、对话轮次、文本长度中的一项或多项制定的规则;所述对话文本规则是指基于对话用语制定的规则。7.根据权利要求4所述的方法,其...
【专利技术属性】
技术研发人员:曹磊,李长林,罗奇帅,肖冰,
申请(专利权)人:马上消费金融股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。