对话交互意图的识别方法和装置制造方法及图纸

技术编号:26762731 阅读:17 留言:0更新日期:2020-12-18 23:15
本申请公开了一种对话交互意图的识别方法和装置,其中方法包括:对于首轮对话语句,利用预设的多分类模型,对该轮对话语句所属的垂直领域进行识别;对于除所述首轮对话语句之外的每轮对话语句,利用预设的上一轮对话语句所属垂直领域对应的二分类模型,判断该轮对话语句所属的垂直领域是否是上一轮对话语句所属的垂直领域,如果不是,则利用所述多分类模型,对该轮对话语句所属的垂直领域进行识别;其中,所述二分类模型利用属于相应垂直领域的语料和不属于相应垂直领域的语料训练得到,且所述语料包括不完整语句。本申请易于实现,且可以提高识别效率和用户体验。

【技术实现步骤摘要】
对话交互意图的识别方法和装置
本专利技术涉及人工智能技术,特别是涉及一种对话交互意图的识别方法和装置。
技术介绍
随着人工智能技术的快速发展,人机对话技术近年来受到学术界和工业界的广泛关注。各种各样的智能机器人层出不穷,已经在医疗、军事、汽车、商业等领域获得了成功的应用,并逐渐对我们的生活产生重大影响。典型的智能对话交互机器人框架都是分模块串行处理对话任务的,每个模块负责特定的任务,并将生成的结果传递给下一个模块。图1为现有的面向任务的对话系统框架示意图,如1所示,整个交互框架通常由自然语言理解(NaturalLanguageUnderstanding,NLU),对话状态跟踪(DialogueStateTracking,DST),对话策略学习(DialoguePolicyLearning,DPL),自然语言生成(NaturalLanguageGeneration,NLG)四个部分构成。人机对话系统的一个关键任务就是:如何让聊天机器人理解用户的问句意图、将用户的输入正确地分类到相应的领域中。该任务的实现将直接影响特定领域的人机对话质量。因此,图1中的NLU模块是整个人机交互过程中比较核心的部分,该模块的主要任务就是把用户输入的自然语言语句映射成为机器可读的结构化语义表述,这种结构化的语义表述通常包含两部分内容,一部分是获取用户的意图,另一部分是提取自然语言问句的槽值。自然语言理解是人工智能的AI-Hard问题,也是当前智能交互的核心难题,因为机器要理解用户的自然语言问句,要面临语言的多样性、多义性、知识依赖和上下文依赖等诸多挑战。专利技术人在实现本专利技术的过程中发现,上述现有针对多轮对话的对话意图识别方案存在实现复杂,效率低以及对用户参与的依赖性强等问题。具体分析如下:在现有的对话意图识别方案中,需要预先针对意图不完整问句单独设置一类(比如select类),然后,将该类语句作为语料,进行多标签分类模型训练,得到一个多标签分类模型。在人机对话过程中,如果会话过程中存在属于上述不完整问句所在类的问句,为了明确这些问句具体属于哪个垂直领域,首先,通过多标签分类模型获得多个标签指示的多个可能的垂直领域,然后,再利用上下文信息决策当前问句的垂直领域,如果利用上下文还不能够明确问句属于哪个垂直领域,就需要再与用户进行新一轮的交互,在交互中通过反问用户,再基于用户的回答进行垂直领域的识别,如果基于该轮回答还不能明确问句属于哪个垂直领域,将会再触发新一轮的交互。可见,上述对话意图方案是基于预设的多标签分类模型进行识别的。而利用多标签分类模型所识别出的是多个可能的垂直领域,并不是一个明确的垂直领域,之后,还需要从这些多个可能的垂直领域中,确认出不完整自然语言问句真正所属的垂直领域,此时,需要再利用上下文进行决策,极端情况下还需要一轮一轮地向用户询问。因此,上述现有的对话意图方案需要结合上下文决策、与用户交互等手段,实现复杂。另外,与用户之间的交互确认,一方面会增加处理时延,另一方面,增加了用户的对话轮数,从而降低了用户体验。
技术实现思路
有鉴于此,本专利技术的主要目的在于提供一种对话交互意图的识别方法和装置,该方法易于实现,且可以提高识别效率和用户体验。为了达到上述目的,本专利技术提出的技术方案为:一种对话交互意图的识别方法,包括:对于首轮对话语句,利用预设的多分类模型,对该轮对话语句所属的垂直领域进行识别;对于除所述首轮对话语句之外的每轮对话语句,利用预设的上一轮对话语句所属垂直领域对应的二分类模型,判断该轮对话语句所属的垂直领域是否是上一轮对话语句所属的垂直领域,如果不是,则利用所述多分类模型,对该轮对话语句所属的垂直领域进行识别;其中,所述二分类模型利用属于相应垂直领域的语料和不属于相应垂直领域的语料训练得到,且所述语料包括不完整语句。较佳地,利用所述多分类模型,对一轮对话语句所属的垂直领域进行识别包括:利用预设的多领域先验知识,识别对话语句所属的垂直领域;如果识别失败,则利用所述多分类模型,识别对话语句所属的垂直领域。较佳地,所述判断该轮对话语句所属的垂直领域是否是上一轮对话语句所属的垂直领域包括:利用所述上一轮对话语句所属垂直领域对应的先验知识,识别该轮对话语句所属的垂直领域,如果识别失败,则利用所述上一轮对话语句所属垂直领域对应的二分类模型,识别该轮对话语句所属的垂直领域是否是上一轮对话语句所属的垂直领域。较佳地,所述多分类模型采用K折交叉验证的方式训练得到。一种对话交互意图的识别设备,包括:处理器,所述处理器用于:对于首轮对话语句,利用预设的多分类模型,对该轮对话语句所属的垂直领域进行识别;对于除所述首轮对话语句之外的每轮对话语句,利用预设的上一轮对话语句所属垂直领域对应的二分类模型,判断该轮对话语句所属的垂直领域是否是上一轮对话语句所属的垂直领域,如果不是,则利用所述多分类模型,对该轮对话语句所属的垂直领域进行识别;其中,所述二分类模型利用属于相应垂直领域的语料和不属于相应垂直领域的语料训练得到,且所述语料包括不完整语句。较佳地,所述处理器,具体用于利用所述多分类模型,对一轮对话语句所属的垂直领域进行识别,包括:利用预设的多领域先验知识,识别对话语句所属的垂直领域;如果识别失败,则利用所述多分类模型,识别对话语句所属的垂直领域。较佳地,所述处理器,具体用于判断该轮对话语句所属的垂直领域是否是上一轮对话语句所属的垂直领域,包括:利用所述上一轮对话语句所属垂直领域对应的先验知识,识别该轮对话语句所属的垂直领域,如果识别失败,则利用所述上一轮对话语句所属垂直领域对应的二分类模型,识别该轮对话语句所属的垂直领域是否是上一轮对话语句所属的垂直领域。较佳地,所述多分类模型采用K折交叉验证的方式训练得到。一种非易失性计算机可读存储介质,所述非易失性计算机可读存储介质存储指令,其特征在于,所述指令在由处理器执行时使得所述处理器执行如上文所述的对话交互意图的识别方法的步骤。一种电子设备,包括如上文所述的非易失性计算机可读存储介质、以及可访问所述非易失性计算机可读存储介质的所述处理器。由上述技术方案可见,本专利技术提出的一种对话交互意图的识别方法和装置,引入了预先训练的一个多分类模型以及各垂直领域的二分类模型,并区分首轮对话语句和非首轮对话语句采用不同的识别方式,对每轮对话语句所属的垂直领域进行识别。对于首轮对话语句,直接利用多分类模型,识别出其所属的垂直领域;而对于首轮对话语句之外的其他各轮对话语句,则需要先采用最近一次识别出的垂直领域的二分类模型,判断该轮对话语句所属的垂直领域是否就是最近一次识别出的垂直领域,如果不是,再通过多分类模型识别出其所属的垂直领域。由于各垂直领域的二分类模型在训练时所采用的语料包含了不完整语句,而在实际对话过程中,不完整语句的垂直领域往往是与上一轮对话语句的垂直领域相同,因此,对于非首轮对话语句,先利用最近一次识别出的垂直领域的二分类模型,判断该轮对话本文档来自技高网
...

【技术保护点】
1.一种对话交互意图的识别方法,其特征在于,包括:/n对于首轮对话语句,利用预设的多分类模型,对该轮对话语句所属的垂直领域进行识别;/n对于除所述首轮对话语句之外的每轮对话语句,利用预设的上一轮对话语句所属垂直领域对应的二分类模型,判断该轮对话语句所属的垂直领域是否是上一轮对话语句所属的垂直领域,如果不是,则利用所述多分类模型,对该轮对话语句所属的垂直领域进行识别;其中,所述二分类模型利用属于相应垂直领域的语料和不属于相应垂直领域的语料训练得到,且所述语料包括不完整语句。/n

【技术特征摘要】
1.一种对话交互意图的识别方法,其特征在于,包括:
对于首轮对话语句,利用预设的多分类模型,对该轮对话语句所属的垂直领域进行识别;
对于除所述首轮对话语句之外的每轮对话语句,利用预设的上一轮对话语句所属垂直领域对应的二分类模型,判断该轮对话语句所属的垂直领域是否是上一轮对话语句所属的垂直领域,如果不是,则利用所述多分类模型,对该轮对话语句所属的垂直领域进行识别;其中,所述二分类模型利用属于相应垂直领域的语料和不属于相应垂直领域的语料训练得到,且所述语料包括不完整语句。


2.根据权利要求1所述的方法,其特征在于,利用所述多分类模型,对一轮对话语句所属的垂直领域进行识别包括:
利用预设的多领域先验知识,识别对话语句所属的垂直领域;如果识别失败,则利用所述多分类模型,识别对话语句所属的垂直领域。


3.根据权利要求1所述的方法,其特征在于,所述判断该轮对话语句所属的垂直领域是否是上一轮对话语句所属的垂直领域包括:
利用所述上一轮对话语句所属垂直领域对应的先验知识,识别该轮对话语句所属的垂直领域,如果识别失败,则利用所述上一轮对话语句所属垂直领域对应的二分类模型,识别该轮对话语句所属的垂直领域是否是上一轮对话语句所属的垂直领域。


4.根据权利要求1所述的方法,其特征在于,所述多分类模型采用K折交叉验证的方式训练得到。


5.一种对话交互意图的识别设备,其特征在于,包括:处理器,所述处理器用于:
对于首轮对话语句,利用预设的多分类模型,对该轮对话语句所属的垂直领域进行识别;
对于除所述首轮对话语句之外的每轮对话语...

【专利技术属性】
技术研发人员:杨志明
申请(专利权)人:深思考人工智能科技上海有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1