多轮对话的检索方法、装置、存储介质及电子设备制造方法及图纸

技术编号:26418575 阅读:24 留言:0更新日期:2020-11-20 14:13
本申请公开了多轮对话的检索方法、装置、存储介质及电子设备,涉及人工智能、自然语言处理、深度学习技术领域。具体实现方案为:获取当前问题信息,并获取当前问题信息的上下文信息;获取当前问题信息的多个候选回复信息;根据上下文信息生成上下文特征,并根据多个候选回复信息生成多个候选回复特征;分别计算上下文特征与多个候选回复特征之间的一致性信息;根据上下文特征与多个候选回复特征之间的一致性信息从多个候选回复信息之中选择一个候选回复信息进行回复。能够有效提升回复信息与当前问题信息的匹配程度,提升多轮对话的对话效果,从而提升用户的对话体验度。

【技术实现步骤摘要】
多轮对话的检索方法、装置、存储介质及电子设备
本申请涉及计算机
,具体涉及人工智能、自然语言处理、深度学习
,尤其涉及多轮对话的检索方法、装置、存储介质及电子设备。
技术介绍
问答系统(QuestionAnsweringSystem,QA)是目前人工智能和自然语言处理
中的一个倍受关注并具有广泛发展前景的研究方向,且当今各各大互联网公司都在争相研发问答机器人、智能客服等问答系统,特别是在医疗,教育等行业,智能的问答系统起着至关重要的作用。
技术实现思路
提供了一种多轮对话的检索方法、装置、存储介质及电子设备,能够有效提升回复信息与当前问题信息的匹配程度,提升多轮对话的对话效果,从而提升用户的对话体验度。根据第一方面,提供了一种多轮对话的检索方法,包括:获取当前问题信息,并获取所述当前问题信息的上下文信息;获取所述当前问题信息的多个候选回复信息;根据所述上下文信息生成上下文特征,并根据所述多个候选回复信息生成多个候选回复特征;分别计算所述上下文特征与所述多个候选回复特征之间的一致性信息;根据所述上下文特征与所述多个候选回复特征之间的一致性信息从所述多个候选回复信息之中选择一个候选回复信息进行回复。根据第二方面,提供了一种多轮对话的检索装置,包括:第一获取模块,用于获取当前问题信息,并获取所述当前问题信息的上下文信息;第二获取模块,用于获取所述当前问题信息的多个候选回复信息;生成模块,用于根据所述上下文信息生成上下文特征,并根据所述多个候选回复信息生成多个候选回复特征;计算模块,用于分别计算所述上下文特征与所述多个候选回复特征之间的一致性信息;回复模块,用于根据所述上下文特征与所述多个候选回复特征之间的一致性信息从所述多个候选回复信息之中选择一个候选回复信息进行回复。根据第三方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本申请实施例的多轮对话的检索方法。根据第四方面,提出了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行本申请实施例公开的多轮对话的检索方法。根据本申请的技术能够提升多轮对话的对话效果。应当理解,本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征,也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。附图说明附图用于更好地理解本方案,不构成对本申请的限定。其中:图1是根据本申请第一实施例的示意图;图2是根据本申请第二实施例的示意图;图3为本申请实施例的应用效果示意图;图4是根据本申请第三实施例的示意图;图5为本申请实施例的建模场景示意图;图6是根据本申请第四实施例的示意图;图7是根据本申请第五实施例的示意图;图8用来实现本申请实施例的多轮对话的检索方法的电子设备的框图。具体实施方式以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。图1是根据本申请第一实施例的示意图。其中,需要说明的是,本实施例的多轮对话的检索方法的执行主体为多轮对话的检索装置,该装置可以由软件和/或硬件的方式实现,该装置可以配置在电子设备中,电子设备可以包括但不限于终端、服务器端等。本申请实施例涉及人工智能
、自然语言处理
、深度学习
,其中,人工智能(ArtificialIntelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。深度学习是学习样本数据的内在规律和表示层次,这些学习过程中获得的信息对诸如文字,图像和声音等数据的解释有很大的帮助。深度学习的最终目标是让机器能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据。自然语言处理,能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。深度学习是学习样本数据的内在规律和表示层次,这些学习过程中获得的信息对诸如文字,图像和声音等数据的解释有很大的帮助。深度学习的最终目标是让机器能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据。如图1所示,该多轮对话的检索方法包括:S101:获取当前问题信息,并获取当前问题信息的上下文信息。其中,用户当前输入的问题,可以被称为当前问题,当前问题信息可以例如为当前问题的内容,也即是说,在多轮对话过程中,可以识别用户输入的当前问题信息,并在获取当前问题信息的同时,获取当前问题信息的上下文信息,该上下文信息具体可以例如为,当前问题的上下文的文本内容等,对此不作限制。假设多轮对话可以表示为U={u1,u2,…,un},则其中的un即可以被称为当前问题,而un包含的内容、特征等,则可以被称为当前问题信息,u1,u2,…,包含的内容、特征等,则可以被称为上下文信息。S102:获取当前问题信息的多个候选回复信息。上述在获取当前问题信息,并获取当前问题信息的上下文信息后,可以从对话知识库内获取当前问题信息的多个候选回复信息,其中的对话知识库可以是外部知识库,也即是说,该外部知识库接入了多轮对话的检索装置的本地知识库,从而使得在确定回复信息时,可以参考外部知识库提供的内容。例如,多个候选回复可以表示为R={r1,r2,…,rm}为候选回复的列表,Y={y1,y2,…,ym}为相应的二分类标签,其中yi=1表示ri是正确回复,否则yi=0,候选回复R={r1,r2,…,rm}相关的一些内容、特征等,可以被称为候选回复信息。S103:根据上下文信息生成上下文特征,并根据多个候选回复信息生成多个候选回复特征。上述在获取当前问题信息的多个候选回复信息后,还根据上下文信息生成上下文特征,并根据多个候选回复信息生成多个候选回复特征,其中,上下文特征用于描述上下文信息之间的特征情况,而候选回复特征,用于描述相应的候选回复信息的特征情况,该上下文特征和候选回复特征,被用于后续确定出最相适配的候选回复。一些实施例中,可以对上下文信息进行特征识别,从而将识别到的特征作为上下文特征,以及对各个候选回复信息进行特征识别,从而将识别到的特征作为候选回复特征。而本申请实施例中,在保障候选回复与当前问题的适配性的同时,还为了提升特征匹配的效率,当上下文信息为多个时,还可以将多个上下文信息进行拼接以形成上下文聚合信息,并根据上下文聚合信息生成上下文特征,也即是说,若上下文信息为多个,每个上下文信息对应一条上下文语句,则本申请实施例可以对多个上下文信息进行聚合,从而压本文档来自技高网
...

【技术保护点】
1.一种多轮对话的检索方法,其中,包括:/n获取当前问题信息,并获取所述当前问题信息的上下文信息;/n获取所述当前问题信息的多个候选回复信息;/n根据所述上下文信息生成上下文特征,并根据所述多个候选回复信息生成多个候选回复特征;/n分别计算所述上下文特征与所述多个候选回复特征之间的一致性信息;/n根据所述上下文特征与所述多个候选回复特征之间的一致性信息从所述多个候选回复信息之中选择一个候选回复信息进行回复。/n

【技术特征摘要】
1.一种多轮对话的检索方法,其中,包括:
获取当前问题信息,并获取所述当前问题信息的上下文信息;
获取所述当前问题信息的多个候选回复信息;
根据所述上下文信息生成上下文特征,并根据所述多个候选回复信息生成多个候选回复特征;
分别计算所述上下文特征与所述多个候选回复特征之间的一致性信息;
根据所述上下文特征与所述多个候选回复特征之间的一致性信息从所述多个候选回复信息之中选择一个候选回复信息进行回复。


2.如权利要求1所述的多轮对话的检索方法,其中,所述分别计算所述上下文特征与所述多个候选回复特征之间的一致性信息,包括:
将所述上下文特征和所述多个候选回复特征输入一致性匹配模型,以生成所述上下文特征与所述多个候选回复特征之间的一致性信息;所述一致性匹配模型是采用外部的对话知识库训练得到的。


3.如权利要求2所述的多轮对话的检索方法,其中,所述一致性匹配模型通过以下步骤训练得到:
获取对话知识库;
根据样本候选回复信息从所述对话知识库之中选择多个样本问题答案对,其中,所述样本问题答案对包括样本上下文信息和样本回复信息;
根据所述样本回复信息和所述样本候选回复信息生成目标一致性信息;
将所述样本上下文信息和所述样本候选回复信息输入至所述一致性匹配模型以生成预测一致性信息;
根据所述预测一致性信息和所述目标一致性信息对所述一致性匹配模型进行训练。


4.如权利要求1所述的多轮对话的检索方法,其中,所述上下文信息为多个,所述根据所述上下文信息生成上下文特征,包括:
将所述多个上下文信息进行拼接以形成上下文聚合信息;
根据所述上下文聚合信息生成所述上下文特征。


5.如权利要求4所述的多轮对话的检索方法,其中,所述根据所述上下文聚合信息生成所述上下文特征,包括:
确定与各所述上下文信息对应的编码特征和权重;
基于所述权重对多个所述编码特征进行聚合,从而得到所述上下文特征。


6.如权利要求4所述的多轮对话的检索方法,其中,所述根据所述上下文聚合信息生成所述上下文特征,包括:
确定所述多个上下文信息之间的交叉特征,并将所述交叉特征作为所述上下文特征。


7.一种多轮对话的检索装置,其中,包括:
第一获取模块,用于获取当前问题信息,并获取所述当前问题信息的上下文信息;
第二获取模块,用于获取所述当前问题信息的多...

【专利技术属性】
技术研发人员:余晓峰林熙耀韩友郑立涛
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1