人机对话方法、装置、设备及存储介质制造方法及图纸

技术编号:26762705 阅读:43 留言:0更新日期:2020-12-18 23:15
本发明专利技术实施例提供了一种人机对话方法、装置、设备及存储介质,获取待回复的输入数据以及历史对话数据;将所述待回复的输入数据和所述历史对话数据,输入预先训练得到的多语言编码模型,得到所述待回复的输入数据的第一特征和所述历史对话数据的第二特征;其中,所述多语言编码模型为利用样本源语言数据和多语言翻译所述样本源语言数据得到的样本目标语言数据,样本源语言的多轮对话数据以及样本源语言的问答数据,进行多任务训练得到的模型;基于所述第一特征和所述第二特征,获取与所述待回复的输入数据匹配的回复数据。本方案可以提高在低资源语料环境下,跨语言的人机对话的回复准确度。

【技术实现步骤摘要】
人机对话方法、装置、设备及存储介质
本专利技术涉及人机对话
,特别是涉及一种人机对话方法、装置、设备及存储介质。
技术介绍
对话语料库是实现人机对话的重要资源。例如,对话语料库可以作为用于人机对话中输入数据的识别模型的训练样本,还可以作为输出数据的数据库。在具体应用中,可以利用不同的对话语料库实现不同表述语言和对话轮数的人机对话。举例而言,可以利用中文问答语料库实现中文表述、且仅进行一轮问答的人机对话;可以利用英文多轮对话语料库,实现英文表述、且在上一轮问答的基础上,进行下一轮问答的多轮人机对话等等。专利技术人在实现本专利技术的过程中发现,随着用户的多样化和人机对话向自然语言发展的需求,人机对话不再局限于单语言单轮对话,而是以多种语言表述的跨语言多轮对话。例如,某一用户在上一轮对话中询问“推荐一下孙俪的电视剧”,系统给出了相应的回复数据为孙俪的作品,然后用户再次询问“她husband有什么推荐的作品吗”。但是,由于跨语言多轮对话的对话数据收集较为困难,需要花费大量的人力物力,成本相对昂贵,因此,跨语言多轮对话语料库属于低资源语料。对此,如果直接将单语言单轮对话的人机对话用于实现跨语言多轮对话,会仅针对单轮输入数据“她husband有什么推荐的作品吗”检索答案作为回复数据,回复答案无法准确匹配上孙俪丈夫的作品;并且,无法识别“husband”会造成对单轮输入数据“她husband有什么推荐的作品吗”的识别不准确,进一步降低回复数据的准确度。或者,如果直接将单语言多轮对话的人机对话用于实现跨语言多轮对话,会导致无法识别“husband”造成对单轮输入数据“她husband有什么推荐的作品吗”的识别不准确,降低回复数据的准确度。可见,如何实现在低资源语料环境下,跨语言的多轮人机对话的回复准确度,是亟待解决的问题。
技术实现思路
本专利技术实施例的目的在于提供一种人机对话方法、装置、设备及存储介质,以实现提高在低资源语料环境下,跨语言的多轮人机对话的回复准确度的效果。具体技术方案如下:第一方面,本专利技术实施例提供了一种人机对话方法,所述方法包括:获取待回复的输入数据以及历史对话数据;其中,所述历史对话数据为产生所述待回复的输入数据的多轮对话中,对话时间在所述待回复的输入数据之前的对话数据;将所述待回复的输入数据和所述历史对话数据,输入预先训练得到的多语言编码模型,得到所述待回复的输入数据的第一特征和所述历史对话数据的第二特征;其中,所述多语言编码模型为利用样本源语言数据和多语言翻译所述样本源语言数据得到的样本目标语言数据,样本源语言的多轮对话数据以及样本源语言的问答数据,进行多任务训练得到的模型;所述多任务训练包括:用于预测多语言数据翻译结果的任务的训练,用于预测多轮对话数据中回复的任务的训练以及用于预测问答数据中答案的任务的训练;基于所述第一特征和所述第二特征,获取与所述待回复的输入数据匹配的回复数据。第二方面,本专利技术实施例提供了一种人机对话装置,所述装置包括:数据获取模块,用于获取待回复的输入数据以及历史对话数据;其中,所述历史对话数据为产生所述待回复的输入数据的多轮对话中,对话时间在所述待回复的输入数据之前的对话数据;特征获取模块,用于将所述待回复的输入数据和所述历史对话数据,输入预先训练得到的多语言编码模型,得到所述待回复的输入数据的第一特征和所述历史对话数据的第二特征;其中,所述多语言编码模型为利用样本源语言数据和多语言翻译所述样本源语言数据得到的样本目标语言数据,样本源语言的多轮对话数据以及样本源语言的问答数据,进行多任务训练得到的模型;所述多任务训练包括:用于预测多语言数据翻译结果的任务的训练,用于预测多轮对话数据中回复的任务的训练以及用于预测问答数据中答案的任务的训练;回复数据确定模块,用于基于所述第一特征和所述第二特征,获取与所述待回复的输入数据匹配的回复数据。第三方面,本专利技术实施例提供了一种电子设备,该设备包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;存储器,用于存放计算机程序;处理器,用于执行存储器上所存放的程序时,实现上述第一方面提供的人机对话方法的步骤。第四方面,本专利技术实施例提供了一种计算机可读存储介质,计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面提供的人机对话方法的步骤。本专利技术实施例有益效果:本专利技术实施例提供的方案中,多任务训练包括:用于预测跨语言数据翻译结果的任务的训练,用于预测多轮对话数据中回复的任务的训练以及用于预测问答数据中答案的任务的训练;并且,多轮对话数据可以看作相互关联的多个问答数据。因此,利用多任务训练得到的多语言编码模型能够在低资源语料环境下,对跨语言的多轮对话进行特征提取,并在识别输入数据本身的同时,综合历史对话数据对待回复的输入数据的影响,从而保证本专利技术确定的回复数据与针对单轮输入数据检索答案得到的回复数据相比,相对而言更加符合输入数据的真实语义。因此,本方案通过对跨语言的人机对话场景中输入数据和历史对话数据的识别,可以提高在低资源语料环境下,跨语言的人机对话的回复准确度。当然,实施本专利技术的任一产品或方法并不一定需要同时达到以上所述的所有优点。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术一实施例提供的人机对话方法的流程示意图;图2为本专利技术另一实施例提供的人机对话方法的离线阶段到在线阶段的流程示例图;图3为本专利技术一实施例提供的人机对话装置的结构示意图;图4为本专利技术另一实施例提供的人机对话装置的结构示意图;图5为本专利技术一实施例提供的电子设备的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。首先对本专利技术一实施例的人机对话方法进行介绍。本专利技术实施例提供的人机对话方法,可以应用于能够进行人机交互的电子设备,该电子设备具体可以包括台式计算机、便携式计算机、互联网电视,智能移动终端、可穿戴式智能终端以及服务器等,在此不作限定,任何可以实现本专利技术实施例的电子设备,均属于本专利技术实施例的保护范围。如图1所示,本专利技术一实施例提供的人机对话方法的流程,该流程可以包括以下步骤:S101,获取待回复的输入数据以及历史对话数据。其中,历史对话数据为产生待回复的输入数据的多轮对话中,对话时间在待回复的输入数据之前的对话数据。...

【技术保护点】
1.一种人机对话方法,其特征在于,所述方法包括:/n获取待回复的输入数据以及历史对话数据;其中,所述历史对话数据为产生所述待回复的输入数据的多轮对话中,对话时间在所述待回复的输入数据之前的对话数据;/n将所述待回复的输入数据和所述历史对话数据,输入预先训练得到的多语言编码模型,得到所述待回复的输入数据的第一特征和所述历史对话数据的第二特征;其中,所述多语言编码模型为利用样本源语言数据和多语言翻译所述样本源语言数据得到的样本目标语言数据,样本源语言的多轮对话数据以及样本源语言的问答数据,进行多任务训练得到的模型;所述多任务训练包括:用于预测多语言数据翻译结果的任务的训练,用于预测多轮对话数据中回复的任务的训练以及用于预测问答数据中答案的任务的训练;/n基于所述第一特征和所述第二特征,获取与所述待回复的输入数据匹配的回复数据。/n

【技术特征摘要】
1.一种人机对话方法,其特征在于,所述方法包括:
获取待回复的输入数据以及历史对话数据;其中,所述历史对话数据为产生所述待回复的输入数据的多轮对话中,对话时间在所述待回复的输入数据之前的对话数据;
将所述待回复的输入数据和所述历史对话数据,输入预先训练得到的多语言编码模型,得到所述待回复的输入数据的第一特征和所述历史对话数据的第二特征;其中,所述多语言编码模型为利用样本源语言数据和多语言翻译所述样本源语言数据得到的样本目标语言数据,样本源语言的多轮对话数据以及样本源语言的问答数据,进行多任务训练得到的模型;所述多任务训练包括:用于预测多语言数据翻译结果的任务的训练,用于预测多轮对话数据中回复的任务的训练以及用于预测问答数据中答案的任务的训练;
基于所述第一特征和所述第二特征,获取与所述待回复的输入数据匹配的回复数据。


2.根据权利要求1所述的方法,其特征在于,所述基于所述第一特征和所述第二特征,获取与所述待回复的输入数据匹配的回复数据,包括:
从预先建立的问答数据库中,查找与所述第一特征之间的相似度满足第一相似度条件的问答数据,作为所述待回复的输入数据的问答数据,以及查找与所述第二特征匹配的问答数据,作为所述历史对话数据的问答数据;
利用所述待回复的输入数据的问答数据和所述历史对话数据的问答数据,获取所述多轮对话的语义数据;其中,所述多轮对话的语义数据用于表明在所述历史对话数据的语义下,所述待回复的输入数据的语义;
获取符合所述待回复的输入数据的语义的回复数据,作为与所述待回复的输入数据匹配的回复数据。


3.根据权利要求2所述的方法,其特征在于,所述利用所述待回复的输入数据的问答数据和所述历史对话数据的问答数据,获取所述多轮对话的语义数据,包括:
将所述待回复的输入数据的问答数据和所述历史对话数据的问答数据输入所述多语言编码模型,得到所述待回复的输入数据的问答数据的特征和所述历史对话数据的问答数据的特征,并将所得到的对应的问答数据的特征作为所述多轮对话的语义数据;
所述获取符合所述待回复的输入数据的语义的回复数据,作为与所述待回复的输入数据匹配的回复数据,包括:
从预先建立的多轮对话数据库中,查找与所述多轮对话的语义数据的相似度满足第二相似度条件的对话,并将所查找的对话中的回复数据,作为候选回复数据;
针对每个候选回复数据,将该候选回复数据输入预先训练得到的多轮对话回复评价模型,得到该候选回复数据的评分;其中,任一候选回复数据的评分用于表明在所述历史对话数据的语义下,该候选回复数据与所述待回复的输入数据之间的匹配度;
从得到的多个候选回复数据中,选择所述评分满足预设的评分条件的候选回复数据,作为与所述待回复的输入数据匹配的回复数据。


4.根据权利要求3所述的方法,其特征在于,所述多轮对话回复评价模型为利用多个样本多轮对话数据、每个样本多轮对话数据的背景知识以及每个样本多轮对话数据中样本输入数据的样本回复数据训练得到的模型;
其中,所述样本多轮对话数据的背景知识为关于描述该样本多轮对话中实体的信息,且与该样本多轮对话数据中描述该实体的信息不同。


5.根据权利要求3所述的方法,其特征在于,在所述从得到的多个候选回复数据中,选择所述评分满足预设的评分条件的候选回复数据,作为与所述待回复的输入数据匹配的回复数据之前,所述方法还包括:
获取所述历史对话数据的背景知识;其中,所述历史对话数据的背景知识为关于描述该历史对话数据中实体的信息,且与该历史对话数据中描述该实体的信息不同;
基于所述待回复的输入数据、所述历史对话数据以及所述历史对话数据的背景知识,获取第二多轮对话语义数据;
所述从得到的多个候选回复数据中,选择所述评分满足预设的评分条件的候选回复数据,作为与所述待回复的输入数据匹配的回复数据,包括:
从得到的多个候选回复数据中,选择所述评分满足预设的评分条件的候选回复数据,作为与所述待回复的输入数据匹配的第一回复数据;
将所述第二多轮对话语义数据,输入预先训练得到的回复生成模型,得到针对所述第二多轮对话语...

【专利技术属性】
技术研发人员:符文君
申请(专利权)人:北京奇艺世纪科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1