【技术实现步骤摘要】
人机对话方法、装置、设备及存储介质
本专利技术涉及人机对话
,特别是涉及一种人机对话方法、装置、设备及存储介质。
技术介绍
对话语料库是实现人机对话的重要资源。例如,对话语料库可以作为用于人机对话中输入数据的识别模型的训练样本,还可以作为输出数据的数据库。在具体应用中,可以利用不同的对话语料库实现不同表述语言和对话轮数的人机对话。举例而言,可以利用中文问答语料库实现中文表述、且仅进行一轮问答的人机对话;可以利用英文多轮对话语料库,实现英文表述、且在上一轮问答的基础上,进行下一轮问答的多轮人机对话等等。专利技术人在实现本专利技术的过程中发现,随着用户的多样化和人机对话向自然语言发展的需求,人机对话不再局限于单语言单轮对话,而是以多种语言表述的跨语言多轮对话。例如,某一用户在上一轮对话中询问“推荐一下孙俪的电视剧”,系统给出了相应的回复数据为孙俪的作品,然后用户再次询问“她husband有什么推荐的作品吗”。但是,由于跨语言多轮对话的对话数据收集较为困难,需要花费大量的人力物力,成本相对昂贵,因此,跨语言多轮对话语料库属于低资源语料。对此,如果直接将单语言单轮对话的人机对话用于实现跨语言多轮对话,会仅针对单轮输入数据“她husband有什么推荐的作品吗”检索答案作为回复数据,回复答案无法准确匹配上孙俪丈夫的作品;并且,无法识别“husband”会造成对单轮输入数据“她husband有什么推荐的作品吗”的识别不准确,进一步降低回复数据的准确度。或者,如果直接将单语言多轮对话的人机对话用于实现跨语言多轮
【技术保护点】
1.一种人机对话方法,其特征在于,所述方法包括:/n获取待回复的输入数据以及历史对话数据;其中,所述历史对话数据为产生所述待回复的输入数据的多轮对话中,对话时间在所述待回复的输入数据之前的对话数据;/n将所述待回复的输入数据和所述历史对话数据,输入预先训练得到的多语言编码模型,得到所述待回复的输入数据的第一特征和所述历史对话数据的第二特征;其中,所述多语言编码模型为利用样本源语言数据和多语言翻译所述样本源语言数据得到的样本目标语言数据,样本源语言的多轮对话数据以及样本源语言的问答数据,进行多任务训练得到的模型;所述多任务训练包括:用于预测多语言数据翻译结果的任务的训练,用于预测多轮对话数据中回复的任务的训练以及用于预测问答数据中答案的任务的训练;/n基于所述第一特征和所述第二特征,获取与所述待回复的输入数据匹配的回复数据。/n
【技术特征摘要】
1.一种人机对话方法,其特征在于,所述方法包括:
获取待回复的输入数据以及历史对话数据;其中,所述历史对话数据为产生所述待回复的输入数据的多轮对话中,对话时间在所述待回复的输入数据之前的对话数据;
将所述待回复的输入数据和所述历史对话数据,输入预先训练得到的多语言编码模型,得到所述待回复的输入数据的第一特征和所述历史对话数据的第二特征;其中,所述多语言编码模型为利用样本源语言数据和多语言翻译所述样本源语言数据得到的样本目标语言数据,样本源语言的多轮对话数据以及样本源语言的问答数据,进行多任务训练得到的模型;所述多任务训练包括:用于预测多语言数据翻译结果的任务的训练,用于预测多轮对话数据中回复的任务的训练以及用于预测问答数据中答案的任务的训练;
基于所述第一特征和所述第二特征,获取与所述待回复的输入数据匹配的回复数据。
2.根据权利要求1所述的方法,其特征在于,所述基于所述第一特征和所述第二特征,获取与所述待回复的输入数据匹配的回复数据,包括:
从预先建立的问答数据库中,查找与所述第一特征之间的相似度满足第一相似度条件的问答数据,作为所述待回复的输入数据的问答数据,以及查找与所述第二特征匹配的问答数据,作为所述历史对话数据的问答数据;
利用所述待回复的输入数据的问答数据和所述历史对话数据的问答数据,获取所述多轮对话的语义数据;其中,所述多轮对话的语义数据用于表明在所述历史对话数据的语义下,所述待回复的输入数据的语义;
获取符合所述待回复的输入数据的语义的回复数据,作为与所述待回复的输入数据匹配的回复数据。
3.根据权利要求2所述的方法,其特征在于,所述利用所述待回复的输入数据的问答数据和所述历史对话数据的问答数据,获取所述多轮对话的语义数据,包括:
将所述待回复的输入数据的问答数据和所述历史对话数据的问答数据输入所述多语言编码模型,得到所述待回复的输入数据的问答数据的特征和所述历史对话数据的问答数据的特征,并将所得到的对应的问答数据的特征作为所述多轮对话的语义数据;
所述获取符合所述待回复的输入数据的语义的回复数据,作为与所述待回复的输入数据匹配的回复数据,包括:
从预先建立的多轮对话数据库中,查找与所述多轮对话的语义数据的相似度满足第二相似度条件的对话,并将所查找的对话中的回复数据,作为候选回复数据;
针对每个候选回复数据,将该候选回复数据输入预先训练得到的多轮对话回复评价模型,得到该候选回复数据的评分;其中,任一候选回复数据的评分用于表明在所述历史对话数据的语义下,该候选回复数据与所述待回复的输入数据之间的匹配度;
从得到的多个候选回复数据中,选择所述评分满足预设的评分条件的候选回复数据,作为与所述待回复的输入数据匹配的回复数据。
4.根据权利要求3所述的方法,其特征在于,所述多轮对话回复评价模型为利用多个样本多轮对话数据、每个样本多轮对话数据的背景知识以及每个样本多轮对话数据中样本输入数据的样本回复数据训练得到的模型;
其中,所述样本多轮对话数据的背景知识为关于描述该样本多轮对话中实体的信息,且与该样本多轮对话数据中描述该实体的信息不同。
5.根据权利要求3所述的方法,其特征在于,在所述从得到的多个候选回复数据中,选择所述评分满足预设的评分条件的候选回复数据,作为与所述待回复的输入数据匹配的回复数据之前,所述方法还包括:
获取所述历史对话数据的背景知识;其中,所述历史对话数据的背景知识为关于描述该历史对话数据中实体的信息,且与该历史对话数据中描述该实体的信息不同;
基于所述待回复的输入数据、所述历史对话数据以及所述历史对话数据的背景知识,获取第二多轮对话语义数据;
所述从得到的多个候选回复数据中,选择所述评分满足预设的评分条件的候选回复数据,作为与所述待回复的输入数据匹配的回复数据,包括:
从得到的多个候选回复数据中,选择所述评分满足预设的评分条件的候选回复数据,作为与所述待回复的输入数据匹配的第一回复数据;
将所述第二多轮对话语义数据,输入预先训练得到的回复生成模型,得到针对所述第二多轮对话语...
【专利技术属性】
技术研发人员:符文君,
申请(专利权)人:北京奇艺世纪科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。