人机对话中智能体对话语句的生成方法和装置制造方法及图纸

技术编号:28623254 阅读:60 留言:0更新日期:2021-05-28 16:19
本申请公开了一种人机对话中智能体对话语句的生成方法和装置,其中方法包括:利用预先训练的自然语言理解模型,从当前人机对话的对话历史数据中,提取预设知识库中的属性值和场景类别;其中,所述知识库由知识三元组构成;基于所述属性值和所述场景类别,从所述知识库中筛选出相关的知识三元组,得到候选知识子集;基于所述对话历史数据和所述候选知识子集,利用预先训练的对话生成模型,为智能体生成当前的响应语句并输出。采用本发明专利技术,可以支持多任务场景的人机对话。

【技术实现步骤摘要】
人机对话中智能体对话语句的生成方法和装置
本专利技术涉及人工智能技术,特别是涉及一种人机对话中智能体对话语句的生成方法和装置。
技术介绍
现有的人机对话实现方案通常针对特定场景实现。具体场景可以划分为闲聊、问答、推荐和任务型对话四种。其中,闲聊是指智能体可以与用户进行没有明确目标的聊天;问答是指当用户向智能体提问时,智能体能做出回答;推荐是指智能体可以根据知识库以及与用户的聊天,向用户推荐合适的信息;任务型对话是指智能体可以围绕着某个特定的目标,与用户开展对话,例如帮助用户购买电影票、预定宾馆等。由于不同类型场景的对话目标不同,使得针对某一类场景的人机对话实现方案仅能适应于对应的应用场景,而不适用于其他类型的场景。而在实际生活中,人机对话的应用场景边界并不分明。例如,人们在完成订票任务时,可能会加入一些问候、报错等与任务无关的对话,在聊天情景中,也可能会发起一些特定的服务请求,比如在聊电影话题时,用户可能需要智能体帮助订电影票、查询订单、请求推荐、询问答案等。因此,需要提出一种可服务于多任务场景人机对话方案,以满足上述应用需求。本文档来自技高网...

【技术保护点】
1.一种人机对话中智能体对话语句的生成方法,其特征在于,包括:/n利用预先训练的自然语言理解模型,从当前人机对话的对话历史数据中,提取预设知识库中的属性值和场景类别;其中,所述知识库由知识三元组构成;/n基于所述属性值和所述场景类别,从所述知识库中筛选出相关的知识三元组,得到候选知识子集;/n基于所述对话历史数据和所述候选知识子集,利用预先训练的对话生成模型,为智能体生成当前的响应语句并输出。/n

【技术特征摘要】
1.一种人机对话中智能体对话语句的生成方法,其特征在于,包括:
利用预先训练的自然语言理解模型,从当前人机对话的对话历史数据中,提取预设知识库中的属性值和场景类别;其中,所述知识库由知识三元组构成;
基于所述属性值和所述场景类别,从所述知识库中筛选出相关的知识三元组,得到候选知识子集;
基于所述对话历史数据和所述候选知识子集,利用预先训练的对话生成模型,为智能体生成当前的响应语句并输出。


2.根据权利要求1所述的方法,其特征在于,所述提取预设知识库中的属性值和场景类别包括:
将所述对话历史数据与预设特殊标记拼接后,输入至所述自然语言理解模型的编码器进行编码,得到相应的对话历史向量和场景信息向量;
将所述对话历史向量,输入至所述自然语言理解模型的CRF层进行序列标注,得到所述对话历史数据包含的所述属性值;
将所述场景信息向量,输入至所述自然语言理解模型的多层感知机进行场景分类,得到所述人机对话的场景类别。


3.根据权利要求1所述的方法,其特征在于,所述基于所述属性值和所述场景类别,从所述知识库中筛选出相关的知识三元组,得到候选知识子集包括:
如果所述场景类别为闲聊,则遍历每个所述属性值,从所述知识库中查找包含该属性值的知识三元组,利用查找出的所有知识三元组,构建所述候选知识子集;
如果所述场景类别为问答,则遍历所述对话历史数据中最新一轮对话包含的每个属性值,从所述知识库中查找包含该属性值的知识三元组;利用查找出的所有知识三元组,构建所述候选知识子集;
如果所述场景类别为推荐,则将所述属性值中的所有主键实体值进行两两组合,遍历每种所述组合,确定该组合中的属性值具有的共同属性值,对于每个所述共同属性值,从所述知识库中查找包含该共同属性值的知识三元组;利用查找出的所有知识三元组,构建所述候选知识子集;
如果所述场景类别为任务型对话,则遍历所述属性值中的每个主键实体值,从所述知识库中查找包含该主键实体值且与当前人机对话任务相关的知识三元组,利用查找出的所有知识三元组,构建所述候选知识子集。


4.根据权利要求1所述的方法,其特征在于,所述基于所述对话历史数据和所述候选知识子集,利用预先训练的对话生成模型,为智能体生成当前的响应语句包括:
将所述对话历史数据,输入至所述对话生成模型的对话编码器进行编码处理,得到所述对话历史数据的综合表征向量C和所述对话历史数据包含的所有词的词向量;
将所述候选知识子集,输入至所述对话生成模型的知识编码器进行编码,得到所述候选知识子集的综合表征向量kg和所述候选知识子集中每条知识三元组的向量表示;
基于所述对话历史数据的综合表征向量C、所述候选知识子集的综合表征向量kg、所述词向量和所述知识三元组的向量表示,利用所述对话生成模型的自然语言生成器,生成所述响应语句。


5.根据权利要求4所述的方法,其特征在于,所述将所述对话历史数据,输入至所述对话生成模型的对话编码器进行编码处理包括:
通过在所述对话历史数据中增加每个词所属的对话角色信息和对话轮次信息,对所述对话历史数据进行扩充;
按照对话轮次,对所述扩充后的对话历史数据进行划分;
利用句子级双向门限循环神经网络BiGRU,对所述划分得到的每轮对话数据进行编码,得到每轮对话包含的所有词的词向量;
基于每轮对话包含...

【专利技术属性】
技术研发人员:宇洋袁彩霞王小捷刘咏彬李蕾
申请(专利权)人:北京邮电大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1