问答模型及应答语句的生成方法、装置、介质和电子设备制造方法及图纸

技术编号:22055226 阅读:36 留言:0更新日期:2019-09-07 15:14
本发明专利技术的实施例提供了一种问答模型及应答语句的生成方法、装置、介质和电子设备。该问答模型的生成方法包括:获取问题数据和所述问题数据对应的应答数据;确定所述问题数据所包含的关键词及所述问题数据所属的领域;根据所述关键词和所述领域,获取所述问题数据的相关资料数据;基于所述问题数据、所述相关资料数据和所述应答数据生成训练样本,并基于所述训练样本对模型文件进行训练,以生成问答模型。本发明专利技术实施例的技术方案使得在训练模型文件时能够考虑到问题数据的相关资料数据,进而可以确保训练得到的问答模型能够融合大量的相关资料数据来生成应答语句,保证得到更加全面及准确的应答语句,有效提高了问答模型生成的应答语句的质量。

Question Answer Model and Generation Method, Device, Media and Electronic Equipment of Answer Statement

【技术实现步骤摘要】
问答模型及应答语句的生成方法、装置、介质和电子设备
本专利技术涉及计算机及通信
,具体而言,涉及一种问答模型及应答语句的生成方法、装置、介质和电子设备。
技术介绍
在车载语音系统、智能音箱、智能客服、儿童陪伴机器人等产品的使用场景中,最常出现的就是用户对某一问题的询问,对于这种应用场景,如何能够得到高质量的应答语句是亟待解决的技术问题。
技术实现思路
本专利技术的实施例提供了一种问答模型及应答语句的生成方法、装置、介质和电子设备,进而至少在一定程度上可以有效提高问答模型生成的应答语句的质量。本专利技术的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本专利技术的实践而习得。根据本专利技术实施例的一个方面,提供了一种问答模型的生成方法,包括:获取问题数据和所述问题数据对应的应答数据;确定所述问题数据所包含的关键词及所述问题数据所属的领域;根据所述关键词和所述领域,获取所述问题数据的相关资料数据;基于所述问题数据、所述相关资料数据和所述应答数据生成训练样本,并基于所述训练样本对模型文件进行训练,以生成问答模型。根据本专利技术实施例的一个方面,提供了一种应答语句的生成方法,包括:本文档来自技高网...

【技术保护点】
1.一种问答模型的生成方法,其特征在于,包括:获取问题数据和所述问题数据对应的应答数据;确定所述问题数据所包含的关键词及所述问题数据所属的领域;根据所述关键词和所述领域,获取所述问题数据的相关资料数据;基于所述问题数据、所述相关资料数据和所述应答数据生成训练样本,并基于所述训练样本对模型文件进行训练,以生成问答模型。

【技术特征摘要】
1.一种问答模型的生成方法,其特征在于,包括:获取问题数据和所述问题数据对应的应答数据;确定所述问题数据所包含的关键词及所述问题数据所属的领域;根据所述关键词和所述领域,获取所述问题数据的相关资料数据;基于所述问题数据、所述相关资料数据和所述应答数据生成训练样本,并基于所述训练样本对模型文件进行训练,以生成问答模型。2.根据权利要求1所述的问答模型的生成方法,其特征在于,确定所述问题数据所包含的关键词及所述问题数据所属的领域,包括:通过关键词提取模型提取所述问题数据所包含的关键词,并通过问题分类模型确定所述问题数据所属的领域。3.根据权利要求2所述的问答模型的生成方法,其特征在于,在通过关键词提取模型提取所述问题数据所包含的关键词之前,还包括:提取已有的各个问题语句中的关键词,并基于所述各个问题语句及提取出的关键词生成第一样本数据;通过所述第一样本数据对第一机器学习模型进行训练,以得到所述关键词提取模型。4.根据权利要求2所述的问答模型的生成方法,其特征在于,在通过问题分类模型确定所述问题数据所属的领域之前,还包括:确定已有的各个问题语句所属的领域,并基于所述各个问题语句及其所属的领域生成第二样本数据;通过所述第二样本数据对第二机器学习模型进行训练,以得到所述问题分类模型。5.根据权利要求1至4中任一项所述的问答模型的生成方法,其特征在于,根据所述关键词和所述领域,获取所述问题数据的相关资料数据,包括:在属于所述领域的资料数据中检索与所述关键词相关的资料数据,并将检索到的资料数据作为所述问题数据的相关资料数据。6.一种应答语句的生成方法,其特征在于,包括:根据待处理的问题语句,确定所述问题语句所包含的关键词及所述问题语句所属的领域;根据所述问题语句所包含的关键词及所述问题语句所属的领域,获取所述问题语句的相关资料数据;基于所述问题语句和所述相关资料数据,通过问答模型生成所述问题语句对应的应答语句。7.根据权利要求6所述的应答语句的生成方法,其特征在于,根据待处理的问题语句,确定所述问题语句所包含的关键词及所述问题语句所属的领域,包括:通过关键词提取模型提取所述待处理的问题语句所包含的关键词,并通过问题分类模型确定所述待处理的问题语句所属的领域。8.根据权利要求6所述的应答语句的生成方法,其特征在于,根据所述问题语句所包含的关键词及所述问题语句所属的领域,获取所述问题语句的相关资...

【专利技术属性】
技术研发人员:缪畅宇
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1