模型训练和文本生成方法、装置、电子设备和存储介质制造方法及图纸

技术编号:37268560 阅读:18 留言:0更新日期:2023-04-20 23:39
本发明专利技术实施例提供了一种模型训练和文本生成方法、装置、电子设备和存储介质。所述模型训练方法包括:获取对话任务的提示数据、用户数据、以及训练监督条件;至少组合所述提示数据和所述用户数据,得到所述对话任务的训练数据;基于所述训练数据作为所述对话任务的上下文融合层的输入,并且基于所述对话训练监督条件作为通用文本生成层的输出,训练所述对话任务的文本生成模型,其中,所述上下文融合层的输出与所述通用文本生成层的输入连接。本发明专利技术实施例的方案提高了训练数据的个性化和针对性,并且使训练后的文本生成模型能够针对对话任务进行推理,提高了文本生成的准确性。提高了文本生成的准确性。提高了文本生成的准确性。

【技术实现步骤摘要】
模型训练和文本生成方法、装置、电子设备和存储介质


[0001]本专利技术实施例涉及计算机
,尤其涉及一种模型训练和文本生成方法、装置、电子设备和存储介质。

技术介绍

[0002]对话推荐系统(Conversational Recommender System,CRS)能够在与用户的对话过程中,实现了诸如商品的推荐对象的推荐过程。传统的对话推荐任务往往先通过一些规则或模型判定用户需求,然后基于用户的对话信息分析用户偏好,进而向用户推荐诸如商品的推荐对象。
[0003]目前的对话推荐系统的对话引导及推荐的准确度仍有提高的空间。

技术实现思路

[0004]有鉴于此,本专利技术实施例提供一种模型训练和文本生成方法、装置、电子设备和存储介质,以至少部分解决上述问题。
[0005]根据本专利技术实施例的第一方面,提供了一种模型训练方法,包括:获取对话任务的提示数据、用户数据、以及训练监督条件;至少组合所述提示数据和所述用户数据,得到所述对话任务的训练数据;基于所述训练数据作为所述对话任务的上下文融合层的输入,并且基于所本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法,包括:获取对话任务的提示数据、用户数据、以及训练监督条件;至少组合所述提示数据和所述用户数据,得到所述对话任务的训练数据;基于所述训练数据作为所述对话任务的上下文融合层的输入,并且基于所述对话训练监督条件作为通用文本生成层的输出,训练所述对话任务的文本生成模型,其中,所述上下文融合层的输出与所述通用文本生成层的输入连接。2.根据权利要求1所述的方法,其中,所述方法还包括:获取用户画像数据和知识图谱数据;基于所述知识图谱数据对所述用户画像数据进行增强处理,得到所述用户数据。3.根据权利要求2所述的方法,其中,所述基于所述知识图谱数据对所述用户画像数据进行增强处理,得到所述用户数据,包括:确定所述知识图谱数据的实体表征矩阵、所述用户画像数据的第一表征矩阵、以及所述知识图谱数据与所述用户画像数据之间的第一转移矩阵;基于所述实体表征矩阵、所述第一表征矩阵以及所述第一转移矩阵之间的乘积,确定所述实体表征矩阵的第一相似矩阵;基于所述实体表征矩阵与所述第一相似矩阵的乘积与所述第一表征矩阵之间的和,确定增强用户画像数据,其中,所述用户数据至少包括所述增强用户画像数据。4.根据权利要求1所述的方法,其中,所述方法还包括:获取用户对话数据和知识图谱数据;基于所述知识图谱数据对所述用户对话数据进行增强处理,得到所述用户数据。5.根据权利要求4所述的方法,其中,所述用户对话数据包括当前对话数据和历史对话数据;所述基于所述知识图谱数据对所述用户对话数据进行增强处理,得到所述用户数据,包括:基于所述知识图谱数据对所述当前对话数据和所述历史对话数据分别进行增强处理,得到当前增强对话数据和历史增强对话数据;基于近因效应因子,对所述当前增强对话数据和所述历史增强对话数据进行处理,得到增强对话数据,所述用户数据至少包括所述增强对话数据。6.根据权利要求5所述的方法,其中,所述基于所述知识图谱数据对所述用户对话数据进行增强处理,得到所述用户数据,还包括:确定所述知识图谱数据在所述增强对话数据下的增强知识图谱数据;基于所述增强知识图谱数据和所述增强对话数据,确定所述用户数据。7.根据权利要求5所述的方法,其中,所述基于所述知识图谱数据对所述当前对话数据和所述历史对话数据分别进行增强处理,得到当前增强对话数据和历史增强对话数据,包括:确定所述知识图谱数据的实体表征矩阵、所述当前对话数据的第二表征矩阵、以及所述知识图谱数据与所述当前...

【专利技术属性】
技术研发人员:冯帆
申请(专利权)人:阿里巴巴中国有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1