System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 个性化对话方法及相关装置、设备和存储介质制造方法及图纸_技高网

个性化对话方法及相关装置、设备和存储介质制造方法及图纸

技术编号:41205486 阅读:7 留言:0更新日期:2024-05-07 22:31
本申请公开了一种个性化对话方法及相关装置、设备和存储介质,其中,个性化对话方法包括:获取第一会话;基于模拟目标对象的个性化对话模型对第一会话进行回复,得到第二会话;其中,个性化对话模型基于目标对象的样本个性化对话数据采用强化学习对第一对话模型进行参数微调得到,第一对话模型为第二对话模型至少基于与预设生成式模型分别处理样本个性化对话数据之后的输出差异进行参数微调得到,第二对话模型基于样本通用对话数据对预设生成式模型进行参数微调得到。上述方案,能够实现个性化会话。

【技术实现步骤摘要】

本申请涉及人工智能,特别是涉及一种个性化对话方法及相关装置、设备和存储介质


技术介绍

1、随着生成式模型的不断发展,很多领域开始开展针对其相关应用场景的研究,而角色扮演就是其中一个较为新颖的应用领域。

2、但是,现有的生成式模型通常只具备通用理解能力,但很难模拟个性化角色进行会话,从而在很多要辅助进行个性化会话的场景下并不能满足应用需求。有鉴于此,如何实现个性化会话成为亟待解决的问题。


技术实现思路

1、本申请主要解决的技术问题是提供一种个性化对话方法及相关装置、设备和存储介质,能够实现个性化会话。

2、为了解决上述技术问题,本申请第一方面提供了一种个性化对话方法,包括:获取第一会话;基于模拟目标对象的个性化对话模型对第一会话进行回复,得到第二会话;其中,个性化对话模型基于目标对象的样本个性化对话数据采用强化学习对第一对话模型进行参数微调得到,第一对话模型为第二对话模型至少基于与预设生成式模型分别处理样本个性化对话数据之后的输出差异进行参数微调得到,第二对话模型基于样本通用对话数据对预设生成式模型进行参数微调得到。

3、为了解决上述技术问题,本申请第二方面提供了一种个性化对话装置,包括:会话模块和回复模块,会话模块,用于获取第一会话;回复模块,用于基于个性化对话模型对第一会话进行回复,得到第二会话;其中,个性化对话模型基于样本个性化对话数据采用强化学习对第一对话模型进行参数微调得到,第一对话模型为第二对话模型至少基于与预设生成式模型分别处理样本个性化对话数据之后的输出差异进行参数微调得到,第二对话模型基于样本通用对话数据对预设生成式模型进行参数微调得到。

4、为了解决上述技术问题,本申请第三方面提供了一种电子设备,包括相互耦接的存储器和处理器,存储器中存储有程序指令,处理器用于执行程序指令以实现上述第一方面中的个性化对话方法。

5、为了解决上述技术问题,本申请第四方面提供了一种计算机可读存储介质,存储有能够被处理器运行的程序指令,程序指令用于实现上述第一方面的个性化对话方法。

6、上述方案,获取第一会话,再基于模拟目标对象的个性化对话模型对第一会话进行回复,得到第二会话,且个性化对话模型基于目标对象的样本个性化对话数据采用强化学习对第一对话模型进行参数微调得到,第一对话模型为第二对话模型至少基于与预设生成式模型分别处理样本个性化对话数据之后的输出差异进行参数微调得到,第二对话模型基于样本通用对话数据对预设生成式模型进行参数微调得到,故通过样本通用对话数据对预设生成式模型进行参数微调得到第二对话模型,能够使第二对话模型在预设生成式模型其通用理解能力的基础上进一步赋予通用对话能力,再至少基于其与预设生成式模型分别处理样本个性化对话数据之后的输出差异进行参数微调以得到第一对话模型,能够使第一对话模型一方面学习到目标对象的个性化对话,另一方面也能够从预设生成式模型中学习到对话能力之外的通用能力,在此再基于样本个性化对话数据采用强化学习对第一对话模型进行参数微调以得到个性化对话模型,能够使个性化对话模型进一步强化学习目标对象的个性化对话,进而能够通过个性化对话模型实现个性化会话。

本文档来自技高网...

【技术保护点】

1.一种个性化对话方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述样本通用对话数据的获取步骤包括:

3.根据权利要求1或2所述的方法,其特征在于,所述样本通用对话数据包括第一连续对话和所述第一连续对话所涉及角色的第一角色指令,所述第二对话模型的获取步骤包括:

4.根据权利要求1所述的方法,其特征在于,所述样本个性化对话数据的获取步骤包括:

5.根据权利要求1或4所述的方法,其特征在于,所述样本个性化对话数据包括所述目标对象的第二角色指令和第二连续对话,所述第一对话模型的获取步骤包括:

6.根据权利要求5所述的方法,其特征在于,在所述基于所述第二预测会话与所述第三预测会话之间的分布差异,调整所述第二对话模型中目标网络的网络参数之前,所述方法还包括:

7.根据权利要求1或4所述的方法,其特征在于,所述样本个性化对话数据包括所述目标对象的第二角色指令和第二连续对话,所述个性化对话模型的获取步骤包括:

8.根据权利要求7所述的方法,其特征在于,所述会话评价模型的训练步骤包括:>

9.根据权利要求1所述的方法,其特征在于,在所述基于模拟目标对象的个性化对话模型对所述第一会话进行回复,得到第二会话之后,所述方法还包括:

10.一种个性化对话装置,其特征在于,包括:

11.一种电子设备,其特征在于,包括相互耦接的存储器和处理器,所述存储器中存储有程序指令,所述处理器用于执行所述程序指令以实现权利要求1至7任一项所述的个性化对话方法。

12.一种计算机可读存储介质,其特征在于,存储有能够被处理器运行的程序指令,所述程序指令用于实现权利要求1至7任一项所述的个性化对话方法。

...

【技术特征摘要】

1.一种个性化对话方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述样本通用对话数据的获取步骤包括:

3.根据权利要求1或2所述的方法,其特征在于,所述样本通用对话数据包括第一连续对话和所述第一连续对话所涉及角色的第一角色指令,所述第二对话模型的获取步骤包括:

4.根据权利要求1所述的方法,其特征在于,所述样本个性化对话数据的获取步骤包括:

5.根据权利要求1或4所述的方法,其特征在于,所述样本个性化对话数据包括所述目标对象的第二角色指令和第二连续对话,所述第一对话模型的获取步骤包括:

6.根据权利要求5所述的方法,其特征在于,在所述基于所述第二预测会话与所述第三预测会话之间的分布差异,调整所述第二对话模型中目标网络的网络参数之前,所述方法还包括:

7.根据权利要...

【专利技术属性】
技术研发人员:李亚丁昕昀房翔刘权王士进刘聪
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1