System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 模型的训练方法、应用方法、装置、设备和存储介质制造方法及图纸_技高网

模型的训练方法、应用方法、装置、设备和存储介质制造方法及图纸

技术编号:40432454 阅读:9 留言:0更新日期:2024-02-22 22:58
本申请公开了一种模型的训练方法、应用方法、装置、设备和存储介质,该方法包括:获取初始模型的输入数据;其中,输入数据包括提示信息和第一样本数据,提示信息包括第一子提示信息,第一子提示信息用于提示初始模型的训练任务,第一子提示信息提示的训练任务与初始模型的目标功能相关,第一样本数据为与训练任务关联的数据;基于第一样本数据,对初始模型进行对应训练任务的训练,得到目标模型;其中,目标模型具有对应训练任务的参考功能,具有参考功能能够提升目标模型的目标功能的能力。通过上述方式,本申请能够提升模型的性能。

【技术实现步骤摘要】

本申请涉及数据处理,特别是涉及一种模型的训练方法、应用方法、装置、设备和存储介质


技术介绍

1、目前,为了提升模型性能,会训练单独的具有辅助功能的模型;例如,为了提升语音识别模型的语音识别效果,会训练单独的语言模型、纠错模型等,以配合语音识别模型提升语音识别模型的效果。

2、但是,通过上述方式实现模型性能的提升,会增加部署的模型数量。


技术实现思路

1、本申请主要解决的技术问题是提供一种模型的训练方法、应用方法、装置、设备和存储介质,能够提升模型的性能。

2、为解决上述技术问题,本申请第一方面提供一种模型的训练方法,该方法包括:获取初始模型的输入数据;其中,输入数据包括提示信息和第一样本数据,提示信息包括第一子提示信息,第一子提示信息用于提示初始模型的训练任务,第一子提示信息提示的训练任务与初始模型的目标功能相关,第一样本数据为与训练任务关联的数据;基于第一样本数据,对初始模型进行对应训练任务的训练,得到目标模型;其中,目标模型具有对应训练任务的参考功能,具有参考功能能够提升目标模型的目标功能的能力。

3、为解决上述技术问题,本申请第二方面提供一种模型的应用方法,该方法包括:获取目标数据;利用目标模型对目标数据进行处理;其中,目标模型是利用上述第一方面的模型的训练方法训练得到的。

4、为解决上述技术问题,本申请第三方面提供一种模型的训练装置,该模型的训练装置包括获取模块和训练模块;获取模块用于获取初始模型的输入数据;其中,输入数据包括第一提示信息和第一样本数据,第一提示信息包括第一子提示信息,第一子提示信息用于提示初始模型的训练任务,第一子提示信息提示的训练任务与初始模型的目标功能相关,第一样本数据为与训练任务关联的数据;训练模块用于基于第一样本数据,对初始模型进行对应训练任务的训练,得到目标模型;其中,目标模型具有对应训练任务的参考功能,具有参考功能能够提升目标模型的目标功能的能力。

5、为解决上述技术问题,本申请第四方面提供一种模型的应用装置,该模型的应用装置包括获取模块和处理模块;获取模块用于获取目标数据;处理模块用于利用目标模型对目标数据进行处理;其中,目标模型是利用上述第一方面的模型的训练方法训练得到的。

6、为解决上述技术问题,本申请第五方面提供一种电子设备,该电子设备包括存储器和处理器,存储器存储有程序指令,处理器用于执行程序指令以实现上述第一方面和第二方面的方法。

7、为解决上述技术问题,本申请第五方面提供一种计算机可读存储介质,该计算机可读存储介质用于存储程序指令,程序指令能够被执行以实现上述第一方面和第二方面的方法。

8、上述技术方案,由于是对初始模型进行对应训练任务的训练而得到目标模型的,所以目标模型具有对应训练任务的参考功能,而具有参考功能能够提升目标模型的目标功能的能力;所以,对初始模型进行对应训练任务的训练,即是在初始模型中融合能够辅助提升初始模型目标功能的能力的功能,使得进行对应训练任务训练得到的目标模型的目标功能的能力提升。

9、另外,是直接对初始模型进行对应训练任务的训练,即,是直接将训练任务对应的参考功能融合至初始模型中,实现在不增加模型个数的情况下,提升目标模型的性能。

本文档来自技高网...

【技术保护点】

1.一种模型的训练方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,

3.根据权利要求2所述的方法,其特征在于,

4.根据权利要求3所述的方法,其特征在于,

5.根据权利要求4所述的方法,其特征在于,

6.根据权利要求5所述的方法,其特征在于,

7.根据权利要求1所述的方法,其特征在于,

8.根据权利要求7所述的方法,其特征在于,所述基于所述第一样本数据,对初始模型进行对应所述训练任务的训练,得到目标模型,包括:

9.根据权利要求1所述的方法,其特征在于,所述提示信息还包括第三子提示信息,所述第三子提示信息用于辅助模型进行目标功能的实现,在所述基于所述第一样本数据,对所述初始模型进行对应所述训练任务的训练,得到目标模型之前,或者,在所述基于所述第一样本数据,对所述初始模型进行对应所述训练任务的训练,得到目标模型之后,所述方法还包括:

10.根据权利要求9所述的方法,其特征在于,

11.一种模型的应用方法,其特征在于,所述方法包括:>

12.一种模型的训练装置,其特征在于,所述装置包括:

13.一种模型的应用装置,其特征在于,所述装置包括:

14.一种电子设备,其特征在于,所述电子设备包括存储器和处理器,所述存储器存储有程序指令,所述处理器用于执行所述程序指令以实现如权利要求1-11任一项所述的方法。

15.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储程序指令,所述程序指令能够被执行以实现如权利要求1-11任一项所述的方法。

...

【技术特征摘要】

1.一种模型的训练方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,

3.根据权利要求2所述的方法,其特征在于,

4.根据权利要求3所述的方法,其特征在于,

5.根据权利要求4所述的方法,其特征在于,

6.根据权利要求5所述的方法,其特征在于,

7.根据权利要求1所述的方法,其特征在于,

8.根据权利要求7所述的方法,其特征在于,所述基于所述第一样本数据,对初始模型进行对应所述训练任务的训练,得到目标模型,包括:

9.根据权利要求1所述的方法,其特征在于,所述提示信息还包括第三子提示信息,所述第三子提示信息用于辅助模型进行目标功能的实现,在所述基于所述第一样本数据,对所述初始模型进行对应所述训练任务...

【专利技术属性】
技术研发人员:李建祥万根顺潘嘉刘聪
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1