大语言模型微调方法、装置及相关设备制造方法及图纸

技术编号:44829850 阅读:65 留言:0更新日期:2025-03-28 20:22
本申请提供了一种大语言模型微调方法、装置及相关设备,涉及大语言模型领域,适用于金融科技领域。该方法包括:获取目标业务场景的目标服务数据;根据目标服务数据,在预设的微调模型库中确定与目标业务场景对应的目标微调模型;其中,微调模型库中包括多个预训练的候选微调模型,每一候选微调模型对应一种业务场景;将目标微调模型加载到预训练大语言模型中,得到目标场景化微调模型;其中,目标场景化微调模型对应于目标业务场景;通过目标场景化微调模型,对目标服务数据执行匹配于目标业务场景的服务推理任务。本申请能够针对不同金融场景进行高效的微调模型部署管理。

【技术实现步骤摘要】

本申请涉及大语言模型领域,适用于金融科技领域,尤其涉及一种大语言模型微调方法、装置及相关设备


技术介绍

1、在金融科技领域,为了满足不同业务场景的智能化需求,如零售银行、信用卡业务、理财业务等,金融机构通常需要对大语言模型进行场景化训练和部署。模型微调是一种常用的场景适配方法,通过预训练的微调模型在基础大语言模型上进行参数调整,使基础大语言模型具备特定场景的服务能力。

2、相关技术中,由于特定场景下的需求,通常会选择使用模型微调技术进行训练。然而,由于不同的金融应用场景对于大语言模型的要求各不相同,需要针对不同场景进行独立的微调训练,资源消耗过大,如果将多个场景合并训练又可能带来训练效果不稳定的问题。因此,亟需一种效率更高的大语言模型微调方案。


技术实现思路

1、本申请实施例的主要目的在于提出一种大语言模型微调方法、装置及相关设备,旨在针对不同金融场景进行高效的微调模型部署管理。

2、为实现上述目的,本申请实施例的第一方面提出了一种大语言模型微调方法,所述方法包括

3、本文档来自技高网...

【技术保护点】

1.一种大语言模型微调方法,其特征在于,所述方法包括;

2.根据权利要求1所述的大语言模型微调方法,其特征在于,所述候选微调模型的预训练过程包括:

3.根据权利要求2所述的大语言模型微调方法,其特征在于,所述对于每一所述业务场景,根据对应的所述服务数据特征,在所述预训练大语言模型上进行微调,得到对应的所述候选微调模型,包括:

4.根据权利要求2所述的大语言模型微调方法,其特征在于,所述微调模型库中的每一候选微调模型存储时配置有对应的场景适配参数,所述根据所述目标服务数据,在预设的微调模型库中确定与所述目标业务场景对应的目标微调模型,包括:

...

【技术特征摘要】

1.一种大语言模型微调方法,其特征在于,所述方法包括;

2.根据权利要求1所述的大语言模型微调方法,其特征在于,所述候选微调模型的预训练过程包括:

3.根据权利要求2所述的大语言模型微调方法,其特征在于,所述对于每一所述业务场景,根据对应的所述服务数据特征,在所述预训练大语言模型上进行微调,得到对应的所述候选微调模型,包括:

4.根据权利要求2所述的大语言模型微调方法,其特征在于,所述微调模型库中的每一候选微调模型存储时配置有对应的场景适配参数,所述根据所述目标服务数据,在预设的微调模型库中确定与所述目标业务场景对应的目标微调模型,包括:

5.根据权利要求1所述的大语言模型微调方法,其特征在于,所述预训练大语言模型包括词嵌入层、注意力层以及前馈神经网络层,所述目标微调模型的微调参数包括词嵌入层参数、注意...

【专利技术属性】
技术研发人员:符永统
申请(专利权)人:中国平安人寿保险股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1