面向跨领域多任务的大模型适配器高效部署方法及系统技术方案

技术编号:43817163 阅读:57 留言:0更新日期:2024-12-27 13:30
本发明专利技术公开了一种面向跨领域多任务的大模型适配器高效部署方法及系统,所述方法包括如下步骤:步骤S1、构造模型adapter索引;步骤S2、构造用于训练selector的混合表征数据集;步骤S3、训练selector;步骤S4、基于selector的适配器联合部署。本发明专利技术提出了大语言模型部署中适配器选择器selector这一概念,可以根据模型的输入精准判断输入对应的领域和任务,从而引导系统精准将大模型与这一领域与任务的模型适配器精准匹配并重组,提高了多任务推理的准确度;同时提出了selector的训练方法和携带selector的大模型的推理流程和部署方法,提高了有限资源的资源利用率。

【技术实现步骤摘要】

本专利技术属于人工智能与自然语言处理领域,涉及一种面向跨领域多任务的大模型适配器高效部署方法及系统,具体涉及一种基于大模型参数高效微调方法的面向跨领域多任务的多适配器选择器的训练方法和基于此选择器的大模型多适配器联合部署系统。


技术介绍

1、随着人工智能技术和模型训练设备与技术的飞速发展,基于transformers架构的大语言模型如gpt系列、qwen系列、llama系列等,已成为自然语言处理领域的核心驱动力。这些拥有大量参数的模型通过在海量文本数据上进行持续充分的预训练,学会了丰富的语言知识和智能的上下文理解与生成能力,能够在各种自然语言处理任务上展现出强大的性能。

2、然而,这些模型往往伴随着庞大的参数规模和计算需求,对硬件资源提出了极高的要求。在实际应用中,尤其是在资源受限的环境下,如何高效、稳定地部署大语言模型成为了一个亟待解决的技术难题。与此同时,随着行业应用的深入,将通用的大型语言模型直接应用于垂直领域面临着诸多挑战,如行业术语理解不足、输出不符合行业标准、推理能力有限等。因此,大语言模型的垂直领域适配优化与高效稳定的部署成为了当本文档来自技高网...

【技术保护点】

1.一种面向跨领域多任务的大模型适配器高效部署方法,其特征在于所述方法包括如下步骤:

2.根据权利要求1所述的面向跨领域多任务的大模型适配器高效部署方法,其特征在于所述步骤S2的具体步骤如下:

3.一种实现权利要求1-2任一项所述面向跨领域多任务的大模型适配器高效部署方法的系统,其特征在于所述方法包括adapter索引构造模块、selector训练数据构造模块、selector训练模块、适配器联合部署模块,其中:

【技术特征摘要】

1.一种面向跨领域多任务的大模型适配器高效部署方法,其特征在于所述方法包括如下步骤:

2.根据权利要求1所述的面向跨领域多任务的大模型适配器高效部署方法,其特征在于所述步骤s2的具体步骤如下:

3...

【专利技术属性】
技术研发人员:田一民张柏林隋典伯涂志莹初佃辉
申请(专利权)人:哈尔滨工业大学威海
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1