【技术实现步骤摘要】
本专利技术属于人工智能与自然语言处理领域,涉及一种面向跨领域多任务的大模型适配器高效部署方法及系统,具体涉及一种基于大模型参数高效微调方法的面向跨领域多任务的多适配器选择器的训练方法和基于此选择器的大模型多适配器联合部署系统。
技术介绍
1、随着人工智能技术和模型训练设备与技术的飞速发展,基于transformers架构的大语言模型如gpt系列、qwen系列、llama系列等,已成为自然语言处理领域的核心驱动力。这些拥有大量参数的模型通过在海量文本数据上进行持续充分的预训练,学会了丰富的语言知识和智能的上下文理解与生成能力,能够在各种自然语言处理任务上展现出强大的性能。
2、然而,这些模型往往伴随着庞大的参数规模和计算需求,对硬件资源提出了极高的要求。在实际应用中,尤其是在资源受限的环境下,如何高效、稳定地部署大语言模型成为了一个亟待解决的技术难题。与此同时,随着行业应用的深入,将通用的大型语言模型直接应用于垂直领域面临着诸多挑战,如行业术语理解不足、输出不符合行业标准、推理能力有限等。因此,大语言模型的垂直领域适配优化与高
...【技术保护点】
1.一种面向跨领域多任务的大模型适配器高效部署方法,其特征在于所述方法包括如下步骤:
2.根据权利要求1所述的面向跨领域多任务的大模型适配器高效部署方法,其特征在于所述步骤S2的具体步骤如下:
3.一种实现权利要求1-2任一项所述面向跨领域多任务的大模型适配器高效部署方法的系统,其特征在于所述方法包括adapter索引构造模块、selector训练数据构造模块、selector训练模块、适配器联合部署模块,其中:
【技术特征摘要】
1.一种面向跨领域多任务的大模型适配器高效部署方法,其特征在于所述方法包括如下步骤:
2.根据权利要求1所述的面向跨领域多任务的大模型适配器高效部署方法,其特征在于所述步骤s2的具体步骤如下:
3...
【专利技术属性】
技术研发人员:田一民,张柏林,隋典伯,涂志莹,初佃辉,
申请(专利权)人:哈尔滨工业大学威海,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。