一种专用网络应用审计的大语言模型增量学习系统和方法技术方案

技术编号:46599492 阅读:4 留言:0更新日期:2025-10-10 21:31
本发明专利技术提供一种专用网络应用审计的大语言模型增量学习系统和方法,待微调模型嵌入适配器模块,冻结待微调模型的主干参数后,运行待微调模型处理新训练样本以得到第一处理结果,运行旧版本模型处理新训练样本得到第二处理结果,从旧训练样本中提取出代表样本,运行待微调模型处理代表样本得到第三处理结果,基于三个结果更新适配器模块的参数,得到新版本模型。可以保持旧任务性能稳定,快速适配新任务,降低模型资源开销与部署复杂度,提升跨任务迁移与适配能力。

【技术实现步骤摘要】

本专利技术涉及大语言模型,尤其涉及一种专用网络应用审计的大语言模型增量学习系统和方法


技术介绍

1、随着人工智能技术的广泛应用,基于大语言模型(large language model,llm)的自然语言理解和生成能力已在多个领域获得实际部署。部分数据敏感度强的封闭业务网络,已逐步引入大语言模型开展文本审计、涉稳识别、指令解析等任务。为了应对业务场景中任务类型多样、更新频繁、数据不可重取的实际需求,“增量学习”成为构建多任务、低成本、高可控智能模型的关键技术。

2、为应对多任务场景下模型的持续演进需求,当前大语言模型的增量学习方法主要可归纳为四类:全量微调(full fine-tuning)、知识蒸馏类方法(如lwf)、模块化结构方法(如adapter、prompt tuning)与replay增量学习方法,如er(experience replay)、icarl(incremental classifier and representation learning)、der++(dark experiencereplay)。各类方法在结构构成本文档来自技高网...

【技术保护点】

1.一种专用网络应用审计的大语言模型增量学习系统,用于对旧版本模型进行增量学习得到新版本模型,其特征在于,包括:

2.如权利要求1所述的一种专用网络应用审计的大语言模型增量学习系统,其特征在于,所述参数更新模块包括:

3.如权利要求1所述的一种专用网络应用审计的大语言模型增量学习系统,其特征在于,模型构建模块在所述待微调模型中对每一类任务嵌入独立的适配器模块;

4.如权利要求1所述的一种专用网络应用审计的大语言模型增量学习系统,其特征在于,所述旧版本模型包括Transformer层,所述待微调模型在所述Transformer层嵌入所述适配器模块;...

【技术特征摘要】

1.一种专用网络应用审计的大语言模型增量学习系统,用于对旧版本模型进行增量学习得到新版本模型,其特征在于,包括:

2.如权利要求1所述的一种专用网络应用审计的大语言模型增量学习系统,其特征在于,所述参数更新模块包括:

3.如权利要求1所述的一种专用网络应用审计的大语言模型增量学习系统,其特征在于,模型构建模块在所述待微调模型中对每一类任务嵌入独立的适配器模块;

4.如权利要求1所述的一种专用网络应用审计的大语言模型增量学习系统,其特征在于,所述旧版本模型包括transformer层,所述待微调模型在所述transformer层嵌入所述适配器模块;

5.如权利要求2所述的一种专用网络应用审计的大语言模型增量学习系统,其特征在于,所述第二损失为kl散度。

6.如权利要求4所述的一种专用网络应用审计的大语言模型增量学习系统,其特征在于,所述待...

【专利技术属性】
技术研发人员:孙小康邵旭东
申请(专利权)人:公安部第三研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1