多模态大模型增量学习方法、装置及计算机设备制造方法及图纸

技术编号:41317066 阅读:21 留言:0更新日期:2024-05-13 14:58
本发明专利技术实施例公开了多模态大模型增量学习方法、装置及计算机设备。所述方法包括:获取待更新多模态大模型;获取工业设备巡检、环境隐患监控、人员操作状态相关数据,并构建增量学习数据池;采用所述待更新多模态大模型与所述增量学习数据池构建总训练集;根据所述总训练集动态构建增量学习训练集,并利用所述增量学习训练集对所述待更新多模态大模型进行基于近邻学习的增量学习,以得到增量学习后的模型。通过实施本发明专利技术实施例的方法可实现动态构建分布均衡的训练数据,避免增量学习带来的知识遗忘问题,降低资源消耗和节省时间。

【技术实现步骤摘要】

本专利技术涉及模型学习方法,更具体地说是指多模态大模型增量学习方法、装置及计算机设备


技术介绍

1、近年来,多模态生成式大模型已成为机器学习领域的热点,引发广泛研究和关注,取得显著突破,广泛应用于各行各业。当前,主要应用的多模态大模型为通用型大模型,其逻辑推理能力经过大量公开数据集的训练而变得更加精细,但在垂直领域应用时表现欠佳,需要经过数据微调以提升其在垂直领域的性能以满足业务需求。

2、然而,垂直领域的有效数据相对有限,特别是电力安全监控领域中的检测山火烟雾是否对电力设施有影响的领域中,难以在短时间内收集足够的训练数据,尤其涉及多样化的场景和应用。在这种情况下,必须采用一种边应用边更新的策略,以不断提高多模态大模型的性能,这种持续性更新的方法是至关重要的,因为它允许模型适应新的数据和场景,使其保持最新的知识和适应性。

3、现有的是采用多模态大模型进行增量学习的方式以达到持续性更新的目的,主要包括两种方法,第一种是将新收集并标注的新场景数据与旧训练数据合并,使用合并后的数据对多模态大模型从预训练的过程中进行微调,但是该方法消耗的本文档来自技高网...

【技术保护点】

1.多模态大模型增量学习方法,其特征在于,包括:

2.根据权利要求1所述的多模态大模型增量学习方法,其特征在于,所述待更新多模态大模型是通过带有位置、类别以及文字描述标签的工业设备巡检、环境隐患监控、人员操作状态图像作为样本集对通用大模型进行垂直领域微调所得的。

3.根据权利要求2所述的多模态大模型增量学习方法,其特征在于,所述待更新多模态大模型是通过带有位置、类别以及文字描述标签的工业设备巡检、环境隐患监控、人员操作状态图像作为样本集对通用大模型进行微调所得的,包括:

4.根据权利要求1所述的多模态大模型增量学习方法,其特征在于,所述获取工业设备巡检...

【技术特征摘要】

1.多模态大模型增量学习方法,其特征在于,包括:

2.根据权利要求1所述的多模态大模型增量学习方法,其特征在于,所述待更新多模态大模型是通过带有位置、类别以及文字描述标签的工业设备巡检、环境隐患监控、人员操作状态图像作为样本集对通用大模型进行垂直领域微调所得的。

3.根据权利要求2所述的多模态大模型增量学习方法,其特征在于,所述待更新多模态大模型是通过带有位置、类别以及文字描述标签的工业设备巡检、环境隐患监控、人员操作状态图像作为样本集对通用大模型进行微调所得的,包括:

4.根据权利要求1所述的多模态大模型增量学习方法,其特征在于,所述获取工业设备巡检、环境隐患监控、人员操作状态相关数据,并构建增量学习数据池,包括:

5.根据权利要求4所述的多模态大模型增量学习方法,其特征在于,所述采用所述待更新多模态大模型与所述增量学习数据池构建总训练集,包括:

6.根据权利要求5...

【专利技术属性】
技术研发人员:蒋阳甘家旭豆泽阳庞磊
申请(专利权)人:传申弘安智能深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1