一种基于持续学习的多类别多尺度目标拣选方法及装置制造方法及图纸

技术编号:29587027 阅读:18 留言:0更新日期:2021-08-06 19:46
本发明专利技术公开了一种基于持续学习的多类别多尺度目标拣选方法及装置,通过生成对抗网络实现新旧任务特征的隐藏空间表示,从而建立知识记忆存储仓库,使用自适应知识迁移调度模块实现多任务拣选的快速切换,加速新任务的训练过程,结合正则化技术量化模型参数的重要程度,防止关键参数在训练过程中被覆盖。将数据重放框架用于智能零件拣选系统,能够克服在多类型多尺度目标拣选模型持续学习过程中出现的功能灾难性遗忘问题,确保拣选模型功能的完整性,实现目标与场景可以动态变化的持续性学习,帮助系统协调高效地解决多任务拣选问题。

【技术实现步骤摘要】
一种基于持续学习的多类别多尺度目标拣选方法及装置
本专利技术属于机器学习
,具体涉及一种多类别多尺度目标拣选方法及装置。
技术介绍
目标拣选模型是智能制造与柔性制造发展的核心技术,实现工业加工、检测和装配的无人化生产,在机械加工、汽车制造、仓储物流和3C等领域有广阔的应用前景。目前智能视觉零件拣选系统在拣选多类别多尺度目标,尤其是连续动态训练新的拣选对象时,模型参数容易被新的学习过程大面积覆盖,拣选系统会出现对已有功能的灾难性遗忘问题,导致系统工作效率大幅降低,并且对系统原有功能造成破坏,同时新的系统任务又难以有效学习。
技术实现思路
本专利技术为了解决现有技术中的问题,提出了一种基于持续学习的多类别多尺度目标拣选方法及装置,采用先进的持续学习技术来解决现有智能拣选系统在应对多种类别、多种尺度的目标时,无法自适应地对已有拣选学习系统的有效调度和对新任务的高效学习问题。为了达到上述目的,本专利技术的实施例提供了一种基于持续学习的多类别多尺度目标拣选方法,包括:获取与新任务相似类型的知识先验;根据生成模型获得所述新任务和所述知识先验的全局特征数据;根据所述全局特征数据训练正则化拣选模型;其中,在拣选模型训练的同时,采用进化算法和神经网络架构搜索实现模型训练过程中结构自适应扩张。进一步地,所述新任务通过数据重现模块中的记忆协调器获取相似类型的知识先验。进一步地,所述数据重新模块利用生成模型对输入数据的编码表示能力来构建高效的知识记忆存储功能,根据生成模型对全局数据的隐空间特征表不。进一步地,所述数据重现模块的损失函数J1定义为:其中,θi为旧有模型参数,(x′i;θi)为新任务x′i的拣选决策,yi为真实决策,L1为以拣选决策与真实决策的误差计算的新任务训练损失函数,Lj为训练过程中模型对旧任务x′j的记忆存储误差。进一步地,正则化加权约束项J2通过费希尔信息矩阵Fj为模型参数加权,限制梯度和层间通路的大幅变化;正则化加权约束项J2为:其中,λ是一个超参数,θj为模型梯度更新之前的权重参数,θj*是模型梯度更新后的权重参数。进一步地,模型容量损失函数J3根据零件拣选的准确率R以及是否扩张模型结构的后验概率p共同作为拣选模型结构调整的关键依据,动态扩张模型结构以避免模型容量不足造成的欠拟合问题,模型容量损失函数J3为:J3=lnp(al|al-1)(1-R)其中,αl-1代表调整前的模型结构,αl代表调整后的模型结构。本专利技术实施例还提供了一种基于持续学习的多类别多尺度目标拣选装置,包括:数据重新模块,用于获取与新任务相似类型的知识先验,以及根据生成模型获得所述新任务和所述知识先验的全局特征数据;正则化模块,用于根据所述全局特征数据训练正则化拣选模型;动态模型容量扩充模块,在拣选模型训练的同时,采用进化算法和神经网络架构搜索实现模型训练过程中结构自适应扩张。本专利技术实施例还提供了一种计算机程序产品,包括计算机程序指令,当所述指令由处理器执行时,用于实现前述的基于持续学习的多类别多尺度目标拣选方法。本专利技术实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序被执行时,实现前述的基于持续学习的多类别多尺度目标拣选方法。本专利技术的有益效果是:本专利技术提出基于弹性加权的数据重放持续学习方法,通过生成对抗网络实现新旧任务特征的隐藏空间表示,从而建立知识记忆存储仓库,使用自适应知识迁移调度模块实现多任务拣选的快速切换,加速新任务的训练过程,结合正则化技术量化模型参数的重要程度,防止关键参数在训练过程中被覆盖。将数据重放框架用于智能零件拣选系统,能够克服在多类型多尺度目标拣选模型持续学习过程中出现的功能灾难性遗忘问题,确保拣选模型功能的完整性,实现目标与场景可以动态变化的持续性学习,帮助系统协调高效地解决多任务拣选问题。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1为本专利技术的原理示意图;图2为本专利技术的效果示意图;图3为本专利技术的方法流程图。具体实施方式为了便于本领域普通技术人员理解和实施本专利技术,下面结合附图对本专利技术的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术提出基于弹性加权的数据重放持续学习方法,该方法能够有效地解决拣选系统对多类别多尺度目标持续训练过程中出现的灾难性功能遗忘,并根据先验知识和新任务之间的相似性,加速模型在新任务上的训练速度。结合正则化和自适应模型扩张技术,在限制模型参数更新方向的同时保证拣选系统的任务容量,确保系统能够高效完成多类别多尺度的目标拣选任务。一、基于弹性加权的数据重放持续学习技术本专利技术提出的基于弹性加权的数据重放持续学习框架,如图1所示。该学习框架包括三个模块,即数据重现模块、正则化模块和动态模型容量扩充模块。持续学习有助于系统实现动态拓展和记忆功能,帮助系统大幅提高其在视觉与智能控制应用中的工作效率,并解决新任务训练导致的灾难性遗忘问题,而解决灾难性遗忘问题的核心是对原任务重要参数的保存,在保证效率的前提下使参数训练过程尽可能的具有全局特征匹配的特性。除此之外,持续学习仍需要针对新任务训练造成的信息损失给予相应补偿,所以基于弹性加权的数据重放持续学习架构利用生成模型的特征表达能力,把旧有数据的重要特征表示作为新任务训练时的数据补充,从而有效避免任务间的灾难性遗忘问题。因此,本专利技术将采用数据重放技术和模型参数正则化方法来应对当前智能拣选控制系统无法自适应地处理多种任务以及所出现的功能遗忘问题,并以现实工业级应用为研究目标,搭建高效的智能视觉零件拣选系统,建立多任务目标拣选模型的持续学习机制来有效应对复杂多变环境下多类别、多尺寸零部件的智能拣选。(1)数据重放模块具体来讲,数据重现模块利用生成模型对输入数据的编码表示能力,构建高效的知识记忆存储功能,根据生成模型对全局数据的隐空间特征表示,实现对多类别多目标零件拣选任务的持续学习。生成模型能够再现全局数据的特征分布,帮助模型有效避免传统学习系统中的知识遗忘问题,有利于新任务训练过程的快速收敛,使学习系统能够识别不同任务特征的同时,又具有匹配全局分布的高质量特征表示能力。数据重放架构的目标是尽可能多地从以往多个任务的迁移知识中学习经验,使之对于新任务具有最好的泛化能力。进而通过系统对全局数据分布的记忆存储,帮助模型准确定位不同任务的特征空间,训练并得到原有功能和新任务的本文档来自技高网...

【技术保护点】
1.一种基于持续学习的多类别多尺度目标拣选方法,其特征在于,所述方法包括:/n所述获取与新任务相似类型的知识先验;/n根据生成模型获得所述新任务和所述知识先验的全局特征数据;/n根据所述全局特征数据训练正则化拣选模型;/n其中,在拣选模型训练的同时,采用进化算法和神经网络架构搜索实现模型训练过程中结构自适应扩张。/n

【技术特征摘要】
1.一种基于持续学习的多类别多尺度目标拣选方法,其特征在于,所述方法包括:
所述获取与新任务相似类型的知识先验;
根据生成模型获得所述新任务和所述知识先验的全局特征数据;
根据所述全局特征数据训练正则化拣选模型;
其中,在拣选模型训练的同时,采用进化算法和神经网络架构搜索实现模型训练过程中结构自适应扩张。


2.根据权利要求1所述的方法,其特征在于:所述新任务通过数据重现模块中的记忆协调器获取相似类型的知识先验。


3.根据权利要求2所述的方法,其特征在于:所述数据重新模块利用生成模型对输入数据的编码表示能力来构建高效的知识记忆存储功能,根据生成模型对全局数据的隐空间特征表示。


4.根据权利要求3所述的方法,其特征在于:所述数据重现模块的损失函数J1定义为:



其中,θi为旧有模型参数,(x′i;θi)为新任务x′i的拣选决策,yi为真实决策,L1为以拣选决策与真实决策的误差计算的新任务训练损失函数,Lj为训练过程中模型对旧任务x′j的记忆存储误差。


5.根据权利要求3所述的方法,其特征在于:正则化加权约束项J2通过费希尔信息矩阵Fj为模型参数加权,限制梯度和层间通路的大幅变化;正则化加权约束项J2为:
<...

【专利技术属性】
技术研发人员:张正赵书光卢光明
申请(专利权)人:哈尔滨工业大学深圳
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1