一种应用于智能机器人的增量学习方法及装置制造方法及图纸

技术编号:33439839 阅读:16 留言:0更新日期:2022-05-19 00:27
本发明专利技术公开了一种应用于智能机器人的增量学习及装置。该方法在模型初始化阶段,将所述混合数据集输入至第一深度学习神经网络模型,并完成第一深度学习神经网络模型的初始化,得到第一深度学习神经网络模型的初始权重参数;在知识蒸馏阶段,根据交叉熵损失函数和蒸馏损失函数继续对所述第一深度学习神经网络模型进行训练,得到第二深度学习神经网络模型及其第二权重参数;在权重对齐阶段,根据第一深度学习神经网络模型的初始权重参数对第二深度学习神经网络模型的第二权重参数进行对齐调整,得到第三深度学习神经网络模型及其第三权重参数。本发明专利技术技术方案大大减轻了增量学习中的灾难性遗忘问题,提高了智能机器人对旧任务的记忆力和执行力。旧任务的记忆力和执行力。旧任务的记忆力和执行力。

【技术实现步骤摘要】
一种应用于智能机器人的增量学习方法及装置


[0001]本专利技术涉及智能机器人
,尤其涉及一种应用于智能机器人的增量学习方法及装置。

技术介绍

[0002]目前,智能机器人在商场、机场、车站等公共场所的应用日益广泛,对建筑物、绿化带、行人、车辆等进行分割、检测与识别成为其必不可少的功能。这些功能的实现都依赖于ResNet、YOLO等复杂深度神经网络及其配套学习算法。虽然深度神经网络的结构纷繁复杂、学习算法的实现策略各不相同,但是它们都需要庞大的数据集来确保模型能够胜任真实场景下的任务。数据集的制作主要划分为三个步骤:1)数据采集人员在真实场景下使用专业相机对目标进行拍摄,得到原始数据;2)数据筛选人员对原始数据进行筛选,剔除曝光异常、目标模糊的原始数据;3)数据标注人员使用专业软件按照既定规则对原始数据进行标注。如果应用场景或者模型对数据集有更严苛的要求,需要在数据标注以后额外添加质检环节。数据集制作的整体流程包括采集、筛选、标注和质检。
[0003]深度学习方法需要依托于大数据,采集并且标注如此规模的数据集既昂贵又耗时。在现实世界中,很多任务不可能一次性得到所有的训练数据(例如开放的环境、非特定的任务)。这就使得神经网络必须能够利用不断产生的新数据持续学习新知识,并且不遗忘之前所学过的重要内容。并且在实际的感知数据中,数据量往往是逐渐增加的,因此面临新的数据时,通常的深度学习网络在学习了新的知识之后几乎彻底遗忘掉之前习得的知识。
[0004]深度学习模型的性能还取决于数据的一致性,即训练模型的数据与使用模型的数据要尽量具有一致规律,比如分布与质量、视角与曝光度等。然而,在智能机器人领域,由于软硬件设计安装环节不同、交互沟通不足,模型使用前采集数据的设备与模型使用时获取数据的设备不是同一个,在设备安装高度、角度等方面存在差异,从而影响模型的性能。综上所述,现有技术存在两方面问题:
[0005](1)现有的深度学习模型在连续流数据上训练的效果不佳,模型在新任务上训练时,在旧任务上的表现通常会显著性下降;
[0006](2)模型使用前采集数据的相机设备与模型使用时获取数据的相机设备不同导致数据一致性不好。

技术实现思路

[0007]本专利技术提供应用于智能机器人的增量学习方法及装置,大大减轻了增量学习中的灾难性遗忘问题,提高了智能机器人对旧任务的记忆力和执行力。
[0008]本专利技术一实施例提供一种应用于智能机器人的增量学习方法,包括以下步骤:
[0009]在模型初始化阶段,将混合数据集输入至第一深度学习神经网络模型,并完成所述第一深度学习神经网络模型的初始化,得到所述第一深度学习神经网络模型的初始权重参数;所述混合数据集包括预留的旧样本数据和增加的新样本数据;
[0010]在知识蒸馏阶段,根据交叉熵损失函数和蒸馏损失函数继续对所述第一深度学习神经网络模型进行训练,得到第二深度学习神经网络模型及其第二权重参数;
[0011]在权重对齐阶段,根据所述第一深度学习神经网络模型的初始权重参数对所述第二深度学习神经网络模型的第二权重参数进行对齐调整,得到第三深度学习神经网络模型及其第三权重参数。
[0012]进一步的,所述交叉熵损失函数为L
CE(X,y)
=∑

δ
c=y
*log(p
c
(X)),式中X为所述混合样本数据集的样本数据,y为所述样本数据对应的标签,δ
c=y
为指示函数,p
c
(X)为所述第二深度学习神经网络模型的概率输出函数。
[0013]进一步的,所述蒸馏损失函数为式中X为所述混合样本数据集的样本数据,δ
c=y
为指示函数,q
c
(X)为所述第一深度学习神经网络模型完成初始化后输出的第一概率分布,为所述第二深度学习神经网络模型输出的第二概率分布。
[0014]进一步的,根据所述第一深度学习神经网络模型的初始权重参数对所述第二深度学习神经网络模型的第二权重参数进行对齐调整,得到所述第二深度学习神经网络模型的第三权重参数,具体为:
[0015]根据所述第二权重参数计算所述第二深度学习神经网络模型对应的第二权重向量之和根据所述初始权重参数计算所述第一深度学习神经网络模型的初始权重向量之和第一深度学习神经网络模型的初始权重向量之和将所述第二权重向量之和W
new
的二范数和初始权重向量之和W
old
的二范数对齐得到所述第三深度学习神经网络模型的第三权重向量度学习神经网络模型的第三权重向量根据所述第三权重向量得到所述第三深度学习神经网络模型的第三权重参数;其中,至为所述第二深度学习神经网络模型的第二权重参数,w1至为所述第一深度学习神经网络模型的初始权重参数。
[0016]进一步的,所述混合数据集通过数据采集标注系统而获取。
[0017]进一步地,所述数据采集标注系统包括数据采集模块、通信模块、数据存储模块、中央控制模块和数据标注模块;
[0018]所述数据采集模块用于获取图像数据,并且将所述图像数据传输到所述数据存储模块,并向所述中央控制模块反馈当前的工作状态信息;
[0019]所述通信模块用于与所述中央控制模块进行双向通信、接收外界的控制指令和向外界反馈机器人当前的工作状态信息;
[0020]所述数据存储模块用于接收所述中央控制模块的指令和向所述中央控制模块反馈当前的工作状态信息,以及接收和存储来自所述数据采集模块的图像数据;
[0021]所述中央控制模块用于作为系统的决策中心、获取其余模块的工作状态信息、向
其他模块发送指令和协调各个模块的工作。
[0022]本专利技术又一实施例提供一种应用于智能机器人的增量学习装置,包括模型初始化模块、知识蒸馏模块和权重对齐模块;
[0023]所述模型初始化模块用于将所述混合数据集输入至所述第一深度学习神经网络模型,并完成所述第一深度学习神经网络模型的初始化,得到所述第一深度学习神经网络模型的初始权重参数;所述混合数据集包括预留的旧样本数据和增加的新样本数据;
[0024]所述知识蒸馏模块用于根据交叉熵损失函数和蒸馏损失函数继续对所述第一深度学习神经网络模型进行训练,得到第二深度学习神经网络模型及其第二权重参数;
[0025]所述权重对齐模块用于根据所述第一深度学习神经网络模型的初始权重参数对所述第二深度学习神经网络模型的第二权重参数进行对齐调整,得到所述第三深度学习神经网络模型及其第三权重参数。
[0026]本专利技术的实施例,具有如下有益效果:
[0027]本专利技术提供了一种应用于智能机器人的增量学习方法,该方法通过将知识蒸馏和权重对齐应用到增量学习的模型训练中,同时采用包含旧样本数据和新样本数据的混合数据集对深度学习神经网络模型进行训练,有效缓解了增量学习中的灾难性遗忘问题,提高了智能机器人对旧任务的记忆力和执行力。避免了识别新数据本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种应用于智能机器人的增量学习方法,其特征在于,包括以下步骤:在模型初始化阶段,将混合数据集输入至第一深度学习神经网络模型,并完成所述第一深度学习神经网络模型的初始化,得到所述第一深度学习神经网络模型的初始权重参数;所述混合数据集包括预留的旧样本数据和增加的新样本数据;在知识蒸馏阶段,根据交叉熵损失函数和蒸馏损失函数继续对所述第一深度学习神经网络模型进行训练,得到第二深度学习神经网络模型及其第二权重参数;在权重对齐阶段,根据所述第一深度学习神经网络模型的初始权重参数对所述第二深度学习神经网络模型的第二权重参数进行对齐调整,得到第三深度学习神经网络模型及其第三权重参数。2.根据权利要求1所述的应用于智能机器人的增量学习方法,其特征在于,所述交叉熵损失函数为L
CE(X,y)
=∑

δ
c=y
*log(p
c
(X)),式中X为所述混合样本数据集的样本数据,y为所述样本数据对应的标签,δ
c=y
为指示函数,p
c
(X)为所述第二深度学习神经网络模型的概率输出函数。3.根据权利要求2所述的应用于智能机器人的增量学习方法,其特征在于,所述蒸馏损失函数为式中X为所述混合样本数据集的样本数据,δ
c=y
为指示函数,q
c
(X)为所述第一深度学习神经网络模型完成初始化后输出的第一概率分布,为所述第二深度学习神经网络模型输出的第二概率分布;式中T为预设常数,为所述第一深度学习神经网络模型完成初始化后的初始权重参数;式中T为预设常数,o
c
(x)为所述第二深度学习神经网络模型的第二权重参数。4.根据权利要求3所述的应用于智能机器人的增量学习方法,其特征在于,根据所述第一深度学习神经网络模型的初始权重参数对所述第二深度学习神经网络模型的第二权重参数进行对齐调整,得到所述第二深度学习神经网络模型的第三权重参数,具体为:根据所述第二权重参数计算所述第二深度学习神经网络模型对应的第二权重向量之和根据所述初始权重参数计算所述第一深度学习神经网络模型的初...

【专利技术属性】
技术研发人员:袁野朱永同万里红刘娜张赛
申请(专利权)人:中原动力智能机器人有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1