一种应用于智能机器人的增量学习方法及装置制造方法及图纸

技术编号：33439839 阅读：16 留言：0更新日期：2022-05-19 00:27

本发明专利技术公开了一种应用于智能机器人的增量学习及装置。该方法在模型初始化阶段，将所述混合数据集输入至第一深度学习神经网络模型，并完成第一深度学习神经网络模型的初始化，得到第一深度学习神经网络模型的初始权重参数；在知识蒸馏阶段，根据交叉熵损失函数和蒸馏损失函数继续对所述第一深度学习神经网络模型进行训练，得到第二深度学习神经网络模型及其第二权重参数；在权重对齐阶段，根据第一深度学习神经网络模型的初始权重参数对第二深度学习神经网络模型的第二权重参数进行对齐调整，得到第三深度学习神经网络模型及其第三权重参数。本发明专利技术技术方案大大减轻了增量学习中的灾难性遗忘问题，提高了智能机器人对旧任务的记忆力和执行力。旧任务的记忆力和执行力。旧任务的记忆力和执行力。

全部详细技术资料下载

【技术实现步骤摘要】
一种应用于智能机器人的增量学习方法及装置

[0001]本专利技术涉及智能机器人
，尤其涉及一种应用于智能机器人的增量学习方法及装置。

技术介绍

[0002]目前，智能机器人在商场、机场、车站等公共场所的应用日益广泛，对建筑物、绿化带、行人、车辆等进行分割、检测与识别成为其必不可少的功能。这些功能的实现都依赖于ResNet、YOLO等复杂深度神经网络及其配套学习算法。虽然深度神经网络的结构纷繁复杂、学习算法的实现策略各不相同，但是它们都需要庞大的数据集来确保模型能够胜任真实场景下的任务。数据集的制作主要划分为三个步骤：1)数据采集人员在真实场景下使用专业相机对目标进行拍摄，得到原始数据；2)数据筛选人员对原始数据进行筛选，剔除曝光异常、目标模糊的原始数据；3)数据标注人员使用专业软件按照既定规则对原始数据进行标注。如果应用场景或者模型对数据集有更严苛的要求，需要在数据标注以后额外添加质检环节。数据集制作的整体流程包括采集、筛选、标注和质检。
[0003]深度学习方法需要依托于大数据，采集并且标注如此规模的数据集既昂贵又耗时。在现实世界中，很多任务不可能一次性得到所有的训练数据(例如开放的环境、非特定的任务)。这就使得神经网络必须能够利用不断产生的新数据持续学习新知识，并且不遗忘之前所学过的重要内容。并且在实际的感知数据中，数据量往往是逐渐增加的，因此面临新的数据时，通常的深度学习网络在学习了新的知识之后几乎彻底遗忘掉之前习得的知识。
[0004]深度学习模型的性能还取决于数据的一致性，即训练模型的...

【技术保护点】

【技术特征摘要】
1.一种应用于智能机器人的增量学习方法，其特征在于，包括以下步骤：在模型初始化阶段，将混合数据集输入至第一深度学习神经网络模型，并完成所述第一深度学习神经网络模型的初始化，得到所述第一深度学习神经网络模型的初始权重参数；所述混合数据集包括预留的旧样本数据和增加的新样本数据；在知识蒸馏阶段，根据交叉熵损失函数和蒸馏损失函数继续对所述第一深度学习神经网络模型进行训练，得到第二深度学习神经网络模型及其第二权重参数；在权重对齐阶段，根据所述第一深度学习神经网络模型的初始权重参数对所述第二深度学习神经网络模型的第二权重参数进行对齐调整，得到第三深度学习神经网络模型及其第三权重参数。2.根据权利要求1所述的应用于智能机器人的增量学习方法，其特征在于，所述交叉熵损失函数为L
CE(X,y)
＝∑
‑
δ
c＝y
*log(p
c
(X))，式中X为所述混合样本数据集的样本数据，y为所述样本数据对应的标签，δ
c＝y
为指示函数，p
c
(X)为所述第二深度学习神经网络模型的概率输出函数。3.根据权利要求2所述的应用于智能机器人的增量学习方法，其特征在于，所述蒸馏损失函数为式中X为所述混合样本数据集的样本数据，δ
c＝y
为指示函数，q
c
(X)为所述第一深度学习神经网络模型完成初始化后输出的第一概率分布，为所述第二深度学习神经网络模型输出的第二概率分布；式中T为预设常数，为所述第一深度学习神经网络模型完成初始化后的初始权重参数；式中T为预设常数，o
c
(x)为所述第二深度学习神经网络模型的第二权重参数。4.根据权利要求3所述的应用于智能机器人的增量学习方法，其特征在于，根据所述第一深度学习神经网络模型的初始权重参数对所述第二深度学习神经网络模型的第二权重参数进行对齐调整，得到所述第二深度学习神经网络模型的第三权重参数，具体为：根据所述第二权重参数计算所述第二深度学习神经网络模型对应的第二权重向量之和根据所述初始权重参数计算所述第一深度学习神经网络模型的初...

【专利技术属性】
技术研发人员：袁野，朱永同，万里红，刘娜，张赛，
申请(专利权)人：中原动力智能机器人有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人