基于域增量学习的模型调优方法、装置、设备及存储介质制造方法及图纸

技术编号:37607120 阅读:8 留言:0更新日期:2023-05-18 11:59
本发明专利技术涉及一种机器学习技术领域,是一种基于域增量学习的模型调优方法、装置、设备及存储介质,包括:响应于获取新数据,调用原有模型对其进行识别,并判断是否出现识别错误;响应于出现识别错误,抽取识别错误的数据建立新增数据集;利用新增数据集对原有模型进行域增量学习,构建新模型。本发明专利技术的模型任务固定,不需要增加识别类别,利用模型对新数据进行识别,在出现存在识别错误时,建立新增数据集,利用新增数据集对原有模型进行域增量学习,实现在应用中需要不断调优模型,故而在保证原有识别效果的基础上又能适应新数据、修正原有模型,不会耗费大量的计算资源和时间,效率高,并且域增量学习的应用能有效增强模型的抗遗忘能力。能力。能力。

【技术实现步骤摘要】
基于域增量学习的模型调优方法、装置、设备及存储介质


[0001]本专利技术涉及一种机器学习
,是一种基于域增量学习的模型调优方法、装置、设备及存储介质。

技术介绍

[0002]当前的深度学习往往遵循构建静态数据集,在此基础上进行模型设计和训练的范式。在现实任务的场景中,由于隐私、数据存储或者算力限制等问题,无法充分保存旧的样本。增量学习的愿景则是,在新的数据以流式到达,同时出现新的类别或者新的任务的情况下,人工智能系统能够做到增量学习,在保留旧的知识的情况,能够较好地适应新的领域,学习新的知识。
[0003]目前在模型实际应用中,数据一般是分批次获得的,同时模型应用也会存在一定的问题,如无人机巡检应用,巡检图像不断增加,且在模型识别过程中难免会存在一定的误报或漏报,这就需要迭代调优模型。但随着训练样本的不断积累,将所有训练样本都拿去训练,每次训练将会耗费大量的计算资源和时间,这样就导致效率非常低,应用效果很差。对此如果能够使用增量学习的方法,将可以快速对新数据进行学习来调优模型,在不遗忘原有识别能力的同时,又可以增加对新数据的识别能力。
[0004]增量学习可以分为任务增量学习,类增量学习和域增量学习。
[0005](1)任务增量学习(Task Incremental Learning)是指不同时刻到达的数据分属于不同的任务,同一任务的数据能够一个批次全部到达。由此导致的一个特点是,在一个任务中,我们可以获得当前任务的全量数据,从而可以遵循当前神经网络的学习范式,在独立同分布的假设下训练模型。同时,既然不同任务的输出互相独立,模型可以通过多头网络的方式实现。这也意味着,在预测阶段,我们需要根据需要指定输出头。
[0006](2)类增量学习(Class Incremental Leraning)是指不同时刻到达的数据属于同一任务的不同类别,类增量学习要求模型进行单头输出,并且能够增加输出的类别。相比于任务增量学习,类别增量学习前后数据之间的互相干扰更大,难度更高。
[0007](3)域增量学习(Domain Incremental Learning)是指不同时刻到达的数据属于同一任务的相同类别,但是数据分批次到达,且领域发生了变化,不同批次的数据不再符合静态同分布假设。在这个意义上,域增量学习与在线学习有相同之处,但增量学习突出强调了模型的抗遗忘能力。
[0008]现有的神经网络模型在增量学习新知识时往往会遭遇“灾难性遗忘”(Catastrophic Forgetting),在学习新任务之后,模型在旧任务上性能灾难性下降。这个问题指向了神经网络模型所面临的普遍问题:稳定性

可塑性困境(stability

plasticity dilemma),其中可塑性代表调整以整合新知识的能力,稳定性则代表在调整过程中保留旧知识的能力。如何提高模型的可塑性,同时兼顾稳定性,在两者间取得平衡,是增量学习研究所面临的挑战。

技术实现思路

[0009]本专利技术提供了一种基于域增量学习的模型调优方法、装置、设备及存储介质,克服了上述现有技术之不足,其能有效解决现有利用所有训练样本进行模型优化的方式存在会耗费大量的计算资源和时间,效率低的问题。
[0010]本专利技术的技术方案之一是通过以下措施来实现的:一种基于域增量学习的模型调优方法,包括:
[0011]响应于获取新数据,调用原有模型对其进行识别,并判断是否出现识别错误;
[0012]响应于出现识别错误,抽取识别错误的数据建立新增数据集;
[0013]利用新增数据集对原有模型进行域增量学习,构建新模型。
[0014]下面是对上述专利技术技术方案的进一步优化或/和改进:
[0015]上述利用新增数据集对原有模型进行域增量学习时使用的特征由利用训练原有模型时使用的原有训练样本编码获得。
[0016]上述利用新增数据集对原有模型进行域增量学习,构建新模型后还包括:利用新模型重新编码原有特征及新增数据的特征,更新原有特征,并且将原有模型更新为新模型,其中原有特征为利用原有模型对原有训练样本进行编码后获得的特征。
[0017]上述利用新增数据集对原有模型进行域增量学习时,对应的损失函数为交叉熵损失函数、知识蒸馏损失函数和基于特征的损失函数的结合。
[0018]本专利技术的技术方案之二是通过以下措施来实现的:一种基于域增量学习的模型调优装置,包括:
[0019]数据识别单元,响应于获取新数据,调用原有模型对其进行识别,并判断是否出现识别错误;
[0020]新增数据集构建单元,响应于出现识别错误,利用识别错误的数据建立新增数据集;
[0021]域增量学习单元,利用新增数据集对原有模型进行域增量学习,构建新模型。
[0022]下面是对上述专利技术技术方案的进一步优化或/和改进:
[0023]上述还包括初始模型训练单元、模型库、特征库和特征编码单元;
[0024]初始模型训练单元,获取初始训练样本,利用初始训练样本进行学习训练获取初始模型;
[0025]模型库,存储模型;
[0026]特征编码单元,获得数据,并利用该数据训练得到的模型对其进行编码,获得对应的特征;
[0027]特征库,存储特征编码单元输出的特征。
[0028]上述域增量学习单元和初始模型训练单元均包括特征提取模块和任务模块,特征提取模块包括各类训练模型所需的算法,任务模块包括分类器。
[0029]本专利技术的模型任务固定,不需要增加识别类别,只是分批次获得数据,利用模型对新数据进行识别,在出现存在识别错误时,建立新增数据集,利用新增数据集对原有模型进行域增量学习,实现在应用中需要不断调优模型,故而在保证原有识别效果的基础上又能适应新数据、修正原有模型,相较于现有利用所有训练样本进行模型优化的方式,不会耗费大量的计算资源和时间,效率高,并且域增量学习的应用能有效增强模型的抗遗忘能力。
附图说明
[0030]附图1为本专利技术的方法流程示意图。
[0031]附图2为本专利技术的装置结构示意图。
[0032]附图3为本专利技术中域增量学习单元的结构示意图。
具体实施方式
[0033]本专利技术不受下述实施例的限制,可根据本专利技术的技术方案与实际情况来确定具体的实施方式。
[0034]下面结合实施例及附图对本专利技术作进一步描述:
[0035]实施例1:如附图1所示,本专利技术实施例公开了一种基于域增量学习的模型调优方法,包括:
[0036]步骤S110,响应于获取新数据,调用原有模型对其进行识别,并判断是否出现识别错误。
[0037]该步骤中,原有模型则是使用原有训练样本进行训练获得,还需要说明的是,这里的原有模型可以是初始模型,也可以是上一次利用利用新增数据集对原有模型进行域增量学习,构建的新模型。
[0038]该步骤中,识别错误包括误报和漏报。
[0039]步骤S1本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于域增量学习的模型调优方法,其特征在于,包括:响应于获取新数据,调用原有模型对其进行识别,并判断是否出现识别错误;响应于出现识别错误,抽取识别错误的数据建立新增数据集;利用新增数据集对原有模型进行域增量学习,构建新模型。2.根据权利要求1所述的基于域增量学习的模型调优方法,其特征在于,所述利用新增数据集对原有模型进行域增量学习时使用的特征由利用训练原有模型时使用的原有训练样本编码获得。3.根据权利要求1或2所述的基于域增量学习的模型调优方法,其特征在于,所述利用新增数据集对原有模型进行域增量学习,构建新模型后还包括:利用新模型重新编码原有特征及新增数据的特征,更新原有特征,并且将原有模型更新为新模型,其中原有特征为利用原有模型对原有训练样本进行编码后获得的特征。4.根据权利要求1或2所述的基于域增量学习的模型调优方法,其特征在于,所述利用新增数据集对原有模型进行域增量学习时,对应的损失函数为交叉熵损失函数、知识蒸馏损失函数和基于特征的损失函数的结合。5.根据权利要求4所述的基于域增量学习的模型调优方法,其特征在于,所述利用新增数据集对原有模型进行域增量学习时,对应的损失函数为交叉熵损失函数、知识蒸馏损失函数和基于特征的损失函数的结合。6.一种应用如权利要求1至5中任意一项所述方法的基于域增量学习的模型调优装置,...

【专利技术属性】
技术研发人员:孟欣欣曹澍王楷谭启筠郭江涛肖靖峰王晓卓王平王亚楠高坤恒
申请(专利权)人:国家电网有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1