用于增量学习的数据识别方法技术

技术编号:26479550 阅读:55 留言:0更新日期:2020-11-25 19:24
本公开涉及一种计算机实现的用于增量学习的数据识别方法,包括:获取新的训练样本集,将新的训练样本集与已有的训练样本集进行合并以得到更新后的训练样本集,计算更新后的训练样本集的复杂度并基于复杂度计算要基于更新后的训练样本集生成的数据识别模型的网络结构的规模,确定要生成的数据识别模型的网络结构的参数空间并基于要识别的数据从网络结构的参数空间中采样得到具有该规模的子网络结构的参数,并根据子网络结构的参数构建用于数据识别模型的网络结构,得到子网络结构的每个结点处的操作;使用更新后的训练样本集对具有子网络结构的数据识别模型进行训练以确定子网络结构中每个节点处的操作所涉及的参数,从而生成数据识别模型,以及基于数据识别模型进行数据识别。

【技术实现步骤摘要】
用于增量学习的数据识别方法
本公开涉及用于增量学习(IncrementalLearning)的数据识别方法。
技术介绍
今天是信息爆炸的时代,在现代商业行为中收集、存储、挖掘和使用大量可想到的信息。随着数据的增长或增量,非常有必要找到一种方法来为当前数据集构建最佳拟合模型。对于许多人工智能公司而言,他们使用深度神经网络来处理收集数据,随着人工智能和机器学习的发展,很多机器学习算法被开发。这些算法大部分都是批量学习(BatchLearning)模式,即假设在训练之前所有训练样本都可以一次得到,在学习这些样本之后,学习过程终止,而不再学习新的知识。应该注意,上面对技术背景的介绍只是为了方便对本申请的技术方案进行清楚、完整的说明,并方便本领域技术人员的理解而阐述的。不能仅仅因为这些方案在本申请的
技术介绍
部分进行了阐述而认为上述技术方案为本领域技术人员所公知。
技术实现思路
在下文中将给出关于本公开的简要概述,以便提供关于本公开的某些方面的基本理解。应当理解,这个概述并不是关于本公开的穷举性概述。它并不是意图确定本公开的关键本文档来自技高网...

【技术保护点】
1.一种计算机实现的用于增量学习的数据识别方法,包括:/n获取新的训练样本集,/n将所述新的训练样本集与已有的训练样本集进行合并以得到更新后的训练样本集,/n计算所述更新后的训练样本集的复杂度并基于所述复杂度计算要基于所述更新后的训练样本集生成的数据识别模型的网络结构的规模,/n基于要识别的数据的类型确定要生成的数据识别模型的网络结构的参数空间并且从所述网络结构的参数空间中采样得到具有所述规模的子网络结构的参数,并根据子网络结构的参数构建用于数据识别模型的网络结构,得到子网络结构的每个结点处的操作;/n使用所述更新后的训练样本集对具有所述子网络结构的数据识别模型进行训练以确定所述子网络结构中每...

【技术特征摘要】
1.一种计算机实现的用于增量学习的数据识别方法,包括:
获取新的训练样本集,
将所述新的训练样本集与已有的训练样本集进行合并以得到更新后的训练样本集,
计算所述更新后的训练样本集的复杂度并基于所述复杂度计算要基于所述更新后的训练样本集生成的数据识别模型的网络结构的规模,
基于要识别的数据的类型确定要生成的数据识别模型的网络结构的参数空间并且从所述网络结构的参数空间中采样得到具有所述规模的子网络结构的参数,并根据子网络结构的参数构建用于数据识别模型的网络结构,得到子网络结构的每个结点处的操作;
使用所述更新后的训练样本集对具有所述子网络结构的数据识别模型进行训练以确定所述子网络结构中每个节点处的操作的参数,从而生成所述数据识别模型,以及
基于所述数据识别模型进行数据识别。


2.根据权利要求1所述的方法,其中,所述数据集的复杂度为:
类内复杂度、类间复杂度或类内复杂度与类间复杂度之组合。


3.根据权利要求1所述的方法,其中,通过复杂度计算公式计算所述数据识别模型的网络结构的规模。


4.根据权利要求1所述的方法,通过网络层数L和通道数Cb来表示所述数据识别模型的规模。


5.根据权利要求4所述的方法,其中,所述网络结构的参数空间包括所述网络层数L、所述通道数Cb、每一层网络采用的张量操作方式以及各个层网络之间的连接方式,所述网络结构的参数空间的每部分由特定取值范围的数字表示,由所述网络结构的参数空间的各个部分的确定取值的数字构成的...

【专利技术属性】
技术研发人员:孙利汪留安孙俊
申请(专利权)人:富士通株式会社
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1