基于少量标注样本的增量学习方法及系统技术方案

技术编号:26846439 阅读:27 留言:0更新日期:2020-12-25 13:09
本发明专利技术属于大数据智能分析技术领域,特别涉及一种基于少量标注样本的增量学习方法及系统,收集样本数据;对少量已标注样本扩充增强,获得可靠标签数据集,利用该可靠标签数据集对网络进行学习获得预训练模型;基于网络预训练模型,对大量未标注样本进行预测分类,构建增量学习候选数据集;将可靠标签数据集和增量学习候选数据集组合得到增量学习数据集,对网络预训练模型进行增量学习,并利用可靠标签数据集对增量学习所得模型进行校准学习;利用校准学习后预训练模型对未标注数据进行预测分类,通过设置循环迭代条件来判定返回重新执行。本发明专利技术在仅有少量标注样本情况下通过增量学习得到用于分类识别的可靠样本数据,提升分类识别性能和准确率。

【技术实现步骤摘要】
基于少量标注样本的增量学习方法及系统
本专利技术属于大数据智能分析
,特别涉及一种基于少量标注样本的增量学习方法及系统。
技术介绍
IDC在《数据时代2025》白皮书中指出,2025年全球数据量将达到163ZB,且其中约20%将会是性命攸关的数据,约10%会达到超级关键的程度。数据大爆炸促使信息时代向数据时代的转变,诱发了科学研究第四范式——数据密集型科学研究的产生,但也带来了新的问题。如何从多源异构、种类和模态繁多的大数据中挖掘高价值信息和知识早已超出传统人工手段的能力范围,人工智能技术尤其是深度学习技术的发展为大数据挖掘分析和预测研究等提供了一种可能的方法。目前以有监督深度学习为代表的算法往往需要大量标注样本作为基础支撑,然而,相对于海量异构大数据,由于应用场景、隐私、安全等原因,大规模高质量的标注数据往往极为缺乏,限制了此类人工智能算法尤其是深度学习算法的性能发挥与应用。标注样本缺乏主要表现在两个方面:一是类别不平衡情况下的标注样本缺乏,主要表现为多类样本中某一类或几类样本的标注数量或规模远远大于另外一类或几类样本的标注数量或规模,本文档来自技高网...

【技术保护点】
1.一种基于少量标注样本的增量学习方法,其特征在于,包含如下内容:/n收集样本数据,包含:少量已标注样本和大量未标注样本;/n对少量已标注样本进行扩充增强,获得可靠标签数据集,利用该可靠标签数据集对网络进行学习获得预训练模型,调整模型收敛参数和配置;基于学习后的网络预训练模型,对大量未标注样本进行预测分类,依据分类结果构建增量学习候选数据集;/n将可靠标签数据集和增量学习候选数据集组合得到增量学习数据集;利用该增量学习数据集对网络预训练模型进行增量学习,并利用可靠标签数据集对增量学习所得模型进行校准学习;/n利用校准学习后的预训练模型对未标注数据进行预测分类,通过设置是否达到预设期望的循环迭代...

【技术特征摘要】
1.一种基于少量标注样本的增量学习方法,其特征在于,包含如下内容:
收集样本数据,包含:少量已标注样本和大量未标注样本;
对少量已标注样本进行扩充增强,获得可靠标签数据集,利用该可靠标签数据集对网络进行学习获得预训练模型,调整模型收敛参数和配置;基于学习后的网络预训练模型,对大量未标注样本进行预测分类,依据分类结果构建增量学习候选数据集;
将可靠标签数据集和增量学习候选数据集组合得到增量学习数据集;利用该增量学习数据集对网络预训练模型进行增量学习,并利用可靠标签数据集对增量学习所得模型进行校准学习;
利用校准学习后的预训练模型对未标注数据进行预测分类,通过设置是否达到预设期望的循环迭代条件来判定是否返回重新执行构建增量学习候选数据集及增量学习和校准学习步骤内容。


2.根据权利要求1所述的基于少量标注样本的增量学习方法,其特征在于,针对少量已标注样本,依据样本数据的类型及分布特性,利用数据增强方法对其进行扩充增强来获取可靠标签数据集。


3.根据权利要求1所述的基于少量标注样本的增量学习方法,其特征在于,基于学习后的网络预训练模型,对大量未标注样本进行预测分类识别,得到各样本分别属于各类别的得分值,将得分值大于预设选择阈值的样本作为增量学习候选数据,并以得分值确定的类别对样本添加临时标签,构建增量学习候选数据集。


4.根据权利要求1所述的基于少量标注样本的增量学习方法,其特征在于,按照模型收敛参数和配置,利用增量学习数据集对网络预训练模型进行增量学习,以通过模型训练得到扩展预训练模型。


5.根据权利要求4所述的基于少量标注样本的增量学习方法,其特征在于,针对扩展预训练模型,利用可靠标签数据集进行校准学习,以通过模型训练消除增量学习中引入的噪声。


6.根据权利要求1所述的基于少量标注样本的增量学习方法,其特征在于,预设期望的循环迭代条件为预先设置的循环迭代次数。

【专利技术属性】
技术研发人员:卢记仓周刚兰明敬张伟陈静吴建萍
申请(专利权)人:中国人民解放军战略支援部队信息工程大学
类型:发明
国别省市:河南;41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1