一种基于特征空间粒子推断的数据集蒸馏方法及系统技术方案

技术编号:42188094 阅读:23 留言:0更新日期:2024-07-30 18:39
本发明专利技术公开了一种基于特征空间粒子推断的数据集蒸馏方法,包括:对原始图像数据集进行分类别聚类;利用高效参数化的方式基于聚类后的原始数据集构建初始合成数据集;对合成数据集进行迭代优化,在每次迭代过程中在基础模型池中对基模型进行随机选择,并对选择的基模型进行更新训练;利用预训练的基模型分别提取原始图像数据特征和合成数据集中对应类别的合成样本特征;估计原始图像数据特征的特征分布,并结合特征空间粒子推断方法对合成样本特征进行特征分布匹配,得到更新后的合成数据集;重复执行直至迭代结束,得到更新完成的合成数据集。本发明专利技术实现了一种具有良好初始点、高效的数据集蒸馏方法,可以轻易地应用于不同图像分类数据集。

【技术实现步骤摘要】

本专利技术涉及深度学习和图像数据集压缩,特别涉及一种基于特征空间粒子推断的数据集蒸馏方法及系统


技术介绍

1、在过去的十几年里,深度神经网络凭借强大的、使其能够直接处理庞大数据集并绕过复杂手动提取特征步骤的计算资源,在计算机视觉、信息检索和自然语言处理等机器学习任务中表现出了令人印象深刻的性能。然而,突破性的深度模型都依赖于在大规模数据集上进行训练,处理大规模数据要进行采集、存储、传输和预处理等一系列工作,需要付出大量的存储、传输和处理资源的代价。此外,对海量数据集的训练通常需要巨大的计算成本,有时需要数千个gpu小时才能达到令人满意的性能,这会限制超参数优化、神经架构搜索等依赖于在数据集上及进行多次训练的算法的应用。同时,由于现实世界中的信息和数据集是爆炸式增长的,每天都会产生海量数据,这对深度神经网络的模型性能和训练效率都会构成重大威胁,一方面,仅对新出现的数据进行训练很容易出现灾难性遗忘问题,这会严重损害性能;另一方面,存储所有历史数据即使不是完全不可行,也是非常麻烦的,有限的计算资源也难以支撑如此大规模数据的高效训练。

2、解决上述高本文档来自技高网...

【技术保护点】

1.一种基于特征空间粒子推断的数据集蒸馏方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的一种基于特征空间粒子推断的数据集蒸馏方法,其特征在于,所述S2包括:利用预训练的图像分类模型提取原始图像数据集的数据特征,并基于特征对每个类别的原始图像数据样本进行聚类。

3.根据权利要求1所述的一种基于特征空间粒子推断的数据集蒸馏方法,其特征在于,所述S3包括:

4.根据权利要求1所述的一种基于特征空间粒子推断的数据集蒸馏方法,其特征在于,S4包括:

5.根据权利要求1所述的一种基于特征空间粒子推断的数据集蒸馏方法,其特征在于,所述S5包括:...

【技术特征摘要】

1.一种基于特征空间粒子推断的数据集蒸馏方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的一种基于特征空间粒子推断的数据集蒸馏方法,其特征在于,所述s2包括:利用预训练的图像分类模型提取原始图像数据集的数据特征,并基于特征对每个类别的原始图像数据样本进行聚类。

3.根据权利要求1所述的一种基于特征空间粒子推断的数据集蒸馏方法,其特征在于,所述s3包括:

4.根据权利要求1所述的一种基于特征空间粒子推断的数据集蒸馏方法,其特征在于,s4包括:

5.根据权利要求1所述的一种基于特征空间粒子推断的数据集蒸馏方法,其特征在于,所述s5包括:

6.根据权利要求1...

【专利技术属性】
技术研发人员:邓岳李洪珏杜金阳
申请(专利权)人:北京航空航天大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1