【技术实现步骤摘要】
本专利技术涉及深度学习和图像数据集压缩,特别涉及一种基于特征空间粒子推断的数据集蒸馏方法及系统。
技术介绍
1、在过去的十几年里,深度神经网络凭借强大的、使其能够直接处理庞大数据集并绕过复杂手动提取特征步骤的计算资源,在计算机视觉、信息检索和自然语言处理等机器学习任务中表现出了令人印象深刻的性能。然而,突破性的深度模型都依赖于在大规模数据集上进行训练,处理大规模数据要进行采集、存储、传输和预处理等一系列工作,需要付出大量的存储、传输和处理资源的代价。此外,对海量数据集的训练通常需要巨大的计算成本,有时需要数千个gpu小时才能达到令人满意的性能,这会限制超参数优化、神经架构搜索等依赖于在数据集上及进行多次训练的算法的应用。同时,由于现实世界中的信息和数据集是爆炸式增长的,每天都会产生海量数据,这对深度神经网络的模型性能和训练效率都会构成重大威胁,一方面,仅对新出现的数据进行训练很容易出现灾难性遗忘问题,这会严重损害性能;另一方面,存储所有历史数据即使不是完全不可行,也是非常麻烦的,有限的计算资源也难以支撑如此大规模数据的高效训练。
...【技术保护点】
1.一种基于特征空间粒子推断的数据集蒸馏方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的一种基于特征空间粒子推断的数据集蒸馏方法,其特征在于,所述S2包括:利用预训练的图像分类模型提取原始图像数据集的数据特征,并基于特征对每个类别的原始图像数据样本进行聚类。
3.根据权利要求1所述的一种基于特征空间粒子推断的数据集蒸馏方法,其特征在于,所述S3包括:
4.根据权利要求1所述的一种基于特征空间粒子推断的数据集蒸馏方法,其特征在于,S4包括:
5.根据权利要求1所述的一种基于特征空间粒子推断的数据集蒸馏方法,其特征
...【技术特征摘要】
1.一种基于特征空间粒子推断的数据集蒸馏方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的一种基于特征空间粒子推断的数据集蒸馏方法,其特征在于,所述s2包括:利用预训练的图像分类模型提取原始图像数据集的数据特征,并基于特征对每个类别的原始图像数据样本进行聚类。
3.根据权利要求1所述的一种基于特征空间粒子推断的数据集蒸馏方法,其特征在于,所述s3包括:
4.根据权利要求1所述的一种基于特征空间粒子推断的数据集蒸馏方法,其特征在于,s4包括:
5.根据权利要求1所述的一种基于特征空间粒子推断的数据集蒸馏方法,其特征在于,所述s5包括:
6.根据权利要求1...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。