一种适用于小样本问题的基于传播和增补的特征修正方法技术

技术编号:42202715 阅读:23 留言:0更新日期:2024-07-30 18:48
本发明专利技术公开了一种适用于小样本问题的基于传播和增补的特征修正方法,该方法的训练过程包括:1)将原始样本数据按照类别不共享的策略划分为训练集和测试集两部分;2)根据基于交叉熵的卷积神经网络,在训练集上训练特征提取网络;3)基于特征修正框架,将测试样本输入特征提取网络提取特征,并通过特征修正方法对测试样本的特征进行传播和更新,得到最终的测试样本特征;4)测试过程中,将有标签样本和无标签样本同时应用步骤3)并根据近邻分类器得到无标签样本的分类结果。本发明专利技术在提高小样本学习准确率的同时降低数据标注成本,是无参数化的即插即用系统模块,使特征在应用中更具判别性,整体提高了小样本学习系统的效率和准确率。

【技术实现步骤摘要】

本专利技术涉及一种适用于小样本问题的基于传播和增补的特征修正方法,属于机器学习。


技术介绍

1、小样本问题由于其在现实生活和科学研究的普遍性和挑战性,已成为近年机器学习领域的热门话题之一。当新类别目标有标签样本稀缺时,就可能出现小样本问题,导致机器学习模型难以迅速掌握其类别信息。例如,电商领域的新品类可能由于其交互数据少而触发小样本问题。又如军工等特殊行业,其数据采集及标注成本过高,也会导致小样本问题。为了清晰地描述小样本学习问题,将新类别数据称为新类,与之对应的旧类别称为基类。对于新类,其中有标签数据称为支持集,无标签数据称为查询集,而查询集正是机器学习模型要推理的。

2、尽管目前已有部分小样本学习方法在小样本数据上取得了一定进展。基于元学习的方法尝试使机器学习模型掌握学会学习和快速适应的能力,使其能够将掌握的信息快速地从支持集流动至查询集。基于迁移学习的方法利用预训练模型得到新类的特征表示,但该特征仍是基于预训练领域的,无法有效处理支持集和查询集之间的偏差问题。


技术实现思路

<p>1、本专利技术从本文档来自技高网...

【技术保护点】

1.一种适用于小样本问题的基于传播和增补的特征修正方法,其特征在于,该方法的训练过程包括以下步骤:

2.根据权利要求1所述的方法,其特征在于,步骤3)的特征修正方法同时使用了分布传播、原型传播以及基于伪标签的特征更新;

3.根据权利要求2所述的方法,其特征在于,分布传播和原型传播的构建均依赖于相似度矩阵的构建,通过高斯核函数计算样本特征间的相似度;在分布传播中:

4.根据权利要求2所述的方法,其特征在于,分布传播的图结构构建于全图之上,而原型传播构建在二部图之上;分布传播是对图中所有节点特征的修正,优化了样本类间边界和类内的聚集性;原型传播仅改变原型特...

【技术特征摘要】

1.一种适用于小样本问题的基于传播和增补的特征修正方法,其特征在于,该方法的训练过程包括以下步骤:

2.根据权利要求1所述的方法,其特征在于,步骤3)的特征修正方法同时使用了分布传播、原型传播以及基于伪标签的特征更新;

3.根据权利要求2所述的方法,其特征在于,分布传播和原型传播的构建均依赖于相似度矩阵的构建,通过高斯核函数计算样本特征间的相似度;在分布传播中:

4.根据权利要求2所述的方法,其特征在于,分布传播的图结构构建于全图之上,而原型传播构建在二部图之上;分布传播是对图中所有节点特征的修正,优化了样本类间边界和类内的...

【专利技术属性】
技术研发人员:王喆肖婷迟子秋张倩杨海
申请(专利权)人:华东理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1