【技术实现步骤摘要】
本专利技术涉及一种适用于小样本问题的基于传播和增补的特征修正方法,属于机器学习。
技术介绍
1、小样本问题由于其在现实生活和科学研究的普遍性和挑战性,已成为近年机器学习领域的热门话题之一。当新类别目标有标签样本稀缺时,就可能出现小样本问题,导致机器学习模型难以迅速掌握其类别信息。例如,电商领域的新品类可能由于其交互数据少而触发小样本问题。又如军工等特殊行业,其数据采集及标注成本过高,也会导致小样本问题。为了清晰地描述小样本学习问题,将新类别数据称为新类,与之对应的旧类别称为基类。对于新类,其中有标签数据称为支持集,无标签数据称为查询集,而查询集正是机器学习模型要推理的。
2、尽管目前已有部分小样本学习方法在小样本数据上取得了一定进展。基于元学习的方法尝试使机器学习模型掌握学会学习和快速适应的能力,使其能够将掌握的信息快速地从支持集流动至查询集。基于迁移学习的方法利用预训练模型得到新类的特征表示,但该特征仍是基于预训练领域的,无法有效处理支持集和查询集之间的偏差问题。
技术实现思路
< ...【技术保护点】
1.一种适用于小样本问题的基于传播和增补的特征修正方法,其特征在于,该方法的训练过程包括以下步骤:
2.根据权利要求1所述的方法,其特征在于,步骤3)的特征修正方法同时使用了分布传播、原型传播以及基于伪标签的特征更新;
3.根据权利要求2所述的方法,其特征在于,分布传播和原型传播的构建均依赖于相似度矩阵的构建,通过高斯核函数计算样本特征间的相似度;在分布传播中:
4.根据权利要求2所述的方法,其特征在于,分布传播的图结构构建于全图之上,而原型传播构建在二部图之上;分布传播是对图中所有节点特征的修正,优化了样本类间边界和类内的聚集性;
...【技术特征摘要】
1.一种适用于小样本问题的基于传播和增补的特征修正方法,其特征在于,该方法的训练过程包括以下步骤:
2.根据权利要求1所述的方法,其特征在于,步骤3)的特征修正方法同时使用了分布传播、原型传播以及基于伪标签的特征更新;
3.根据权利要求2所述的方法,其特征在于,分布传播和原型传播的构建均依赖于相似度矩阵的构建,通过高斯核函数计算样本特征间的相似度;在分布传播中:
4.根据权利要求2所述的方法,其特征在于,分布传播的图结构构建于全图之上,而原型传播构建在二部图之上;分布传播是对图中所有节点特征的修正,优化了样本类间边界和类内的...
【专利技术属性】
技术研发人员:王喆,肖婷,迟子秋,张倩,杨海,
申请(专利权)人:华东理工大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。