【技术实现步骤摘要】
本专利技术设计了一种基于目标域样本划分的渐进式无源域适应力法,属于机器学习领域。
技术介绍
1、随着数据量的不断增长和计算能力的不断增强,以机器学习为代表的人工智能得到长足发展,并逐渐应用到现实生活中。传统的机器学习假设数据是独立同分布的,即训练样本和测试样本来自相同的数据分布。但在现实环境中,由于采集设备、光照、视角等因素的差异,独立同分布的假设很难成立,严重影响机器学习模型的性能,阻碍了其在真实场景中的应用。
2、迁移学习的基本思想是将从已标注数据中学习到的知识迁移到未标注数据上的目标任务中,减轻对目标域数据标注的依赖,同时考虑环境的变化。无监督域适应是迁移学习的一个实例,将知识从有标注的源域迁移到无标注的目标域,其中源域和目标域的数据分布不一致,反映了现实情况。
3、在医疗、金融等重视隐私保护的领域,源域数据往往难以获取,只能将源域预训练模型适配到无标注的目标域,这种问题设定下的无监督域适配被称为无源域适配。现有主流无源域适应方法是基于伪标签的方法,一方面提升伪标签的准确率,另一方面利用目标域数据优化特征表
...【技术保护点】
1.本专利技术涉及一种基于目标域样本划分的渐进式无源域适应方法,其特征在于,包括如下步骤:
2.如权利要求1所述的基于目标域样本划分的渐进式无源域适应方法,其特征在于,步骤(2)中的易适应样本筛选机制,根据模型的分类器预测,在每个类别选出预测概率最高的N个样本作为候选样本。计算候选样本的信息熵,并对每个类别的候选样本按照熵值由低到高进行排列,选取前M个样本作为最终的易适应样本,剩余样本作为难适应样本。
3.如权利要求1所述的基于目标域样本划分的渐进式无源域适应方法,其特征在于,步骤(3)中所述的图对比学习损失,将一个batch的样本作为图的顶点
...【技术特征摘要】
1.本发明涉及一种基于目标域样本划分的渐进式无源域适应方法,其特征在于,包括如下步骤:
2.如权利要求1所述的基于目标域样本划分的渐进式无源域适应方法,其特征在于,步骤(2)中的易适应样本筛选机制,根据模型的分类器预测,在每个类别选出预测概率最高的n个样本作为候选样本。计算候选样本的信息熵,并对每个类别的候选样本按照熵值由低到高进行排列,选取前m个样本作为最终的易适应样本,剩余样本作为难适应样本。
3.如权利要求1所述的基于目标域样本划分的渐进式无源域适应方法,其特征在于,步骤(3)中所述的图对比学习损失,将一个batch的样本作为图的顶点,以伪标签作为顶点的类别。如果边的两个顶点伪标签相同,且至少有一个顶点对应易适应样本,则该边的值为1,否则,值为0,由此构造样本类别关系图;相似的,构造样本特征关系图,以顶点样本的特征相似度作为边值。以样本类别关系图作为样本特征关系图的训练目标。
4.如权利要求1所述的基...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。