基于最小迁移距离的样本筛选细粒度域适应方法及系统技术方案

技术编号:42381611 阅读:13 留言:0更新日期:2024-08-16 16:10
本发明专利技术公开了一种基于最小迁移距离的样本筛选细粒度域适应方法及系统,本发明专利技术方法包括基于最小迁移距离进行源域样本的筛选,基于筛选后的源域计算目标域中的每个样本对应伪标签的可信度,并得到具有可靠伪标签的目标样本集。利用上述筛选后得到的源域和目标域计算局部域对齐损失,与所有源域样本的交叉熵分类损失共同构成最终的损失函数,采用梯度下降法实现模型权重更新,直至达到预设的迭代次数。本发明专利技术能够有效避免域适应过程中的负迁移问题,并筛选得到一个具有可靠伪标签的目标样本集,用于实现源域和目标域同类别子域间的细粒度对齐,进而得到一个在目标域上具有较好泛化能力的分类模型,提高目标域上的分类精度。

【技术实现步骤摘要】

本专利技术涉及图像分类识别,具体涉及一种基于最小迁移距离的样本筛选细粒度域适应方法及系统


技术介绍

1、随着计算机科学和硬件技术的发展,深度学习在各个领域展现出蓬勃的生命力。深度神经网络作为深度学习的基础模型,具有强大的自主特征学习能力,可以用于完成分类、回归等复杂的机器学习问题,在机器视觉、自然语言处理等领域展现出广袤的应用前景。例如,深度神经网络可以基于神经影像数据,组合低维特征形成抽象的高维特征实现物体分类。深度神经网络作为一种数据驱动方法,其性能依赖于大规模的训练样本。由于高昂的时间和金钱成本,通常难以从单个站点获取大量的带标签训练数据,不同站点数据之间分布差异的存在,使得难以直接利用多站点数据进行模型训练。以脑影像数据为例,脑影像数据的采集需要花费高昂的成本,其标记需要专业人员的参与,这就导致单个站点样本量有限。同时由于采集仪器和相关参数的不同,使得不同站点的脑影像数据之间存在固有差异,难以直接利用。

2、域适应技术可以解决上述问题,域适应通过消除训练集(源域)和测试集(目标域)的特征分布差异,实现从源域到目标域的知识迁移。域适应依本文档来自技高网...

【技术保护点】

1.一种基于最小迁移距离的样本筛选细粒度域适应方法,其特征在于,包括下述步骤:

2.根据权利要求1所述的基于最小迁移距离的样本筛选细粒度域适应方法,其特征在于,步骤S102中基于源域样本和目标域分布之间的最小迁移距离进行源域样本筛选包括:计算每一个源域样本到目标域分布的最小迁移距离,去除最小迁移距离较大的预设比例的源域样本,得到筛选后的源域,其中计算每一个源域样本到目标域分布的最小迁移距离的函数表达式如下:

3.根据权利要求1所述的基于最小迁移距离的样本筛选细粒度域适应方法,其特征在于,步骤S102中基于筛选后的源域样本计算每一个目标域样本对应伪标签的可信度包括:...

【技术特征摘要】

1.一种基于最小迁移距离的样本筛选细粒度域适应方法,其特征在于,包括下述步骤:

2.根据权利要求1所述的基于最小迁移距离的样本筛选细粒度域适应方法,其特征在于,步骤s102中基于源域样本和目标域分布之间的最小迁移距离进行源域样本筛选包括:计算每一个源域样本到目标域分布的最小迁移距离,去除最小迁移距离较大的预设比例的源域样本,得到筛选后的源域,其中计算每一个源域样本到目标域分布的最小迁移距离的函数表达式如下:

3.根据权利要求1所述的基于最小迁移距离的样本筛选细粒度域适应方法,其特征在于,步骤s102中基于筛选后的源域样本计算每一个目标域样本对应伪标签的可信度包括:

4.根据权利要求3所述的基于最小迁移距离的样本筛选细粒度域适应方法,其特征在于,步骤s102中筛选目标域样本得到具有可靠伪标签的目标样本集是指将伪标签的可信度较大的预设比例的目标域样本作为筛选得到的具有可靠伪标签的目标域样本集合。

5.根据权利要求1所述的基于最小迁移距离的样本筛选细粒度域适应方法,其特征在于,步骤s103中源域和目标域的局部域对齐损...

【专利技术属性】
技术研发人员:曾令李代明浩胡德文苏建坡
申请(专利权)人:中国人民解放军国防科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1