一种基于群体的Siamese自监督学习方法技术

技术编号:40955327 阅读:25 留言:0更新日期:2024-04-18 20:31
本发明专利技术公开了一种基于群体的Siamese自监督学习方法,该方法采用Siamese网络结构,将经过数据增强的两个相关视图随机裁剪成N个固定大小的重叠图像块,将图像块进行数据增强后分别输入到特征编码器获得多个特征值。该特征编码器由一个ResNet‑18网络和两个线性层组成。利用Siamese网络的两个分支产生的特征集来计算交叉相关矩阵损失,并采用rank‑k三元组损失来避免来自同一类的两个样本作为负特征对组的错误分类。本方法能够解决自监督学习中单视图特征的局限性,在很少的迭代轮次中即可取得显著的收敛性,使预训练得到的ResNet‑18具有很好的分类效果,在多个数据集上优于最先进的自监督学习技术。

【技术实现步骤摘要】

本专利技术涉及一种基于群体的siamese自监督学习(gsssl)的方法,适用于计算机视觉中的分类任务。


技术介绍

1、近年来,机器学习领域发展迅速,其中最具影响力的变化之一是在自监督学习(ssl)方面的演变。自监督学习通过允许算法从未标记的数据集自动推断出有意义的表示,绕过了对昂贵的标记数据的需求,从而产生了前所未有的优势。在众多的ssl技术中,动量对比(moco)、simclr和barlow双胞胎等方法在视觉表征学习领域引起了广泛的关注。尽管这些经典模型有创新的设计策略,但仍然需要长时间的训练,通常需要数百个迭代轮次才能达到令人满意的收敛性。这些模型被用来处理单视图特征,而多视图特征的巨大潜力仍未被探索。


技术实现思路

1、专利技术目的:为了克服现有技术中存在的不足,本专利技术提供一种基于群体的siamese自监督学习方法(gsssl方法),利用多视图数据特征的多样性,达到前所未有的收敛速度,解决现有的自监督学习模型所固有的局限性和低效率。

2、技术方案:为实现上述目的,本专利技术采用的技术方本文档来自技高网...

【技术保护点】

1.一种基于群体的Siamese自监督学习方法,其特征在于:包括如下步骤:

2.根据权利要求1所述的基于群体的Siamese自监督学习方法,其特征在于:所述数据增强的方式包括随机裁剪、调整图片大小、水平翻转、颜色抖动、转换为灰度、高斯模糊和白化,每次数据增强时都会应用到随机裁剪和调整图片大小两种方式,同时根据设定的概率机制随机应用到水平翻转、颜色抖动、转换为灰度、高斯模糊和白化中的一种以上方式。

3.根据权利要求1所述的基于群体的Siamese自监督学习方法,其特征在于:所述特征编码器F包括一个可训练的ResNet-18网络f(·)和一个包含两个线性层的投影网络g...

【技术特征摘要】

1.一种基于群体的siamese自监督学习方法,其特征在于:包括如下步骤:

2.根据权利要求1所述的基于群体的siamese自监督学习方法,其特征在于:所述数据增强的方式包括随机裁剪、调整图片大小、水平翻转、颜色抖动、转换为灰度、高斯模糊和白化,每次数据增强时都会应用到随机裁剪和调整图片大小两种方式,同时根据设定的概率机制随机应用到水平翻转、颜色抖动、转换为灰度、高斯模糊和白化中的一种以上方式。

3.根据权利要求1所述的基于群体的siamese自监督学习方法,其特征在于:所述特征编码器f包括一个可训练的resnet-18网络f(·)和一个包含两个线性层的投影网络g(·),resnet-18网络产生2048个输出单元,投影网络的每个线性层包含4096个隐藏单元和512个输出单元,和

4.根据权利要求3所述的基于群体的siamese自监督学习方法...

【专利技术属性】
技术研发人员:许新征李仲年耿庆聪王佳雨孙统风
申请(专利权)人:中国矿业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1