一种基于区域筛选模块和多层次对比的自监督预训练方法技术

技术编号：33204564 阅读：87 留言：0更新日期：2022-04-24 00:47

本发明专利技术公开了一种基于区域筛选模块和多层次对比的自监督预训练方法,由于对数据集图片进行人工标注既昂贵又费时，采用无标签的自监督方法对图像分类和目标检测的深度学习模型进行预训练在计算机视觉领域中有着不可或缺的研究意义，为了在这一类数据集中直接进行有效的自监督预训练，本发明专利技术提出基于实例区域筛选模块来预训练模型，其功能是在用于对比学习的图片生成两个增强图中筛选出特定数量最可能包含实例信息的块图，并将他们进行匹配,本发明专利技术提出了一种对全局、局部以及全局局部综合信息进行多层次对比学习的模块。这种方法用多实例数据集预训练出的模型在图片识别、目标检测等下游任务中取得了良好的精度提升。检测等下游任务中取得了良好的精度提升。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于区域筛选模块和多层次对比的自监督预训练方法

[0001]本申请涉及计算机视觉
，特别涉及一种基于区域筛选模块和多层次对比的自监督预训练方法。

技术介绍

[0002]自监督预训练方法是指利用辅助任务从没有人工标注的数据中挖掘自身的监督信息，通过这种方式构造有效的监督信息对深度学习神经网络模型进行预训练，以学习到对图片识别、目标检测和语义分割等下游任务有价值的特征提取器。由于在大规模数据集中进行人工的数据标注是既昂贵又费时的，采用无标签训练方式的自监督方法计算机视觉领域具有非常重要的研究价值，已受到了越加广泛的关注。
[0003]目前自监督预训练方法的辅助任务多采用了对比学习，它通过对比损失函数来最大化同一图像两个不同增强图之间的相似性，从而在数据集中学习模型的特征表示。通过对比学习，现有的自监督学习方法在ImageNet这一类单实例数据集中取得有效的进展。ImageNet是一个以实例为中心的数据集，它不仅只包含了单个实例，而且还将与实例无关的背景区域进行了最大限度的裁剪。自监督对比学习方法的关键步骤是使同...

【技术保护点】

【技术特征摘要】
1.一种基于区域筛选模块和多层次对比的自监督预训练方法，其特征在于：所述方法包括以下步骤：步骤1)：建立初始深度学习神经网络；步骤2)：将不带标签的训练输入数据输入神经网络，并基于无监督数据筛选出其中包含实例特征的局部块图；步骤3)：训练步骤，通过多层次对比学习的损失函数，基于无监督数据筛选出的局部块图训练深度学习神经网络模型。2.根据权利要求1所述的一种基于区域筛选模块和多层次对比的自监督预训练方法，其特征在于，所述步骤2)具体包括：图片的两个RGB增强图生成后，将其按照网格化的方式分割为整齐排列的多个块图{P1,P2,
…
,P
n
}，其中n表示增强图包含块图的总数；采用图像RGB信息熵来初步筛选实例块图，对于一个增强图的块图P,其依据RGB的三个不同颜色通道划分为[P
r
:P
g
:P
b
]，红色通道P
r
的图像信息熵计算方式如下：其中p(r
i
)表示像素值i在红色通道P
r
中的比例，像素值的范围为[0,255]，接下来，计算块图总RGB信息熵H
P
，图像总RGB信息熵计算方式表示为：在整个增强图v中，将所有的网格化切分的块图{P1,P2,
…
,P
n
}按照图像RGB信息熵H
P
大小从高到低排序，筛选出图像信息熵前k
H
高的块图；因图像RGB信息熵仅能对增强图中块图的局部信息进行计算，故采用衡量全局信息的LC显著性检测值筛选方法对块图进行二次筛选，在增强图中，使用像素与图中其他灰度值所在像素之间的距离之来度量像素属于实例区域的概率，假设I
k
表示增强图中一个像素点，则I
k
的显著值计算方式如下：其中，g(I
k
)表示像素I
k
的灰度值，f
n
表示灰度值n在整个增强图中的出现频率，Dist(.)代表两个灰度值之间的欧式距离，对于一个增强图v，将其转化为灰度图V
g
，对于所有的像素点I
k
，计算其显著值在V
g
中的值；根据像素点的显著值来计算块图的显著值S
P
，其计算方式表示为：根据块图的显著值S
P
从高到底排序，进一步筛选出显著值S
P
最高的前k个(k<k
H
)小块，作为实例区域筛选模块的筛选结果，对于增强图v，筛选出的所有块图表示为P(v)；
计算用于对比学习的全局和局部特征，本发明的深度学习模型依次包含一个主干网络f
θ
和两个MLP头，主干网络选择残差网络Resnet50，MLP头包含一个线性层，归一化算子和ReLu层，对于多实例数据集中一个图像的两个增强图v和v
′
与筛选出的块图P(v)和P(v
′
)，将其首先放入主干网络f
θ
中进行计算，输出得到它们对应的嵌入特征向量，其中通过整个增强图得到全局特征向量I
y
，I
y
′
，块图视为局部特征向量，记为P
y
，P
y
′
，它们经过第一个MLP头之后，得到对应的投影特征I
z
，I
z
′
和P
z
，P
z
′
，对于第一个增...

【专利技术属性】
技术研发人员：张宇，米思娅，陈子涵，程昊，
申请(专利权)人：东南大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人