【技术实现步骤摘要】
基于特征增强的车辆重识别方法
:
[0001]本专利技术涉及用于识别图形的记录载体的处理
,具体地说是基于特征增强的车辆重识别方法,更优选地是将特征增强与知识蒸馏相结合的车辆重识别方法。
技术介绍
:
[0002]车辆重识别可以视为实例级对象搜索任务。与传统的车辆检测问题不同,车辆重识别问题是指在一个特定范围内的交通监控场景下,判断非重叠区域内拍摄的车辆图像是否属于同一辆车的检索问题。目前,国内外在交通发达的区域都安装了监控摄像头,如何更好地利用监控摄像头进行交通监管和刑侦,构建一个安全完善的智能监控系统系统,是一个非常值得研究的问题。随着深度神经网络的兴起和人工智能的快速发展,车辆重识别技术因其能够定位目标车辆而被广泛应用到城市智能监控领域。因此,提升车辆重识别的准确性成为近年来计算机视觉和多媒体领域的研究热点。
[0003]常见的车辆重识别方法主要利用多模态数据(例如,车型、颜色、车牌和时空信息等)和全局
‑
局部特征相结合的形式来提高网络提取特征的能力。CN112560932A公开了一种基于双分支网络融合的车辆重识别方法,通过双分支网络提取全局和局部特征,并加入批处理擦除策略,突出了车辆图像的类内相似性和类间差异性,提高了车辆重识别检索的效率和精确性。但是该专利技术中的批处理擦除策略只能随机的对车辆特征进行擦除并未有选择性的擦除显著特征,会在车辆重识别过程中产生次优的结果。同时,未考虑车辆重识别任务在实际应用中由于网络过于复杂而造成效率不高、实时性差,无法满足交通监管和刑侦领域需求的问 ...
【技术保护点】
【技术特征摘要】
1.一种基于特征增强的车辆重识别方法,该方法包括以下内容:获取车辆图像,经预处理后获得训练集、查询集和图库集;构建基于多注意力引导的特征增强网络:该特征增强网络包括ResNet
‑
50主干网络,在主干网络的最后四层的相邻层之间均引入多感受野残差注意力模块,主干网络最后一层的输出分别进入两个分支:全局分支和局部分支;所述局部分支引入空间注意力引导的自适应擦除模块,所述空间注意力引导的自适应擦除模块也包括两个分支,分别为擦除剩余分支和多感受野分支;擦除剩余分支利用空间注意力去定位高级语义特征中最显著的特征区域,并设置函数自动在通道、高度、宽度三个维度上寻找特征中的最大像素值,设置擦除概率,利用空间注意力定位的最显著的特征区域的最大像素值进行乘法计算擦除阈值,并将大于擦除阈值的像素值设置为0,小于擦除阈值的像素值设置为1得到二进制擦除掩膜,通过与主干网络在最后一层输出的高级语义特征进行元素相乘得到了擦除高级语义特征中最显著特征后的剩余特征;多感受野分支直接由主干网络在最后一层输出连接一个多感受野残差注意力模块组成;在基于多注意力引导的特征增强网络的下次分类时以等概率随机选择经过空间注意力引导的自适应特征擦除模块后得到的剩余特征或者经过多感受野残差注意力模块所提取的多感受野残差特征,捕捉和提取车辆的潜在局部特征;所述多感受野残差注意力模块用于通过不同大小的感受野,学习不同层次的特征;融合全局分支的全局特征和局部分支的潜在局部特征获得增强特征向量,完成车辆重识别过程。2.根据权利要求1所述的基于特征增强的车辆重识别方法,其特征在于,所述多感受野残差注意力模块包括四个感受野不同的分支,第一个分支的卷积核大小为1
×
1、第二个分支的卷积核大小为3
×
3,第三个分支使用两个卷积核大小为3
×
3的卷积串联形成与5
×
5卷积核相同的感受野,第四个分支使用三个卷积核大小为3
×
3的卷积串联形成与7
×
7卷积核相同的感受野;四个分支得到四个不同的子特征,四个子特征拼接后再利用3
×
3的卷积得到与原始特征具有相同维度、相同尺寸的多感受野特征,最后使用Sigmoid函数将多感受野特征归一化到(0,1)区间得到多感受野注意力特征,将多感受野残差注意力模块的原始输入特征与多感受野注意力特征相乘,得到最终多感受野残差特征。3.根据权利要求1所述的基于特征增强的车辆重识别方法,其特征在于,该车辆重识别方法,以基于多注意力引导的特征增强网络作为教师网络,并使用一种类似于教师网络结构的、轻量的双分支网络作为学生网络,然后,使用四个损失函数来指导和监督学生网络,四个损失函数分别为交叉熵损失、三元组损失、蒸馏损失、相似度损失,学生网络不仅能够学习到教师网络的特征分布,而且能够让学生网络自主的学习与教师网络不同的车辆的特征。4.根据权利要求1所述的基于特征增强的车辆重识别方法,其特征在于,所述相似度损失按照公式(10)获得,能够让学生网络的特征分布与教师网络的特征分布相似,
其中,表示教师网络在主干网络最后一层输出的高级语义特征,表示学生网络在主干网络最后一层输出的高级语义特征;t表示车辆训练集图像的数量,表示计算训练集图像损失之和,||
·
||1表示L1范数;交叉熵损失和三元组损失能够让学生网络自主的去学习车辆的特征表示,所述三元组损失的公式为公式(13),其中,分别表示目标样本、正样本、负样本,β是控制到目标样本的正样本和负样本之间的距离余量,||
·
||2表示L2范数。5.一种基于特征增强的车辆重识别方法,该车辆重识别方法的具体步骤是:第一步,车辆图像预处理:首先,将在不同摄像头下采集的原始图像集X={x1,x2,
…
,x
m
}划分为训练集T={x1,x2,
…
,x
t
;t<m}、查询集Q={x
t+1
,
…
,x
q
;t<q<m}、图库集G={x
q+1
,
…
,x
m
;q<g≤m},其中,x
i
代表每一张原始车辆图像,车辆重识别数据集的划分是随机的,i∈[1,m]仅代表每一张图像的下标,t,q,g分别代表训练集、查询集、图库集中最后一张图像的下标;训练集T的分类标签定义为Y
T
={y1,y2,
…
,y
N
},其中,y
i
代表训练集中车辆图像的标签,N代表训练集中有N种不同的车辆;然后,在训练阶段对训练集T中的车辆图像采用双线性内插法,将图像尺寸从原始大小转化为[256,256]并按照概率P=0.5进行随机水平翻转;最后,根据公式(1),按照ImageNet数据集标准的RGB模式均值和方差将车辆图像归一化并转化为tensor张量;其中,均值mean=[0.485,0.456,0.406],方差std=[0.229,0.224,0.225],X
p
表示原车辆图像像素值,Y表示归一化后的像素值;第二步,构建基于多注意力引导的特征增强网络:第2.1步,主干网络:采用ResNet
‑
50作为主干网络,ResNet
‑
50网络共包含5层,分别定义为stage0~4,其中,stage1~stage4每层包含多个Bottleneck,在ResNet
‑
50的stage4中将最后一个卷积层的步长设置为1来提高车辆特征的分辨率,保留更多的特征信息;根据主干网络预测的特征映射,在全局分支使用全局平均池化层将特征映射转化为全局特征向量,局部分支使用GeM池化将特征映射转化为局部特征向量;然后,全局分支和局部分支分别利用两个全连接层(FC
‑
2048、FC
‑
512)将特征向量从2048维编码到512维再到固定维;第2.2步,构建多感受野残差注意力模块:原始...
【专利技术属性】
技术研发人员:于明,何坤,于洋,阎刚,朱叶,师硕,郝小可,郭迎春,刘依,吕华,
申请(专利权)人:河北工业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。