【技术实现步骤摘要】
一种基于多尺度卷积特征融合的行人重识别方法
本专利技术属于图像分析及图像识别
,具体涉及一种基于多尺度卷积特征融合的行人重识别方法。
技术介绍
行人重识别的目的是识别在不同位置以及不同摄像机视图中拍摄到的相同的行人并广泛应用于行人检索和摄像机跟踪任务的视频分析中。当在众多的视频序列中搜索特定的行人时,利用行人重识别系统可以节省时间和成本,因此利用身体外观的行人重识别已经受到越来越多的关注,但是由于行人容易受到姿态、照明、背景以及遮挡等方面的影响,使得行人重识别方法在本质上具有挑战性。目前,具有深层的卷积神经网络的行人重识别取得了进展并且取得了高的识别率,许多先进的方法都设计了复杂的网络结构并连接了多分支网络,这些工作都集中在学习对行人姿势、照明和视角变化具有鲁棒性的判别性特征表示,以使用卷积神经网络提高行人的识别率。因为行人重识别的识别率的高低很大程度上取决于行人特征的鲁棒性,获取的行人图像的特征表示越全面,得到的行人重识别的精确度越高。为了更好的提高模型的鲁棒性,一些有效的训练技巧也被应用到行人重识别领域。因 ...
【技术保护点】
1.一种多尺度卷积特征融合的行人重识别方法,其特征在于,具体按以下步骤实施:/n步骤1,数据预处理;/n步骤2,将Resnet-50卷积神经网络作为骨干网络,构建多层卷积神经网络,将步骤1得到的处理后的图像作为样本数据输入到多层卷积神经网络中,得到卷积后的特征图;/n步骤3,构建多尺度卷积神经单元;/n步骤4,计算原始特征距离,将查询目标行人图像和候选行人图像集中每个行人图像输入到经步骤3训练好的网络模型中,计算查询目标行人图像特征与候选行人集中每个行人图像特征的原始特征距离;/n步骤5,重排序策略,给定查询图像,通过将其k-倒数最近邻编码为单个向量来计算k-倒数特征,该单 ...
【技术特征摘要】 【专利技术属性】
1.一种多尺度卷积特征融合的行人重识别方法,其特征在于,具体按以下步骤实施:
步骤1,数据预处理;
步骤2,将Resnet-50卷积神经网络作为骨干网络,构建多层卷积神经网络,将步骤1得到的处理后的图像作为样本数据输入到多层卷积神经网络中,得到卷积后的特征图;
步骤3,构建多尺度卷积神经单元;
步骤4,计算原始特征距离,将查询目标行人图像和候选行人图像集中每个行人图像输入到经步骤3训练好的网络模型中,计算查询目标行人图像特征与候选行人集中每个行人图像特征的原始特征距离;
步骤5,重排序策略,给定查询图像,通过将其k-倒数最近邻编码为单个向量来计算k-倒数特征,该单个矢量用于在雅克比距离下重新排序,最终距离计算为原始距离与雅克比距离的组合。
2.根据权利要求1所述的一种多尺度卷积特征融合的行人重识别方法,其特征在于,所述步骤1具体操作包括以下步骤:
步骤1.1,将Resnet-50卷积网络作为骨干网络,将行人图片统一变换为长256宽128的大小,采用ImageNet中真实图像的RGB三通道均值和标准差来归一化输入图像,并使用随机翻转来进行数据增强;
步骤1.2,在经步骤1.1数据增强后,使用随机擦除增强策略来进行数据预处理。
3.根据权利要求1所述的一种多尺度卷积特征融合的行人重识别方法,其特征在于,所述步骤2具体操作包括以下步骤:
步骤2.1,将步骤1处理后的行人图片输入到网络中;骨干网络采用Resnet-50网络;
步骤2.2,提取特征图,分别提取Resnet-50网络卷积层第2阶段和第3阶段得到的特征图,并经Resnet-50网络第4阶段得到的特征图深度复制为两份,总共得到4个特征图。
4.根据权利要求1所述的一种多尺度卷积特征融合的行人重识别方法,其特征在于,所述步骤3具体操作包括以下步骤:将经步骤2得到的多层的卷积特征图经过池化处理以后进行特征拼接,使用动态学习率机制将得到的每一个特征向量进行独立分类,将池化后得到的特征向量通过一个卷积层、一个批量归一化层和一个ReLU层,通过tripletloss和softmaxloss损失将维数进一步降低到512维,最后使用梯度下降法优化得到分类损失,得到网络训练模型。
5.根据权利要求4所述的一种多尺度卷积特征融合的行人重识别方法,其特征在于,所述步骤3中构建多尺度卷积神经单元包括以下步骤:
步骤3.1,池化策略,将步骤2.2得到的经过卷积第2阶段和第3阶段得到的特征图,分别经过全局最大池化和全局平均池化,得到包含特征信息的1024维和2048维的特征向量;在ResNet-50的第4阶段之后,卷积核的步长由2变为1,然后将得到的特征图深度复制为两份,将经过第4阶段得到的深度复制以后的特征向量分别采用全局平均池化和全局最大池化策略,得到包含高层次特征信息的特征向量;
步骤3.2,学习率的设置,用前10个周期从3.5′10-5到3.5′10-4线性增加学习率;然后,在第40个和第70个学习周期,学习率分别下降到3.5′10-5和3.5′10-6;在第t个周期的学习率lr(t)计算为:
步骤3.3,在步骤3.2学习率设置的基础上,将经过步骤3.1得到的每一个特征向量进行独立分类,并将池化后得到的特征向量通过一个卷积层、一个批量归一化层和一个ReLU层;
步骤3.4,损失函数的设置,将步骤3.1得到的特征向量分别输入到损失函数中,softmax函数的公式表示为:
式中,Si代表的是第i个神经元的输出,zi为第i个节点的输出值,k为输出节点的个数,即分类的类别个数;
技术研发人员:廖开阳,邓轩,郑元林,章明珠,曹从军,李妮,
申请(专利权)人:西安理工大学,
类型:发明
国别省市:陕西;61
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。