一种基于知识蒸馏的行人重识别方法技术

技术编号：29704394 阅读：10 留言：0更新日期：2021-08-17 14:33

本发明专利技术涉及一种基于知识蒸馏的行人重识别方法，该方法建立结构完整行人网络和部分行人网络，以完整行人图像训练完整行人网络，以随机截取的部分图像训练部分行人网络，当损失不再下降，两个网络的训练结束；对于待预测图像，若待预测图像是完整行人图像，则输入训练好的完整行人网络中，否则输入训练好的部分行人网络中，计算待预测图像的特征与数据库中各图像的特征之间的距离，根据距离由大到小的顺序输出与待预测图像的特征之间距离排在前M的图像。本发明专利技术方法通过损失计算将完整行人网络和部分行人网络进行联合，提高了检测结果的鲁棒性。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于知识蒸馏的行人重识别方法
本专利技术涉及图像识别
，特别涉及基于知识蒸馏的行人重识别方法。
技术介绍
当前的部分行人重识别研究中面临的一大难题是训练数据集的缺乏，为此，一些部分行人重识别方法会利用随机裁剪的方式从完整行人图像获得部分行人图像，例如：方法1用二分类网络判断输入的图像是否是完整图像来使网络学习到关于遮挡的隐藏知识；方法2，VPM的方法，核心思路是运用自监督的方式，使模型能感知到图像区域的可见性；方法3，在网络中嵌入空间转换网络模块，来实现部分图像与完整图像的自动匹配。然而这些方法都没有考虑完整行人图像和部分行人图像在特征空间上的差异。从数据的角度上说，完整图像和部分图像服从不一样的概率分布，因此在它们之间实际上就存在着领域间隔(domaingap)的问题。在行人重识别中领域间隔问题是广泛存在的，以下几种受到较多研究者的关注：1)不同数据集之间的间隔；2)同一数据集中不同的摄像头之间的间隔；3)RGB-红外模态图像之间的间隔。值得指出的是，部分行人重识别问题也属于一种领域间隔问题，因此也可以用类似的范式加以解决。
技术实现思路
针对现有技术存在的上述问题，本专利技术的要解决的技术问题是：现有方法输出的图像特征缺少全局相关性知识而不够鲁棒。为解决上述技术问题，本专利技术采用如下技术方案：一种基于知识蒸馏的行人重识别方法，包括如下步骤：S100：建立完整行人网络和部分行人网络，所述完整行人网络和部分行人网络具有相同的网络结构。S200：从现有的公开数据集...

【技术保护点】
1.一种基于知识蒸馏的行人重识别方法，其特征在于，包括如下步骤：/nS100：建立完整行人网络和部分行人网络，所述完整行人网络和部分行人网络具有相同的网络结构；/nS200：从现有的公开数据集中获取多张完整行人图像构建数据库，将完整行人图像随机裁剪得到部分行人图像，初始化完整行人网络和部分行人网络的参数；/n对于完整行人网络，以完整行人图像作为训练样本，提取训练样本的特征进行完整行人网络训练，对于每个训练样本，计算完整行人网络输出与对应的样本真实身份标签间的损失，反向传播更新完整行人网络参数，当损失不再下降，训练结束；/n对于部分行人网络，以部分行人图像作为训练样本，提取训练样本的特征进行部分行人网络的训练，对于每个训练样本，计算部分行人网络输出与对应的样本真实身份标签间的损失，反向传播更新部分行人网络参数，当损失不再下降，训练结束；/nS300：对于待预测图像，若待预测图像是完整行人图像，则将待预测图像输入训练好的完整行人网络中，训练好的完整行人网络计算待预测图像的特征与数据库中各图像的特征之间的距离，根据距离由大到小的顺序输出与待预测图像的特征之间距离排在前M的图像；/n若待预测图...

【技术特征摘要】
1.一种基于知识蒸馏的行人重识别方法，其特征在于，包括如下步骤：
S100：建立完整行人网络和部分行人网络，所述完整行人网络和部分行人网络具有相同的网络结构；
S200：从现有的公开数据集中获取多张完整行人图像构建数据库，将完整行人图像随机裁剪得到部分行人图像，初始化完整行人网络和部分行人网络的参数；
对于完整行人网络，以完整行人图像作为训练样本，提取训练样本的特征进行完整行人网络训练，对于每个训练样本，计算完整行人网络输出与对应的样本真实身份标签间的损失，反向传播更新完整行人网络参数，当损失不再下降，训练结束；
对于部分行人网络，以部分行人图像作为训练样本，提取训练样本的特征进行部分行人网络的训练，对于每个训练样本，计算部分行人网络输出与对应的样本真实身份标签间的损失，反向传播更新部分行人网络参数，当损失不再下降，训练结束；
S300：对于待预测图像，若待预测图像是完整行人图像，则将待预测图像输入训练好的完整行人网络中，训练好的完整行人网络计算待预测图像的特征与数据库中各图像的特征之间的距离，根据距离由大到小的顺序输出与待预测图像的特征之间距离排在前M的图像；
若待预测图像是部分行人图像，则将待预测图像输入训练好的部分行人网络中，训练好的部分行人网络计算待预测图像的特征与数据库中各图像的特征之间的距离，根据距离由大到小的顺序输出与待预测图像的特征之间距离排在前M的图像。

2.如权利要求1所述的基于知识蒸馏的行人重识别方法，其特征在于，所述S100建立的完整行人网络Nh和部分行人网络Np以ResNet-50作为骨干网络，将每个图像映射到固定大小的向量表示，Rw×H×3→RD；
对原始的ResNet-50做了如下修改：将原始的ResNet-50最后一个ReLU激活函数和最终的分类层均使用BNNeck层代替，将原始的ResNet-50最后一个残差块的步长从2减小到1。

3.如权利要求...

【专利技术属性】
技术研发人员：葛永新，谢佳宏，李文鑫，郭帧廷，张俊银，华博誉，
申请(专利权)人：重庆大学，
类型：发明
国别省市：重庆;50

全部详细技术资料下载我是这个专利的主人