【技术实现步骤摘要】
一种基于多部件自注意力机制的行人重识别方法
本专利技术属于人工智能及计算机视觉
,尤其涉及一种基于多部件自注意力机制的行人重识别方法。
技术介绍
随着城市化进程的加快,公共安全已成为了人们日益关注的焦点和需求。大学校园、主题公园、医院、街道等许多重要的公共卫生区域都广泛覆盖了监控摄像头,为利用计算机视觉技术自动化监控创造了良好的客观条件。近年来,行人重识别作为视频监控领域的一个重要研究方向,日益受到人们的关注。具体来说,行人重识别是指在跨摄像头、跨场景下利用计算机视觉技术判断图像或视频序列中是否存在特定行人的技术。作为人脸识别技术的重要补充,该技术能够根据行人的穿着、体态、发型等信息认知行人,在实际监控场景下对无法获取清晰拍摄人脸的行人进行跨摄像头连续跟踪,增强数据的时空连续性,有助于节省大量的人力物力,具有重要的研究意义。在开放环境下,由于监控场景复杂多变,采集的行人图像往往存在背景噪音、光照变化、姿态改变、严重遮挡等干扰因素,而现有的识别模型不能很好地关注具有强判别性、高区分度的区域,导致提取的特征不够鲁棒,识别性能不佳。因此,目前亟待提出一种能够准确提取强判别性、高区分度特征的行人重识别方法。
技术实现思路
本专利技术的目的在于针对现有方法的不足,提出了一种基于多部件自注意力机制的行人重识别方法。该方法利用现有深度学习的优势,通过深度残差神经网络提取特征;构建了基于多部件自注意力机制的识别模型,分部件、多分支、高融合地提取行人特征,扩大了注意力激活范围,更广泛充分地关注 ...
【技术保护点】
1.一种基于多部件自注意力机制的行人重识别方法,其特征在于,包括以下步骤:/nS1:预训练深度卷积神经网络骨干模型
【技术特征摘要】 【专利技术属性】
1.一种基于多部件自注意力机制的行人重识别方法,其特征在于,包括以下步骤:
S1:预训练深度卷积神经网络骨干模型;
S2:对骨干模型进行分段:和,其中对应骨干模型最后一层
残差网络,将深度拷贝2份,得到三条支路:,,,在支
路后构建多部件自注意力网络,获得行人的多部件自注意力特征;
S3:将多部件自注意力特征输入分类器,联合训练最小化交叉熵损失和度量
损失;
S4:将测试集图片输入训练好的模型,融合输出的部件特征获得整体特征,经度量排
序实现行人重识别。
2.如权利要求1所述基于多部件自注意力机制的行人重识别方法,其特征在于,所述的
步骤S1具体为:深度卷积神经网络骨干模型采用,并在数据集上进行预
训练,使获得初始值。
3.如权利要求2所述基于多部件自注意力机制的行人重识别方法,其特征在于,所述的步骤S2包括以下子步骤:
S2.1:令和,,对应的学习参数为和,的初始化参数一致;行人图像
经过再分别经过,,后,对应提取到的特征图分别为,,,其中,C为特征图通道数,H为特征图的高,W为特
征图的宽,计算公式为:
其中,T表示矩阵转置函数;
S2.2:在后建立分支:基于局部部件的自注意力网络;输入,输出
特征集合,网络参数为;
S2.3:在后建立分支:基于全局部件的自注意力网络;输入,输出特
征向量,网络参数为;
S2.4:在后建立分支:基于全局部件的特征映射网络;输入,输
出特征向量,网络参数为;
S2.5:,,共同组成多部件自注意力特征集合。
4.如权利要求3所述基于多部件自注意力机制的行人重识别方法,其特征在于,所述步
骤S2.2中的包括以下子步骤:
S2.2.1:对于,对其在高度上进行水平平均分割,形成特征图和;
S2.2.2:对于输入,通过三条支路:特征映射模块,空间自注意
力模块,通道自注意力模块;对应地,提取到的特征图分别为,,,包括以下子步骤:
(a)对于输入,映射关系的计算方式为:
(b)对于输入,空间自注意力模块具体为:对于任意的特征向量,在空间尺度上对其进行自注意力关系建
模,得到关系矩阵;对于的每一个值,计算公式为:
将关系矩阵作用于,并以残差的形式融入网络,得到更新后的特征图,
计算公式为:
其中,为模块的参数,表示矩阵相乘;
(c)对于输入,通道自注意力模块具体为:对于任意的特征向量,在通道尺度上对其进行自注意力关系建模,得到关系矩
阵;对于的每一个值,计算公式为:
将关系矩阵作用于与,得到更新后的特征图,计算公式为:
其中,为模块的参数,表示矩阵相乘;
S2.2.3:把,,进行融合,得到输出特征图,计算
方式为:
S2.2.4:对于,操作方式与一致,得到经过的输出特征图,且与共享参数和;
S2.2.5:对和进行全局平均池化,得到特征向量集合:
技术研发人员:陆易,叶喜勇,徐晓刚,张逸,张文广,祝敏航,
申请(专利权)人:之江实验室,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。