【技术实现步骤摘要】
一种基于多尺度深度监督的反向注意力模型
[0001]本专利技术涉及行人重识别领域,特别是涉及一种基于多尺度深度监督的反向注意力模型。
技术介绍
[0002]行人重识别(Person Re
‑
Identification,PReID)是自动判断不同交通摄像头下或者同一个交通摄像头在不同时间内抓拍到的行人是否为同一个行人的任务。由于在智能视频监控系统应用中扮演着重要的角色,行人重识别近年来在计算机视觉领域中受到了广泛的关注。在现实场景中所拍摄到的行人分辨率较低,传统的生物特征信息无法准确地获得,目前该任务主要依靠行人的外貌特征去进行识别。然而,在不同场景以及时间下摄取到的行人图片存在着光照、姿态、视角以及背景的差异,甚至存在不同行人之间的体貌特征比相同行人之间的体貌特征更加相似的情况,使得行人重识别变成一个很有挑战性的计算机视觉任务。最近,深度学习技术被成功地应用在行人重识别领域中,极大地促进了该领域的发展。基于深度学习的行人重识别方法利用深度神经网络较佳的学习能力将特征学习以及度量学习融合于一个端到端的深度模 ...
【技术保护点】
【技术特征摘要】
1.一种基于多尺度深度监督的反向注意力模型,其特征在于:所述模型包括:输入端、多尺度特征学习模块、注意力机制模块、反向注意力机制模块、深度监督模块、若干个损失函数、若干个平均池化层、若干个线性层和若干个支路;所述输入端用来输入从若干个行人照片中提取到的不同层级的特征;所述多尺度特征学习模块用于对所述深度特征进行多尺度学习并进行训练,所述多尺度特征学习模块包括四个阶段:第一阶段、第二阶段、第三阶段和第四阶段,所述四个阶段输入特征组、输出特征图;所述注意力机制模块用于加强对局部重要特征信息的关注;所述反向注意力机制模块用于将被所述注意力机制模块抑制的特征变为强调的特征,与所述注意力机制进行互补;所述深度监督模块用于修正所述注意力机制模块对重要特征关注的准确度;所述支路包括支路1、支路2、支路3、支路4和支路5;所述多尺度特征学习模块、所述反向注意力模块、所述平均池化层、所述损失函数依次连接;所述多尺度特征学习模块的第二阶段通过所述注意力机制模块与所述深度监督模块、所述支路5、所述损失函数依次连接;所述多尺度特征学习模块的第三阶段通过所述注意力机制模块与所述深度监督模块、所述支路4、所述损失函数依次连接;所述多尺度特征学习模块的第一阶段、第二阶段、第三阶段、第四阶段、所述平均池化层、支路2依次连接;所述支路2与所述损失函数直接连接;所述支路2还通过所述支路3与所述损失函数连接。2.根据权利要求1所述的基于多尺度深度监督的反向注意力模型,其特征在于:所述多尺度特征学习模块中进行单维度卷积操作。3.根据权利要求1所述的基于多尺度深度监督的反向注意力模型,其特征在于:所述注意力机制模块包括通道注意力模块和空间注意力模块;其中所述通道注意力模块用于为特征通道输出一组权重值,所述空间注意力模块用于加强对局部重要特征信息的关注,所述通道注意力模块和所述空间注意力模块都是对所述多尺度特征学习模块在每个阶段都输出的特征图进行处理,将所述通道注意力模块与所述空间注意力模块进行融合:ATT=σ(ATT
C
×
ATT
S
)其中ATT为整个注意力机制模块的输出,σ代表Sigmoid函数,ATT
C
代表通道注意力模块的输出,ATT
S
代表空间注意力模块的输出。4.根据权利要求3所述的基于多尺度深度...
【专利技术属性】
技术研发人员:黄德双,吴迪,元昌安,赵仲秋,黄健斌,
申请(专利权)人:同济大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。