【技术实现步骤摘要】
一种用于无约束视频人脸识别的特征图聚合方法
本专利技术涉及视频人脸识别
,具体涉及一种用于无约束视频人脸识别的特征图聚合方法。
技术介绍
随着深度学习的发展,人脸识别技术被广泛应用于交通、安防和刑侦等领域,特别在对静态图像的识别中取得了极大的进展。然而,随着监控和移动设备中摄像机的广泛使用,在实际应用中,人脸识别的对象更多的是连续变化的视频人脸而非单一的静态人脸图像。相比静态人脸图像,视频中无约束的运动人脸导致巨大的姿态变化及运动模糊,不同时间段的视频帧仅具有部分人脸信息。而对整个的视频序列而言,视频人脸具有多视图和时间信息。因此,利用视频人脸序列的多视图和时间信息来表示视频人脸能够反映更加全面的人脸信息。视频人脸识别的场景一般具有V2S(Video-to-Still)、S2V(Still-to-Video)以及V2V(Video-to-Video)三种设置,具体而言,对V2S模式下,用于搜寻的人脸底库由静态图像组成,目标人脸为一组视频序列。在这些场景中,不论是1:1的人脸验证还是1:N的人脸识别问题,图像间匹配的问题 ...
【技术保护点】
1.一种用于无约束视频人脸识别的特征图聚合方法,其特征在于:包括如下步骤:/nS1:使用深度卷积神经网络获取视频人脸中每帧人脸对应的多通道特征图;/nS2:对视频人脸对应的全部多通道特征图以通道为单位进行重构,使得每个通道内包含全部人脸帧在该通道的特征图;/nS3:使用特征图质量感知模块获得步骤S2中重构后的各通道内的特征图的对应质量分数;/nS4:根据获取的对应质量分数,将各通道内多张特征图自适应的聚合为一张特征图;/nS5:将聚合后的多通道特征图降维为一个特征向量,将该特征向量作为聚合所得的视频人脸表示。/n
【技术特征摘要】
1.一种用于无约束视频人脸识别的特征图聚合方法,其特征在于:包括如下步骤:
S1:使用深度卷积神经网络获取视频人脸中每帧人脸对应的多通道特征图;
S2:对视频人脸对应的全部多通道特征图以通道为单位进行重构,使得每个通道内包含全部人脸帧在该通道的特征图;
S3:使用特征图质量感知模块获得步骤S2中重构后的各通道内的特征图的对应质量分数;
S4:根据获取的对应质量分数,将各通道内多张特征图自适应的聚合为一张特征图;
S5:将聚合后的多通道特征图降维为一个特征向量,将该特征向量作为聚合所得的视频人脸表示。
2.根据权利要求1所述的一种用于无约束视频人脸识别的特征图聚合方法,其特征在于:所述步骤S1中深度卷积神经网络具体为:
使用ResNet101网络作为基础DCNN的主体网络架构,保留ResNet101网络中conv1,conv2_x,conv3_x,conv4_x,conv5_x五个部分,丢弃conv5_x后的averagepool,1000-dfc以及softmax层,其中,由conv5_x部分输出的各通道特征图组成的特征图集作为聚合模块的输入用于聚合任务。
3.根据权利要求1所述的一种用于无约束视频人脸识别的特征图聚合方法,其特征在于:所述步骤S3中对应质量分数的获取过程具体为:
特征图质量感知模块使用一个浅层的神经...
【专利技术属性】
技术研发人员:王海涛,王怀斌,罗秋凤,张鲁洋,王海龙,刘强,
申请(专利权)人:南京航空航天大学,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。