一种图像识别方法及相关装置制造方法及图纸

技术编号:33132404 阅读:23 留言:0更新日期:2022-04-17 00:52
本申请实施例公开了一种人工智能领域的图像识别方法及相关装置,其中该方法包括:获取包括目标对象面部的目标视频,对目标视频进行分帧处理得到按序排列的多帧视频图像;对多帧视频图像进行特征提取处理,得到按序排列的多个目标特征图;对多个目标特征图先进行空间压缩处理,后进行时间压缩处理,得到后融合全局特征向量;对多个目标特征图先进行时间压缩处理,后进行空间压缩处理,得到前融合全局特征向量;根据后融合全局特征向量和前融合全局特征向量,确定面部检测结果。该方法能够提高对于视频中的对象面部的检测准确性。对于视频中的对象面部的检测准确性。对于视频中的对象面部的检测准确性。

【技术实现步骤摘要】
一种图像识别方法及相关装置


[0001]本申请涉及人工智能
,尤其涉及一种图像识别方法及相关装置。

技术介绍

[0002]随着人脸识别技术的逐渐成熟,人脸验证系统如今在各种应用场景中被广泛应用。例如,在电子支付场景中,可以利用人脸验证系统验证支付用户的身份,从而保证线上电子支付的安全性;又例如,在账户登录场景中,也可以利用人脸验证系统校验请求登录某账户的用户是否为该账户的合法用户,从而保证账户登录的安全性,等等。
[0003]在实际应用中,为了避免不法分子使用录制的视频或者伪造的面具绕过人脸验证系统,人脸验证系统除了需要识别所验证的人脸是否为特定的人脸外,还需要识别所验证的人脸是否为真实的人脸,即识别在验证过程中采集的图像中的对象面部是否为活体面部。
[0004]然而,经本申请专利技术人研究发现,相关技术中用于验证活体面部的方法的实现效果普遍不够理想,即这些方法难以准确地验证图像中的对象面部是否为活体面部,容易发生将图像中的非活体面部误识别为活体面部的情况,使得不法分子有机可乘。

技术实现思路
<br/>[0005]本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种图像识别方法,其特征在于,所述方法包括:获取目标视频,所述目标视频中包括待验证的目标对象的面部;对所述目标视频进行分帧处理,得到所述目标视频中按序排列的多帧视频图像;对所述多帧视频图像进行特征提取处理,得到与所述多帧视频图像对应的按序排列的多个目标特征图;针对所述多个目标特征图分别进行空间维度的特征提取处理,得到所述多个目标特征图各自对应的特征向量;基于所述多个目标特征图各自对应的特征向量,进行时间维度的特征提取处理,得到后融合全局特征向量;基于所述多个目标特征图进行时间维度的特征提取处理,得到时间压缩特征图;对所述时间压缩特征图进行空间维度的特征提取处理,得到前融合全局特征向量;根据所述后融合全局特征向量和所述前融合全局特征向量,确定所述目标对象对应的面部检测结果。2.根据权利要求1所述的方法,其特征在于,所述对所述多帧视频图像进行特征提取处理,得到与所述多帧视频图像对应的按序排列的多个目标特征图,包括:通过二维卷积结构,对所述多帧视频图像分别进行特征提取处理,得到所述多帧视频图像各自对应的一级特征图;针对每帧所述视频图像,根据所述视频图像对应的一级特征图、以及与所述视频图像相邻的视频图像对应的一级特征图,确定所述视频图像对应的运动特征;根据所述视频图像对应的一级特征图和运动特征,确定所述视频图像对应的二级特征图;根据所述多帧视频图像各自对应的二级特征图,确定所述多个目标特征图。3.根据权利要求2所述的方法,其特征在于,所述根据所述视频图像对应的一级特征图、以及与所述视频图像相邻的视频图像对应的一级特征图,确定所述视频图像对应的运动特征,包括:确定排列在所述视频图像前、且与所述视频图像相邻的视频图像,作为所述视频图像的相邻视频图像;基于通道门控机制,利用所述视频图像对应的一级特征图中的各个元素与其相邻视频图像对应的一级特征图中的各个元素做差,得到运动特征权重;基于所述运动特征权重,对所述视频图像对应的一级特征图中的各个元素进行加权处理,得到所述视频图像对应的运动特征。4.根据权利要求2所述的方法,其特征在于,所述根据所述多帧视频图像各自对应的二级特征图,确定所述多个目标特征图,包括:针对每帧所述视频图像,根据所述视频图像的排列位置和预设窗口范围,在所述多帧视频图像中确定与所述视频图像相关的参考视频图像;针对每帧所述视频图像,通过三维卷积结构,基于所述视频图像对应的二级特征图、以及与所述视频图像相关的各参考视频图像各自对应的二级特征图,进行短时时空特征融合,得到所述视频图像对应的三级特征图;根据所述多帧视频图像各自对应的三级特征图,确定所述多个目标特征图。5.根据权利要求4所述的方法,其特征在于,所述根据所述多帧视频图像各自对应的三级特征图,确定所述多个目标特征图,包括:
当所述视频图像为第一帧视频图像时,通过对应的循环神经网络结构,基于所述视频图像对应的三级特征图进行多次特征提取处理,得到所述视频图像对应的目标特征图;在所述多次特征提取处理的过程中,产生所述视频图像对应的空间积累信息和时间积累信息;当所述视频图像并非第一帧视频图像时,确定位于所述视频图像前、且与所述视频图像相邻的视频图像,作为相邻视频图像;通过对应的循环神经网络结构,基于所述视频图像对应的三级特征图、以及所述相邻视频图像对应的空间积累信息、时间积累信息和目标特征图,进行多次特征提取处理,得到所述视频图像对应的目标特征图。6.根据权利要求1所述的方法,其特征在于,所述针对所述多个目标特征图分别进行空间维度的特征提取处理,得到所述多个目标特征图各自对应的特征向量;基于所述多个目标特征图各自对应的特征向量,进行时间维度的特征提取处理,得到后融合全局特征向量,包括:通过二维卷积结构和池化结构,对每个所述目标特征图进行空间维度的特征提取处理,得到每个所述目标特征图对应的特征向量;根据所述多个目标特征图各自对应的特征向量,构建特征矩阵;通过多个一维卷积结构,分别对所述特征矩阵进行时间维度的特征提取处理,得到多个时间压缩特征向量;所述多个一维卷积结构分别对应不同的窗口宽度;根据所述多个时间压缩特征向量,确定所述后融合全局特征向量。7.根据权利要求6所述的方法,其特征在于,所述通过多个一维卷积结构,分别对所述特征矩阵进行时间维度的特征提取处理,得到多个时间压缩特征向量,包括:针对每个所述一维卷积...

【专利技术属性】
技术研发人员:陈观钦陈远王摘星陈斌
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1