【技术实现步骤摘要】
一种多模态融合的人脸活体检测方法及系统
[0001]本专利技术涉及人脸识别
,特别是涉及一种多模态融合的人脸活体检测方法及系统。
技术介绍
[0002]近几年,由于深度学习技术的应用和大规模人脸库的建立,使人脸识别算法的准确率超过了人类对人脸识别的准确率。各行各业开始通过人脸识别技术赋能来减少人工参与的环节,提高生产效率。特别是现在智能手机普及之后,原有线下的服务也逐渐转移到线上来,大大提高了业务办理的便捷性。而使用人脸识别技术做用户实名认证时,不但需要判断采集的照片是否为本人,而且还需要判别采集的对象是否为活体。
[0003]目前,由于信息化程度越来越高,个人的照片很容易通过朋友圈等分享应用程序泄露出去,被他人收集用于攻击实名认证系统。在某些特殊的应用场景中,比如养老待遇领取时,攻击者可以利用事先录制的认证视频来攻击实名认证系统。甚至有些攻击者通过面具头套对实名认证系统进行攻击。仅仅根据RGB图像或者视频的活体检测方法的准确率一般无法令人满意,虽然红外双目摄像头和3D结构光摄像头这类硬件可以提高防攻击能力,但是普通手机大多数不具备该类硬件。
技术实现思路
[0004]本专利技术的目的是提供一种多模态融合的人脸活体检测方法及系统,以解决上述现有技术中的问题。
[0005]为实现上述目的,本专利技术提供了如下方案:
[0006]一种多模态融合的人脸活体检测方法,包括:
[0007]同时采集用户的人脸视频数据和多普勒频移信号数据,并对所述人脸视频数据和所述多普勒频移信 ...
【技术保护点】
【技术特征摘要】
1.一种多模态融合的人脸活体检测方法,其特征在于,包括:同时采集用户的人脸视频数据和多普勒频移信号数据,并对所述人脸视频数据和所述多普勒频移信号数据进行逐帧数据对齐处理,得到对齐后的多模态数据;将所述对齐后的多模态数据输入到多模态人脸活体动作识别模型中,识别所述用户的人脸动作,判断所述用户是否为活体。2.根据权利要求1所述的多模态融合的人脸活体检测方法,其特征在于,同时采集所述用户的人脸视频数据和多普勒频移信号数据,包括:设定采集速度与采集时间,通过摄像装置采集所述人脸视频数据的同时,通过扬声装置发出高频声波,由音频信号接收装置接收反射的声波信号,并对接收的所述声波信号进行过滤,完成所述人脸视频数据和多普勒频移信号数据的采集。3.根据权利要求1所述的多模态融合的人脸活体检测方法,其特征在于,对所述人脸视频数据和所述多普勒频移信号数据进行逐帧数据对齐处理,包括:抽取第i帧人脸视频数据,作为规范化人脸视频数据的第i
‑
1帧数据;取人脸视频数据的第i
‑
1帧与第i帧的时间戳中心点作为区间起始ts;取人脸视频数据的第i帧与第i+1帧视频时间戳中心点作为区间结束te;抽取多普勒频移信号数据中时间戳区间为[ts,te)的数据,作为规范化多普勒频移信号数据的第i
‑
1帧数据,进行处理;处理完成之后,得到逐帧对齐的规范化人脸视频数据和规范化多普勒频移信号数据;其中,从所述人脸视频数据的第二帧开始,一直到所述人脸数据的倒数第二帧为止进行处理。4.根据权利要求1所述的多模态融合的人脸活体检测方法,其特征在于,所述多模态人脸活体动作识别模型,包括:视频多尺度混合自注意力编码器:用于对规范化人脸视频数据进行编码处理,获得第三视频块特征;多普勒频移信号自注意力编码器:用于对规范化多普勒频移信号数据进行编码处理,获得第三音频特征;多模态数据融合编码器:用于将所述第三视频块特征和所述第三音频特征进行融合,得到融合多模态数据;人脸活体动作分类器:用于基于所述融合多模态数据识别人脸活体动作。5.根据权利要求4所述的多模态融合的人脸活体检测方法,其特征在于,对所述规范化人脸视频数据进行编码处理,包括:通过所述视频多尺度混合自注意力编码器,先使用三维卷积层进行卷积计算,获得第一视频块特征,将所述第一视频块特征输入到第一多尺度混合的自注意力编码单元中进行处理,得到第二视频块特征,再将所述第二视频块特征输入到第二多尺度混合的自注意力编码单元中进行处理,得到第三视频块特征。6.根据权利要求5所述的多模态融合的人脸活体检测方法,其特征在于,所述多尺度混合的自注意力编码单元进行处理的过程,包括:将所述第一视频块特征进行层标准化LN运算,得到第一计算结果;把所述第一计算结果输入到由3
×7×
7、3
×
视频块特征高/4
×
视频块特征宽/4和3
×
视频块特征高/2
×
视频块...
【专利技术属性】
技术研发人员:褚一平,黄叶珏,郑义,陈建勇,郁星星,张雪妮,陈士春,唐志学,朱华山,
申请(专利权)人:杭州海量信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。