【技术实现步骤摘要】
活体检测方法、电子设备及存储介质
[0001]本申请涉及计算机
,特别涉及一种活体检测方法
、
电子设备及存储介质
。
技术介绍
[0002]随着人脸识别技术的快速发展,为人们的生产生活提供了诸多便利,但同时也对信息安全提出了新的挑战
。
一些不法分子常常通过合成人脸数据来伪造身份信息,以此通过人脸识别系统的身份核验,从而窃取个人信息
、
实施经济犯罪等不法活动,为了抵抗欺骗攻击,保护整个人脸识别系统的安全性,人脸活体检测技术应运而生
。
相关技术中,以人工智能
(Artificial Intelligence
,
AI)
合成攻击为例,活体检测模型可以判断出输入图像是真人人脸还是
AI
合成人脸,但是无法对活体攻击的详细原因做出解释
。
技术实现思路
[0003]本申请实施例提供一种活体检测方法
、
电子设备及存储介质,以解决相关技术中无法对活体攻击的详细原因做出解释的技术问题
。
[0004]根据本申请的第一方面,公开了一种活体检测方法,所述方法包括:
[0005]获取待检测对象的目标图像和对应的第一提示词;所述第一提示词用于指示第一视觉语言模型输出针对所述待检测对象的第一活体检测结果的原因解释信息;
[0006]将所述目标图像和所述第一提示词输入所述第一视觉语言模型,通过所述第一视觉语言模型根据所述目标图像和所述第一 ...
【技术保护点】
【技术特征摘要】
1.
一种活体检测方法,其特征在于,所述方法包括:获取待检测对象的目标图像和对应的第一提示词;所述第一提示词用于指示第一视觉语言模型输出针对所述待检测对象的第一活体检测结果的原因解释信息;将所述目标图像和所述第一提示词输入所述第一视觉语言模型,通过所述第一视觉语言模型根据所述目标图像和所述第一提示词对所述待检测对象进行活体检测,得到所述待检测对象的第一活体检测结果和针对所述第一活体检测结果的原因解释信息
。2.
根据权利要求1所述的方法,其特征在于,所述通过所述第一视觉语言模型根据所述目标图像和所述第一提示词对所述待检测对象进行活体检测,得到所述待检测对象的第一活体检测结果和针对所述第一活体检测结果的原因解释信息,包括:通过所述第一视觉语言模型生成所述目标图像对应的视觉特征向量和所述第一提示词对应的文本特征向量;对所述视觉特征向量和所述文本特征向量进行双向编码处理,得到对齐后的融合特征向量;对所述融合特征向量进行解码处理,得到所述待检测对象的第一活体检测结果和针对所述第一活体检测结果的原因解释信息
。3.
根据权利要求2所述的方法,其特征在于,所述第一视觉语言模型包括:目标文本视觉多模态网络
、
目标连接网络和目标语言处理网络,所述目标连接网络连接在所述目标文本视觉多模态网络之后,所述目标语言处理网络连接在所述目标连接网络之后;通过所述目标文本视觉多模态网络生成所述目标图像对应的视觉特征向量和所述第一提示词对应的文本特征向量;通过所述目标连接网络对所述视觉特征向量和所述文本特征向量进行双向编码处理,得到对齐后的融合特征向量;通过所述目标语言处理网络对所述融合特征向量进行解码处理,得到所述待检测对象的第一活体检测结果和针对所述第一活体检测结果的原因解释信息
。4.
根据权利要求3所述的方法,其特征在于,所述第一视觉语言模型的训练过程包括:获取初始文本视觉多模态网络
、
初始连接网络和初始语言处理网络;基于第一训练数据,对所述初始文本视觉多模态网络进行单独训练,得到所述目标文本视觉多模态网络;所述第一训练数据包括:多个不同的第一样本人脸图像
、
各个第一样本人脸图像的分类标签所对应的词语
、
开源的多模态数据集中的图像及其对应的词语;固定所述目标文本视觉多模态网络和所述初始语言处理网络,基于第二训练数据,对所述初始连接网络进行训练,得到所述目标连接网络;所述第二训练数据包括:多个不同的第二样本人脸图像
、
各个第二样本人脸图像的分类标签所对应的提示词和真实原因解释信息;固定所述目标文本视觉多模态网络和所述目标连接网络,基于第三训练数据,对所述初始语言处理网络进行训练,得到所述目标语言处理网络;所述第三训练数据包括:多个不同的第三样本人脸图像
、
各个第三样本人脸图像的分类标签所对应的提示词和真实原因解释信息
。5.
根据权利要...
【专利技术属性】
技术研发人员:曹子祺,金宇林,赵荔,罗卓群,
申请(专利权)人:北京旷视科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。