活体检测方法技术

技术编号:39860935 阅读:16 留言:0更新日期:2023-12-30 12:55
本申请实施例公开一种活体检测方法

【技术实现步骤摘要】
活体检测方法、电子设备及存储介质


[0001]本申请涉及计算机
,特别涉及一种活体检测方法

电子设备及存储介质


技术介绍

[0002]随着人脸识别技术的快速发展,为人们的生产生活提供了诸多便利,但同时也对信息安全提出了新的挑战

一些不法分子常常通过合成人脸数据来伪造身份信息,以此通过人脸识别系统的身份核验,从而窃取个人信息

实施经济犯罪等不法活动,为了抵抗欺骗攻击,保护整个人脸识别系统的安全性,人脸活体检测技术应运而生

相关技术中,以人工智能
(Artificial Intelligence

AI)
合成攻击为例,活体检测模型可以判断出输入图像是真人人脸还是
AI
合成人脸,但是无法对活体攻击的详细原因做出解释


技术实现思路

[0003]本申请实施例提供一种活体检测方法

电子设备及存储介质,以解决相关技术中无法对活体攻击的详细原因做出解释的技术问题

[0004]根据本申请的第一方面,公开了一种活体检测方法,所述方法包括:
[0005]获取待检测对象的目标图像和对应的第一提示词;所述第一提示词用于指示第一视觉语言模型输出针对所述待检测对象的第一活体检测结果的原因解释信息;
[0006]将所述目标图像和所述第一提示词输入所述第一视觉语言模型,通过所述第一视觉语言模型根据所述目标图像和所述第一提示词对所述待检测对象进行活体检测,得到所述待检测对象的第一活体检测结果和针对所述第一活体检测结果的原因解释信息

[0007]根据本申请的第二方面,公开了一种活体检测方法,所述方法包括:
[0008]获取待检测对象的目标图像;
[0009]将所述目标图像输入活体检测模型,通过所述活体检测模型根据所述目标图像对所述待检测对象进行活体检测,得到第二活体检测结果;
[0010]根据所述第二活体检测结果,生成第二提示词;所述第二提示词用于指示第二视觉语言模型输出针对所述待检测对象的第二活体检测结果的原因解释信息;
[0011]将所述目标图像和所述第二提示词输入所述第二视觉语言模型,通过所述第二视觉语言模型根据所述目标图像和所述第二提示词对所述待检测对象进行活体检测,得到针对所述第二活体检测结果的原因解释信息

[0012]根据本申请的第三方面,公开了一种电子设备,包括存储器

处理器及存储在存储器上的计算机程序,所述处理器执行所述计算机程序以实现如第一方面中的活体检测方法;或者,所述处理器执行所述计算机程序以实现如第二方面中的活体检测方法

[0013]根据本申请的第四方面,公开了一种计算机可读存储介质,其上存储有计算机程序
/
指令,该计算机程序
/
指令被处理器执行时实现如第一方面中的活体检测方法;或者,该计算机程序
/
指令被处理器执行时实现如第二方面中的活体检测方法

[0014]根据本申请的第五方面,公开了一种计算机程序产品,包括计算机程序
/
指令,该
计算机程序
/
指令被处理器执行时实现如第一方面中的活体检测方法;或者,该计算机程序
/
指令被处理器执行时实现如第二方面中的活体检测方法

[0015]可见,本申请实施例中,对于需要进行活体检测的待检测对象的目标图像,可以将目标图像和对应的提示词输入视觉语言模型进行处理,得到待检测对象的活体检测结果和针对该活体检测结果的原因解释信息

由于在使用视觉语言模型进行活体检测时,同时输入目标图像和目标图像对应的提示词,这样,视觉语言模型在处理过程中除了参考目标图像的整个图像的视觉特征之外,同时还会参考提示词的文本特征,因此可以得到更明显

更全面

更精细和更有思维逻辑的活体特征和解释信息,从而在输出活体检测结果的同时一并输出详细的原因解释信息,改善了用户的使用体验,可以弥补单纯依靠视觉感知在活体攻击难例
(
例如高清屏幕翻拍,
AI
合成攻击等
)
上检出率低的略势,提高活体检测的真人通过率与攻击检出率

附图说明
[0016]图1是本申请实施例提供的一种活体检测方法的流程图之一;
[0017]图2是本申请实施例提供的一种活体检测方法的示例图;
[0018]图3是本申请实施例提供的视觉语言模型的处理过程的流程图;
[0019]图4是本申请实施例提供的视觉语言模型的结构图;
[0020]图5是本申请实施例提供的视觉语言模型的训练过程的流程图;
[0021]图6是本申请实施例提供的训练数据的生成过程的流程图;
[0022]图7是本申请实施例提供的一种活体检测方法的流程图之二;
[0023]图8是本申请实施例提供的一种活体检测装置的结构示意图之一;
[0024]图9是本申请实施例提供的一种活体检测装置的结构示意图之二;
[0025]图
10
是本申请实施例提供的一种电子设备的结构框图

具体实施方式
[0026]为使本申请的上述目的

特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请作进一步详细的说明

[0027]需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请实施例并不受所描述的动作顺序的限制,因为依据本申请实施例,某些步骤可以采用其他顺序或者同时进行

其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本申请实施例所必须的

[0028]近年来,基于人工智能的计算机视觉

深度学习

机器学习

图像处理

图像识别等技术研究取得了重要进展

人工智能
(Artificial Intelligence

AI)
是研究

开发用于模拟

延伸人的智能的理论

方法

技术及应用系统的新兴科学技术

人工智能学科是一门综合性学科,涉及芯片

大数据

云计算

物联网

分布式存储

深度学习

机器学习

神经网络等诸多技术种类

计算机视觉作为人工智能的一个重要分支本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种活体检测方法,其特征在于,所述方法包括:获取待检测对象的目标图像和对应的第一提示词;所述第一提示词用于指示第一视觉语言模型输出针对所述待检测对象的第一活体检测结果的原因解释信息;将所述目标图像和所述第一提示词输入所述第一视觉语言模型,通过所述第一视觉语言模型根据所述目标图像和所述第一提示词对所述待检测对象进行活体检测,得到所述待检测对象的第一活体检测结果和针对所述第一活体检测结果的原因解释信息
。2.
根据权利要求1所述的方法,其特征在于,所述通过所述第一视觉语言模型根据所述目标图像和所述第一提示词对所述待检测对象进行活体检测,得到所述待检测对象的第一活体检测结果和针对所述第一活体检测结果的原因解释信息,包括:通过所述第一视觉语言模型生成所述目标图像对应的视觉特征向量和所述第一提示词对应的文本特征向量;对所述视觉特征向量和所述文本特征向量进行双向编码处理,得到对齐后的融合特征向量;对所述融合特征向量进行解码处理,得到所述待检测对象的第一活体检测结果和针对所述第一活体检测结果的原因解释信息
。3.
根据权利要求2所述的方法,其特征在于,所述第一视觉语言模型包括:目标文本视觉多模态网络

目标连接网络和目标语言处理网络,所述目标连接网络连接在所述目标文本视觉多模态网络之后,所述目标语言处理网络连接在所述目标连接网络之后;通过所述目标文本视觉多模态网络生成所述目标图像对应的视觉特征向量和所述第一提示词对应的文本特征向量;通过所述目标连接网络对所述视觉特征向量和所述文本特征向量进行双向编码处理,得到对齐后的融合特征向量;通过所述目标语言处理网络对所述融合特征向量进行解码处理,得到所述待检测对象的第一活体检测结果和针对所述第一活体检测结果的原因解释信息
。4.
根据权利要求3所述的方法,其特征在于,所述第一视觉语言模型的训练过程包括:获取初始文本视觉多模态网络

初始连接网络和初始语言处理网络;基于第一训练数据,对所述初始文本视觉多模态网络进行单独训练,得到所述目标文本视觉多模态网络;所述第一训练数据包括:多个不同的第一样本人脸图像

各个第一样本人脸图像的分类标签所对应的词语

开源的多模态数据集中的图像及其对应的词语;固定所述目标文本视觉多模态网络和所述初始语言处理网络,基于第二训练数据,对所述初始连接网络进行训练,得到所述目标连接网络;所述第二训练数据包括:多个不同的第二样本人脸图像

各个第二样本人脸图像的分类标签所对应的提示词和真实原因解释信息;固定所述目标文本视觉多模态网络和所述目标连接网络,基于第三训练数据,对所述初始语言处理网络进行训练,得到所述目标语言处理网络;所述第三训练数据包括:多个不同的第三样本人脸图像

各个第三样本人脸图像的分类标签所对应的提示词和真实原因解释信息
。5.
根据权利要...

【专利技术属性】
技术研发人员:曹子祺金宇林赵荔罗卓群
申请(专利权)人:北京旷视科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1