基于深度学习的活体检测方法、装置及存储介质制造方法及图纸

技术编号:27191841 阅读:29 留言:0更新日期:2021-01-31 11:33
本申请公开了一种基于深度学习的活体检测方法、装置及存储介质。其中,该方法,包括:获取与待识别对象相关的视频,其中所述视频中包含所述待识别对象的嘴部区域图像,其中所述视频是通过在所述待识别对象读取第一文本信息的过程中对所述待识别对象进行拍摄而获得的视频;利用基于深度学习训练的识别模型,生成与所述嘴部区域图像对应的唇语信息;以及根据所述唇语信息以及所述第一文本信息,判定所述待识别对象是否为活体。达到了整个基于深度学习的唇语活体检测方法的具有较强的泛化能力、流程简单可靠以及识别准确率高的技术效果。流程简单可靠以及识别准确率高的技术效果。流程简单可靠以及识别准确率高的技术效果。

【技术实现步骤摘要】
基于深度学习的活体检测方法、装置及存储介质


[0001]本申请涉及信息识别领域,特别是涉及一种基于深度学习的活体检测方法、装置及存储介质。

技术介绍

[0002]活体检测是在一些身份验证场景确定对象真实生理特征的方法,在人脸识别应用中,活体检测能通过眨眼、张嘴、摇头、点头等组合动作,使用人脸关键点定位和人脸追踪等技术,验证用户是否为真实活体本人操作。可有效抵御照片、换脸、面具、遮挡以及屏幕翻拍等常见的攻击手段,从而帮助用户甄别欺诈行为,保障用户的利益。当前使用嘴部信息进行活体检测的方法主要是有两个方法:
[0003]一方法是从待测人脸视频中抽取若干视频帧,获取从待测人脸视频中抽取的每一所述视频帧的嘴部的若干关键点位置,通过所述嘴部的若干关键点位置获取每一抽取的所述视频帧的嘴部的嘴部长度和嘴部宽度,并通过计算所述嘴部长度和所述嘴部宽度的比值获取对应的所述视频帧的嘴部数值,基于每一抽取的所述视频帧的所述嘴部数值判断所述待测人脸视频的嘴部运动的情况。
[0004]另一方法是采集待识别的用户在读取验证内容时的视频信息,根据所述视频信息获取所述用户的嘴部特征信息,判断所述用户的嘴部特征信息与唇语库中所述验证内容对应的参考唇语特征序列是否相匹配,若匹配,则将所述待识别的用户确认为活体。
[0005]上述第一个方法的泛化能力不好,稍微侧脸就能影响活体检测结果,第二方法的缺点就是必须先让用户将自己的特定的嘴部信息录入数据库,具体实施繁琐难度较大。
[0006]针对上述的现有技术中存在的现有的活体检测方法存在泛化能力差以及具体实施繁琐难度较大的技术问题,目前尚未提出有效的解决方案。

技术实现思路

[0007]本公开的实施例提供了一种基于深度学习的活体检测方法、装置及存储介质,以至少解决现有技术中存在的现有的活体检测方法存在泛化能力差以及具体实施繁琐难度较大的技术问题。
[0008]根据本公开实施例的一个方面,提供了一种基于深度学习的活体检测方法,包括:获取与待识别对象相关的视频,其中视频中包含待识别对象的嘴部区域图像,其中视频是通过在待识别对象读取第一文本信息的过程中对待识别对象进行拍摄而获得的视频;利用基于深度学习训练的识别模型,生成与嘴部区域图像对应的唇语信息;以及根据唇语信息以及第一文本信息,判定待识别对象是否为活体。
[0009]根据本公开实施例的另一个方面,还提供了一种存储介质,存储介质包括存储的程序,其中,在程序运行时由处理器执行以上所述的方法。
[0010]根据本公开实施例的另一个方面,还提供了一种基于深度学习的活体检测装置,包括:获取模块,用于获取与待识别对象相关的视频,其中视频中包含待识别对象的嘴部区
域图像,其中视频是通过在待识别对象读取第一文本信息的过程中对待识别对象进行拍摄而获得的视频;识别模块,用于利用基于深度学习训练的识别模型,生成与嘴部区域图像对应的唇语信息;以及判定模块,用于根据唇语信息以及第一文本信息,判定待识别对象是否为活体。
[0011]根据本公开实施例的另一个方面,还提供了一种基于深度学习的唇语活体检测装置,包括:处理器;以及存储器,与处理器连接,用于为处理器提供处理以下处理步骤的指令:获取与待识别对象相关的视频,其中视频中包含待识别对象的嘴部区域图像,其中视频是通过在待识别对象读取第一文本信息的过程中对待识别对象进行拍摄而获得的视频;利用基于深度学习训练的识别模型,生成与嘴部区域图像对应的唇语信息;以及根据唇语信息以及第一文本信息,判定待识别对象是否为活体。
[0012]在本公开实施例中,可以快速地识别出待识别对象在读取文本信息时的唇语信息。并且通过将所识别的唇语信息与待识别对象读取的文本信息进行匹配,即可判定待识别对象是否为活体。由于识别模型为基于深度学习训练的识别模型,该识别模型能很好的对较长的序列信息进行识别,同时具有很高的识别率。因而基于该识别模型,可以快速并且准确的识别出与嘴部区域图像对应的唇语信息,并将识别的唇语信息以及文本信息进行匹配。从而,根据本公开实施例所记载的技术方案,能够快速地判定待识别对象是否为活体。此外,基于深度学习的活体检测方法具有较强的泛化能力、流程简单可靠以及识别准确率高的技术效果,进而解决了现有的活体检测方法存在泛化能力差以及具体实施繁琐难度较大的技术问题。
附图说明
[0013]此处所说明的附图用来提供对本公开的进一步理解,构成本申请的一部分,本公开的示意性实施例及其说明用于解释本公开,并不构成对本公开的不当限定。在附图中:
[0014]图1是用于实现根据本公开实施例1所述的方法的【计算机终端(或移动设备)】的硬件结构框图;
[0015]图2是根据本公开实施例1的第一个方面所述的基于深度学习的活体检测方法的流程示意图;
[0016]图3是根据本公开实施例1的第一个方面所述的Transformer模型的结构示意图;
[0017]图4是根据本公开实施例2所述的基于深度学习的活体检测装置的示意图;以及
[0018]图5是根据本公开实施例3所述的基于深度学习的活体检测装置的示意图。
具体实施方式
[0019]为了使本
的人员更好地理解本公开的技术方案,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本公开一部分的实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本公开保护的范围。
[0020]需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用
的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0021]首先,在对本公开实施例进行描述的过程中出现的部分名词或术语适用于如下解释:
[0022]转换器模型:本申请中所述的转换器模型为“transformer model”的中文翻译,是谷歌公司推出的用于自然语言处理的模型。后文中也称为“transformer模型”[0023]实施例1
[0024]根据本实施例,提供了一种基于深度学习的活体检测方法的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
[0025]本实施例所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。图1示出了一种用于实本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的活体检测方法,其特征在于,包括:获取与待识别对象相关的视频,其中所述视频中包含所述待识别对象的嘴部区域图像,其中所述视频是通过在所述待识别对象读取第一文本信息的过程中对所述待识别对象进行拍摄而获得的视频;利用基于深度学习训练的识别模型,生成与所述嘴部区域图像对应的唇语信息;以及根据所述唇语信息以及所述第一文本信息,判定所述待识别对象是否为活体。2.根据权利要求1所述的方法,其特征在于,所述识别模型包括基于图像特征提取的特征提取模型和基于自然语言处理的转换模型,并且利用所述识别模型,生成与所述嘴部区域图像对应的唇语信息的操作,包括:利用所述特征提取模型,生成与所述嘴部区域图像对应的特征序列;以及利用所述转换模型,根据所述特征序列生成所述唇语信息。3.根据权利要求1所述的方法,其特征在于,根据所述唇语信息以及所述第一文本信息,判定所述待识别对象是否为活体的操作,包括:将所述唇语信息与所述第一文本信息进行匹配;以及根据所述匹配的结果,判定所述待识别对象是否为活体。4.根据权利要求3所述的方法,其特征在于,将所述唇语信息与所述第一文本信息进行匹配的操作,包括:获取与所述第一文本信息对应的文本编码信息;以及将所述唇语信息与所述文本编码信息进行匹配。5.根据权利要求3所述的方法,其特征在于,将所述唇语信息与所述第一文本信息进行匹配的操作,包括:将所述唇语信息转换为相应的第二文本信息;以及将所述第二文本信息与所述第一文本信息进行匹配。6.根据权利要求2所述的方法,其特征在于,利用所述...

【专利技术属性】
技术研发人员:孔志飞赵立军
申请(专利权)人:北京中关村科金技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1