人脸活体检测模型的训练方法、人脸活体检测方法及装置制造方法及图纸

技术编号：36803887 阅读：9 留言：0更新日期：2023-03-09 00:02

本公开提供了人脸活体检测模型的训练方法、人脸活体检测方法及装置，涉及人工智能技术领域，尤其涉及涉及深度学习、图像处理、计算机视觉技术领域。具体实现方案为：根据样本人脸图像，确定第一模型输出的第一特征；根据第一特征，利用第一损失函数，确定第一损失值；根据第一特征和样本人脸图像对应的第一文本描述，确定第二模型输出的第二特征；根据第二特征，利用第二损失函数，确定第二损失值；以及根据第一损失值和第二损失值，对第一模型进行训练，以得到人脸活体检测模型。本公开实施例中，通过图像模态和文本模态监督模型训练，利用文本模态提供的细粒度语义信息的监督，提升人脸活体检测模型的泛化性。活体检测模型的泛化性。活体检测模型的泛化性。

全部详细技术资料下载

【技术实现步骤摘要】
人脸活体检测模型的训练方法、人脸活体检测方法及装置

[0001]本公开涉及人工智能
，尤其涉及深度学习、图像处理、计算机视觉
，可应用于人脸识别等场景。

技术介绍

[0002]人脸活体检测是指区分一张图像是否为针对真人拍摄获得的，是人脸识别系统的基础，可以保证人脸识别系统的安全性。使用深度卷积神经网络来训练人脸活体检测模型是目前常见的方法。为了使模型学习到更为丰富和泛化性的特征，出现了多模态学习方法。现有的多模态人脸活体检测方法实现方案通常是基于多模态的输入数据，即向模型输入多种模态的信息，各个模态特征相加或者特征连接来进行活体判别。

技术实现思路

[0003]本公开提供了一种用于人脸活体检测模型的训练方法、人脸活体检测方法及装置。
[0004]根据本公开的一方面，提供了一种人脸活体检测模型的训练方法，包括：根据样本人脸图像，确定第一模型输出的第一特征；其中，样本人脸图像包括：活体样本图像和攻击样本图像；
[0005]根据第一特征，利用第一损失函数，确定第一损失值；
[0006]根据第一特征和样本人脸图像对应的第一文本描述，确定第二模型输出的第二特征；
[0007]根据第二特征，利用第二损失函数，确定第二损失值；以及
[0008]根据第一损失值和第二损失值，对第一模型进行训练，以得到人脸活体检测模型。
[0009]根据本公开的另一方面，提供了一种人脸活体检测方法，包括：
[0010]利用上述人脸活体检测模型的训练方法训练得到的人脸活体...

【技术保护点】

【技术特征摘要】
1.一种人脸活体检测模型的训练方法，包括：根据样本人脸图像，确定第一模型输出的第一特征；其中，所述样本人脸图像包括：活体样本图像和攻击样本图像；根据所述第一特征，利用第一损失函数，确定第一损失值；根据所述第一特征和所述样本人脸图像对应的第一文本描述，确定第二模型输出的第二特征；根据所述第二特征，利用第二损失函数，确定第二损失值；以及根据所述第一损失值和所述第二损失值，对所述第一模型进行训练，以得到人脸活体检测模型。2.根据权利要求1所述的方法，其中，所述根据样本人脸图像，确定第一模型输出的第一特征，包括：将样本人脸图像切分为多个图像块，得到样本图像块序列；根据所述样本图像块序列，利用所述第一模型的线性投影层，确定样本图像向量序列；根据所述样本图像向量序列和第一分类向量，利用所述第一模型的转换器层，确定第一特征。3.根据权利要求1所述的方法，其中，所述根据所述第一特征，利用第一损失函数，确定第一损失值，包括：根据所述第一特征，利用所述第一模型的多层感知机层，确定预测分类标签；根据所述样本人脸图像的所述预测分类标签和实际分类标签，利用第一损失函数，确定第一损失值。4.根据权利要求1所述的方法，其中，所述根据所述第一特征和所述样本人脸图像对应的第一文本描述，确定第二模型输出的第二特征，包括：根据所述样本人脸图像对应的第一文本描述，利用所述第二模型的因果自注意力层，确定第三特征；根据所述第一特征和所述第三特征，利用所述第二模型的跨注意力层进行特征融合，确定融合特征；根据所述融合特征，利用所述第二模型的前向反馈层，确定所述第二模型输出的第二特征。5.根据权利要求1所述的方法，其中，所述根据所述第一损失值和所述第二损失值，对所述第一模型进行训练，以得到人脸活体检测模型，包括：根据所述第一损失值和所述第二损失值，得到第三损失值；根据所述第三损失值，对所述第一模型进行训练，以得到人脸活体检测模型。6.根据权利要求1所述的方法，其中，所述第一文本描述为预训练的文本描述生成模型根据训练人脸图像所生成，所述样本人脸图像是根据所述训练人脸图像所生成。7.根据权利要求6所述的方法，所述第一文本描述的生成过程包括：将所述训练人脸图像输入所述文本描述生成模型，得到对应所述训练人脸图像的第一文本描述；在所述第一文本描述满足生成规则的情况下，将所述第一文本描述对应的所述训练人脸图像作为所述样本人脸图像。
8.根据权利要求7所述的方法，其中，所述生成规则包括：在所述训练人脸图像为活体样本图像的情况下，所述文本描述生成模型生成的第一文本描述不包含预设的攻击词汇；在所述训练人脸图像为攻击样本图像的情况下，所述文本描述生成模型生成的第一文本描述包含预设的攻击词汇。9.根据权利要求1至8任一项所述的方法，其中，所述第一模型为基于转换器结构的神经网络模型，所述第二模型为基于转换器的双向编码器表示模型；或者，所述第一损失函数为交叉熵损失函数，所述第二损失函数为语言建模损失函数。10.一种人脸活体检测方法，包括：利用权利要求1至9任一项所述的方法训练得到的人脸活体检测模型，对目标人脸图像进行检测，以得到检测结果。11.根据权利要求10所述的方法，其中，所述利用权利要求1至9任一项所述的方法训练得到的人脸活体检测模型，对目标人脸图像进行检测，以得到检测结果，包括：将目标人脸图像切分为多个图像块，得到目标图像块序列；根据所述目标图像块序列，利用权利要求1至9任一项所述的方法训练得到的人脸活体检测模型，确定图像特征；根据所述图像特征，确定所述目标人脸图像的分类标签，以得到检测结果。12.一种人脸活体检测模型的训练装置，包括：第一确定模块，用于根据样本人脸图像，确定第一模型输出的第一特征；其中，所述样本人脸图像包括：活体样本图像和攻击样本图像；第二确定模块，用于根据所述第一特征，利用第...

【专利技术属性】
技术研发人员：张国生，王珂尧，岳海潇，冯浩城，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人