【技术实现步骤摘要】
基于神经网络架构搜索(NAS)的活体检测技术
[0001]本专利技术涉及电子信息
,特别涉及一种基于神经网络架构搜索(NAS)的活体检测技术。
技术介绍
[0002]随着活体检测技术的成熟,金融科技领域逐渐对动态人脸识别的技术需求越来越旺盛。其中神经网络结构搜索技术(NeuralArchitectureSearch)在新兴人脸识别的应用场景中具有灵活性,自动化等优势。现有的活体人脸检测捕捉成像主要使用固定的神经网络结构对特定场景下的人脸进行预训练,再将预训练的网络参数提取出来应用于特定的任务进行测试。对不同的人脸检测子任务,工业界主要以两种方案对网络进行优化。一是对预训练的模型在特定任务上喂新的数据集进行参数的调整,二是重新更改模型结构,使用自监督学习的方式训练一个新的静态网络结构模型。比如较为流行的Retinaface,MTCNN,VisionTransformer等多任务网络,都是依赖特定任务对静态的级联神经网络进行参数优化。这些训练方法所设计的神经网络结构在初始化的时候已被固定。
[0003]然而,这种单一传统的神经网络结构设计难以匹配日新月异的数据集以及不断发展的任务场景。过去针对静态神经网络模型结构的改进无法满足实际检测数据集分布域不均匀,背景噪声干扰等多种变化。同时,静态网络的设计结构在实际应用中存在鲁棒性差,适应性弱等局限性,因为单一神经网络结构的参数优化难以胜任不同的测试场景。例如,明暗不同光线下静态模型结构的鲁棒性会有较大变动,人脸矫正时静态模型难以适配不同的仿射变换参数以应对新的角度
【技术保护点】
【技术特征摘要】 【专利技术属性】
1.基于神经网络架构搜索(NAS)的活体检测技术,其特征在于,包括以下步骤:S1、初始化网络架构的最大搜索空间S,将最大网络模型定义为超级网络(supernet),让全部可能的活体检测模型结构都被包含其中;对于每个字任务,预设其子网络的目标函数为:其中θ
*
为搜索空间S中理论上的最优模型架构,Eva为当前任务的评价指标;S2、使用基于One
‑
Shot的搜索策略,将网络空间表示为连续分布空间,通过基于梯度的方法进行优化;将网络空间表示为一个有向无环图,其节点连接和激活函数组合成一个矩阵,其中每个元素代表了连接和激活函数的权重;在搜索时使用了Softmax函数将搜索空间变成了连续空间,使目标函数成为可微函数;在搜索时,遍历全部节点,使用节点上全部连接的加权进行计算,同时优化结构权重和网络权重;S3、基于当前活体检测的具体任务选取自动初始化的评价指标L
t
,引导S2中的搜索策略更新;比如针对活体目标框的定位,选取GenuineAcceptanceRate(GAR),FalceAcceptanceRate(FAR),FalseRejectionRate(FRR),而对于真伪识别的模型搜索,采用mAP和F1得分等指标;S4、在S2定义的过参数化超级网络(S)中进行搜索,交替地训练网络权重和模型权重(w
d
):最终只保留其中一个最优子结构;搜索结束后,基于S3定义的评估指标选择权重最大的连接和激活函数,形成当前活体检测所需要的最终网络架构;S5、提取S4步骤中搜索出的最优网络结构与搜索时的参数,作为当前特定任务活体检测的模型结构;S6、在当前任务的人脸检测视频样本集上微调参数,生成最适合目标场景的活体检测模型。2.根据权利要求1所述的基于神经网络架构搜索(NAS)的活体检测技术,其特征在于,S1步骤中预处理的具体实现方式,包含以下:S1.1、搜索空间中可能涉及堆叠在一起的所有层配置集;S1.2、包含跳过连接的更复杂的体系结构;S1.3、为了降低最大搜索空间的维数和冗余量,对不同子模块进行设计;随后子模块堆叠在一起就可以生成一系列有效的模型架构。3.根据权利要求1所述的基于神经网络架构搜索(NAS)的活体检测技术,其特征在于,步骤S2中网络架构的搜索策略,包含以下:S2.1、用于活体检测模型搜索的权重纠缠训练策略;让不同的子网模块能够在每一层的共同部分共享权重;S2.2、对于一个具有l层堆栈的子网α∈A,其结构和权重表示为:α=(α1,α2,...,α
l
)w=(w1,w2,...,w
l
)
其中,α
i
表示第i层的采样块,w
i
是块权重;在架构搜索过程中,每层都有多个块的选择;S2.3、基于S2.2中,从属于搜索空间的n个区块候选集中选取α
i
和w
i
::其中b
技术研发人员:徐华建,施炎,袁顺杰,崔文冰,黄心泓,史荣钧,徐德华,汤敏伟,
申请(专利权)人:天翼电子商务有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。