多场景兼容的人脸识别方法、装置、电子设备和存储介质制造方法及图纸

技术编号:31094244 阅读:17 留言:0更新日期:2021-12-01 13:02
本申请涉及多场景兼容的人脸识别方法、装置、电子设备和存储介质,属于人脸识别技术领域,该方法包括:获取待识别人脸图片;分别通过平衡模型、口罩识别模型和肤色识别模型对待识别人脸图片提取第一特征、第二特征和第三特征;将第二特征和第三特征加权平均,得到第四特征;将第四特征和所述第一特征合并,得到合并的特征;将合并的特征与底库中的人脸图片的特征进行比对,并根据比对结果确定识别结果。通过本申请,能够对一般人脸、戴口罩的人脸和具有不同肤色的人脸进行准确、高效的识别。高效的识别。高效的识别。

【技术实现步骤摘要】
多场景兼容的人脸识别方法、装置、电子设备和存储介质


[0001]本申请涉及人脸识别
,特别是涉及多场景兼容的人脸识别方法、装置、电子设备和存储介质。

技术介绍

[0002]目前,单一人脸识别模型往往不能够很好地应对多种多样的场景,比如在一般的人脸识别场景中,需要人为拿掉面前的遮挡物(例如口罩),才能对人脸进行准确的识别,若在一些场合的入口,例如地铁进站口或考勤登记门口等,由于被识别人需要作出清理面孔遮挡物的动作,通常会导致排队严重,入口的通过效率太低。
[0003]基于卷积神经网络的人脸识别技术,很大程度上依赖于训练集中的数据,只有在足够丰富的数据集下训练的模型,才能够应对多种多样的场景,但是,过多增加模型参数量会导致模型的稳定性较差,而在不过多增加模型参数量的前提下,识别的准确性很低。

技术实现思路

[0004]第一方面,本申请实施例提供了一种多场景兼容的人脸识别方法,所述方法包括:获取待识别人脸图片;分别通过平衡模型、口罩识别模型和肤色识别模型对所述待识别人脸图片提取第一特征、第二特征和第三特征;将所述第二特征和所述第三特征加权平均,得到第四特征;将所述第四特征和所述第一特征合并,得到合并的特征;将所述合并的特征与底库中的人脸图片的特征进行比对,并根据比对结果确定识别结果。
[0005]在其中一些实施例中,在所述获取待识别人脸图片之前,所述方法还包括:获取训练数据,其中,所述训练数据为经过对齐操作的人脸图片;利用所述训练数据对预先设计的平衡网络进行训练,当训练结束时,得到所述平衡模型,其中,所述平衡网络为EfficientNetv2

s,所述EfficientNetv2

s通过NAS搜索最优EfficientNetv2结构而得到。
[0006]在其中一些实施例中,在所述获取待识别人脸图片之前,所述方法还包括:从所述训练数据中选取部分人脸图片,并输入角度模型,得到人脸角度值;根据所述人脸角度值判断人脸方向,并结合3D口罩贴合方案,生成带口罩的人脸数据;将所述带口罩的人脸数据与所述训练数据合并,得到第一扩充训练集;利用所述第一扩充训练集训练预先设计的口罩网络,当训练结束时,得到所述口罩识别模型。
[0007]在其中一些实施例中,所述口罩网络的设计方式包括:固定所述平衡网络结构的前n层,其中,n是大于0的整数,且n<m,m表示所述平衡网络结构的总共层数;在第n层之后添加SimAM模块,得到所述口罩网络。
[0008]在其中一些实施例中,在所述获取待识别人脸图片之前,所述方法还包括:从所述训练数据中选取部分人脸图片,随机调整R、G、B颜色空间值,生成不同肤色的人脸数据;将所述不同肤色的人脸数据与所述训练数据合并,得到第二扩充训练集;利用所述第二扩充训练集训练预先设计的肤色网络,当训练结束时,得到所述肤色识别模型。
[0009]在其中一些实施例中,所述肤色网络的设计方式包括:固定所述平衡网络结构的
前n层,其中,n是大于0的整数,且n<m,m表示所述平衡网络结构的总共层数;在第n层之后添加自注意力机制,得到所述肤色网络。
[0010]在其中一些实施例中,所述平衡模型、所述口罩识别模型和所述肤色识别模型中均包含DropBlock模块。
[0011]第二方面,本申请实施例提供一种多场景兼容的人脸识别装置,包括:获取模块,用于获取待识别人脸图片;提取模块,用于分别通过平衡模型、口罩识别模型和肤色识别模型对所述待识别人脸图片提取第一特征、第二特征和第三特征;计算模块,用于将所述第二特征和所述第三特征加权平均,得到第四特征;将所述第四特征和所述第一特征合并,得到合并的特征;将所述合并的特征与底库中的人脸图片的特征进行比对,并根据比对结果确定识别结果。
[0012]第三方面,本申请实施例提供一种电子设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以上述任一项所述的方法。
[0013]第四方面,本申请实施例提供一种存储介质,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项所述的方法。
[0014]根据上述内容,本申请实施例提供的多场景兼容的人脸识别方法包括:获取待识别人脸图片;分别通过平衡模型、口罩识别模型和肤色识别模型对待识别人脸图片提取第一特征、第二特征和第三特征;将第二特征和第三特征加权平均,得到第四特征;将第四特征和第一特征合并,得到合并的特征;将合并的特征与底库中的人脸图片的特征进行比对,并根据比对结果确定识别结果。本申请实施例融合了平衡模型、口罩识别模型和肤色识别模型,模型的稳定性高,并且,能够在多场景中对一般人脸、戴口罩的人脸和具有不同肤色的人脸进行准确的识别,特别是,应用在一些场合的入口时,被识别人员无需做出摘口罩动作,即使是不同肤色的人种,也能够高效、精准的进行人脸识别,不仅识别的准确率高,而且能够提高入口通行的效率。
附图说明
[0015]此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:图1是根据本申请实施例所示的多场景兼容的人脸识别方法的流程图;图2是根据本申请实施例的MBConv的结构示意图;图3是根据本申请实施例的Fused

MBConv的结构示意图;图4是根据本申请实施例的举例的多场景兼容的人脸识别方法的流程图;图5是根据本申请实施例所示的多场景兼容的人脸识别装置的结构框图;图6是根据本申请实施例的电子设备的内部结构示意图。
具体实施方式
[0016]为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行描述和说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。基于本申请提供的实施例,本领域普通技术人员在没有作出创造性劳动的
前提下所获得的所有其他实施例,都属于本申请保护的范围。此外,还可以理解的是,虽然这种开发过程中所作出的努力可能是复杂并且冗长的,然而对于与本申请公开的内容相关的本领域的普通技术人员而言,在本申请揭露的
技术实现思路
的基础上进行的一些设计,制造或者生产等变更只是常规的技术手段,不应当理解为本申请公开的内容不充分。
[0017]在本申请中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域普通技术人员显式地和隐式地理解的是,本申请所描述的实施例在不冲突的情况下,可以与其它实施例相结合。
[0018]除非另作定义,本申请所涉及的技术术语或者科学术语应当为本申请所属
内具有一般技能的人士所理解的通常意义。本申请所涉及的“一”、“一个”、“一种”、“该”等类似词语并不表示数量限制,可表示单数或复数。本申请所涉及的术语“包括”本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种多场景兼容的人脸识别方法,其特征在于,所述方法包括:获取待识别人脸图片;分别通过平衡模型、口罩识别模型和肤色识别模型对所述待识别人脸图片提取第一特征、第二特征和第三特征;将所述第二特征和所述第三特征加权平均,得到第四特征;将所述第四特征和所述第一特征合并,得到合并的特征;将所述合并的特征与底库中的人脸图片的特征进行比对,并根据比对结果确定识别结果。2.根据权利要求1所述的方法,其特征在于,在所述获取待识别人脸图片之前,所述方法还包括:获取训练数据,其中,所述训练数据为经过对齐操作的人脸图片;利用所述训练数据对预先设计的平衡网络进行训练,当训练结束时,得到所述平衡模型,其中,所述平衡网络为EfficientNetv2

s,所述EfficientNetv2

s通过NAS搜索最优EfficientNetv2结构而得到。3.根据权利要求2所述的方法,其特征在于,在所述获取待识别人脸图片之前,所述方法还包括:从所述训练数据中选取部分人脸图片,并输入角度模型,得到人脸角度值;根据所述人脸角度值判断人脸方向,并结合3D口罩贴合方案,生成带口罩的人脸数据;将所述带口罩的人脸数据与所述训练数据合并,得到第一扩充训练集;利用所述第一扩充训练集训练预先设计的口罩网络,当训练结束时,得到所述口罩识别模型。4.根据权利要求3所述的方法,其特征在于,所述口罩网络的设计方式包括:固定所述平衡网络结构的前n层,其中,n是大于0的整数,且n<m,m表示所述平衡网络结构的总共层数;在第n层之后添加SimAM模块,得到所述口罩网络。5.根据权利要...

【专利技术属性】
技术研发人员:陈白洁王月平
申请(专利权)人:杭州魔点科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1