模型训练方法、图像识别方法、装置及电子设备制造方法及图纸

技术编号:36256087 阅读:25 留言:0更新日期:2023-01-07 09:51
本公开提供了模型训练方法、图像识别方法、装置及电子设备,涉及人工智能技术领域,尤其涉及图像识别和深度学习技术领域。具体实现方案为:获取第一RGB图像和第一NIR图像;将所述第一RGB图像输入第一模型,获取所述第一模型输出的第二NIR图像,并基于所述第二NIR图像和所述第一NIR图像对所述第一模型进行自监督训练;获取训练后的所述第一模型中的编码器部分,将所述编码器部分作为第二模型;基于第二RGB图像和第三NIR图像对所述第二模型进行二分类活体监督训练,得到目标模型;其中,所述目标模型用于对输入的待检测图像进行识别,输出所述待检测图像的图像识别结果,所述待检测图像为RGB图像或NIR图像。像为RGB图像或NIR图像。像为RGB图像或NIR图像。

【技术实现步骤摘要】
模型训练方法、图像识别方法、装置及电子设备


[0001]本公开涉及人工智能
,尤其涉及图像识别和深度学习
,具体涉及一种模型训练方法、图像识别方法、装置及电子设备。

技术介绍

[0002]人脸活体检测是指区分一张图像是否为真人拍摄,是人脸识别系统的基础组成模块,能够确保人脸识别系统的安全性,使用深度学习技术的人脸活体检测算法是当前的主流方法。目前,人脸活体检测模型通常是基于红绿蓝(Red Green Blue,RGB)图像来判别该图像是否为真人拍摄,而基于RGB图像的人脸活体检测模型对于光线敏感度要求较高。

技术实现思路

[0003]本公开提供了一种模型训练方法、图像识别方法、装置及电子设备。
[0004]根据本公开的一方面,提供了一种模型训练方法,包括:
[0005]获取第一红绿蓝RGB图像和第一近红外NIR图像;
[0006]将所述第一RGB图像输入第一模型,获取所述第一模型输出的第二NIR图像,并基于所述第二NIR图像和所述第一NIR图像对所述第一模型进行自监督训练;
[0007]获取训练后的所述第一模型中的编码器部分,将所述编码器部分作为第二模型;
[0008]基于第二RGB图像和第三NIR图像对所述第二模型进行二分类活体监督训练,得到目标模型;
[0009]其中,所述目标模型用于对输入的待检测图像进行识别,输出所述待检测图像的图像识别结果,所述待检测图像为RGB图像或NIR图像。
[0010]根据本公开的第二方面,提供了一种图像识别方法,包括:
[0011]获取待检测图像;
[0012]将所述待检测图像输入目标模型,并获取所述目标模型输出的图像识别结果;
[0013]其中,所述目标模型为基于第二RGB图像和第三NIR图像对第二模型进行二分类活体监督训练得到的模型,所述第二模型为第一模型中的编码器部分,所述第一模型为基于第二NIR图像和第一NIR图像进行自监督训练得到的模型,所述第二NIR图像为将第一RGB图像输入所述第一模型后,所述第一模型输出的NIR图像。
[0014]根据本公开的第三方面,提供了一种模型训练装置,包括:
[0015]第一获取模块,用于获取第一红绿蓝RGB图像和第一近红外NIR图像;
[0016]第一训练模块,用于将所述第一RGB图像输入第一模型,获取所述第一模型输出的第二NIR图像,并基于所述第二NIR图像和所述第一NIR图像对所述第一模型进行自监督训练;
[0017]第二获取模块,用于获取训练后的所述第一模型中的编码器部分,将所述编码器部分作为第二模型;
[0018]第二训练模块,用于基于第二RGB图像和第三NIR图像对所述第二模型进行二分类
活体监督训练,得到目标模型;
[0019]其中,所述目标模型用于对输入的待检测图像进行识别,输出所述待检测图像的图像识别结果,所述待检测图像为RGB图像或NIR图像。
[0020]根据本公开的第四方面,提供了一种图像识别装置,包括:
[0021]第三获取模块,用于获取待检测图像;
[0022]识别模块,用于将所述待检测图像输入目标模型,并获取所述目标模型输出的图像识别结果;
[0023]其中,所述目标模型为基于第二RGB图像和第三NIR图像对第二模型进行二分类活体监督训练得到的模型,所述第二模型为第一模型中的编码器部分,所述第一模型为基于第二NIR图像和第一NIR图像进行自监督训练得到的模型,所述第二NIR图像为将第一RGB图像输入所述第一模型后,所述第一模型输出的NIR图像。
[0024]根据本公开的第五方面,提供了一种电子设备,包括:
[0025]至少一个处理器;以及
[0026]与所述至少一个处理器通信连接的存储器;其中,
[0027]所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行第一方面或第二方面所述的方法。
[0028]根据本公开的第六方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行第一方面或第二方面所述的方法。
[0029]根据本公开的第七方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现第一方面或第二方面所述的方法。
[0030]本公开实施例中,基于真实的NIR图像与第一模型生成的NIR图像来对第一模型进行自监督训练,以得到训练后的第一模型,也就使得训练后的第一模型具有较高的模型精度,而第二模型是训练后的第一模型中的编码器部分,进而所述第二模型也就具有较高的模型精度,这样也就使得基于第二模型训练得到的目标模型也能够具有较高的模型精度,以确保目标模型输出的图像识别结果具有较高的准确度。
[0031]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0032]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0033]图1是本公开实施例提供的一种模型训练方法的流程图;
[0034]图2是本公开实施例提供的另一种模型训练方法的流程图;
[0035]图3是本公开实施例提供的一种图像识别方法的流程图;
[0036]图4本公开实施例提供的一种模型训练装置的结构图;
[0037]图5是本公开实施例提供的一种图像识别装置的结构图;
[0038]图6是用来实现本公开实施例的模型训练方法或图像识别方法的电子设备的框图。
具体实施方式
[0039]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0040]请参照图1,图1是本公开实施例提供的一种模型训练方法的流程图,所述方法可以是应用于如计算机、手机等电子设备。如图1所示,所述方法包括以下步骤:
[0041]步骤S101、获取第一RGB图像和第一NIR图像。
[0042]需要说明地,本公开实施例中的第一RGB图像和第一近红外(Near Infrared,NIR)图像均可以是包含人脸的图像。电子设备可以是通过多种途径来获得第一RGB图像和第一NIR图像,例如可以是网络下载,或者也可以是电子设备拍摄得到。
[0043]其中,所述第一RGB图像和所述第一NIR图像可以是对应同一图像场景,也即二者为同一图像场景下形成的两种不同模态的图像。
[0044]步骤S102、将所述第一RGB图像输入第一模型,获取所述第一模型输出的第二NIR图像,并基于所述第二NIR图像和所述本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法,包括:获取第一红绿蓝RGB图像和第一近红外NIR图像;将所述第一RGB图像输入第一模型,获取所述第一模型输出的第二NIR图像,并基于所述第二NIR图像和所述第一NIR图像对所述第一模型进行自监督训练;获取训练后的所述第一模型中的编码器部分,将所述编码器部分作为第二模型;基于第二RGB图像和第三NIR图像对所述第二模型进行二分类活体监督训练,得到目标模型;其中,所述目标模型用于对输入的待检测图像进行识别,输出所述待检测图像的图像识别结果,所述待检测图像为RGB图像或NIR图像。2.根据权利要求1所述的方法,其中,所述基于第二RGB图像和第三NIR图像对所述第二模型进行二分类活体监督训练,得到目标模型之前,所述方法还包括:对所述第一RGB图像和所述第二NIR图像分别进行不同的数据增强处理,基于数据增强处理后的所述第一RGB图像和数据增强处理后的所述第二NIR图像对第二模型进行自监督训练。3.根据权利要求2所述的方法,其中,所述对所述第一RGB图像和所述第二NIR图像分别进行不同的数据增强处理,基于数据增强处理后的所述第一RGB图像和所述第二NIR图像对第二模型进行自监督训练,包括:对所述第一RGB图像进行第一数据增强处理,得到第一图像特征;对所述第二NIR图像进行第二数据增强处理,得到第二图像特征,所述第一数据增强处理不同于所述第二数据增强处理;基于所述第一图像特征和所述第二图像特征对所述第二模型进行自监督训练。4.根据权利要求3所述的方法,其中,所述基于所述第一图像特征和所述第二图像特征对所述第二模型进行自监督训练,包括:将所述第一图像特征和所述第二图像特征输入所述第二模型;基于对比学习损失函数对所述第二模型进行自监督训练,所述自监督训练用于使所述第一图像特征和所述第二图像特征之间的相似度大于预设相似度。5.根据权利要求1所述的方法,还包括:对目标图像进行图像处理,其中,所述图像处理包括:对所述目标图像进行关键点检测;基于检测到的关键点对所述目标图像中的目标对象进行对齐处理,并对对齐处理后的所述目标图像进行图像预处理;其中,所述目标图像为所述第一RGB图像、所述第二RGB图像、所述第二NIR图像、所述第三NIR图像中的至少一者。6.根据权利要求5所述的方法,其中,所述基于检测到的关键点对所述目标图像中的目标对象进行对齐处理,包括:获取所述关键点对应的第一坐标,以及获取基准对象的关键点对应的第二坐标;基于所述第一坐标和所述第二坐标确定仿射变换矩阵,并基于所述仿射变换矩阵对所述目标图像中的目标对象进行对齐处理。7.根据权利要求5所述的方法,其中,所述对对齐处理后的所述目标图像进行图像预处
理,包括:对对齐处理后的所述目标图像中的每一个像素进行像素值预处理,以使预处理后的所述每一个像素的像素值位于预设阈值区间内。8.一种图像识别方法,包括:获取待检测图像;将所述待检测图像输入目标模型,并获取所述目标模型输出的图像识别结果;其中,所述目标模型为基于第二RGB图像和第三NIR图像对第二模型进行二分类活体监督训练得到的模型,所述第二模型为第一模型中的编码器部分,所述第一模型为基于第二NIR图像和第一NIR图像进行自监督训练得到的模型,所述第二NIR图像为将第一RGB图像输入所述第一模型后,所述第一模型输出的NIR图像。9.一种模型训练装置,包括:第一获取模块,用于获取第一红绿蓝RGB图像和第一近红外NIR图像;第一训练模块,用于将所述第一RGB图像输入第一模型,获取所述第一模型输出的第二NIR图像,并基于...

【专利技术属性】
技术研发人员:王珂尧
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1