面部识别模型的训练方法和训练设备技术

技术编号:21116325 阅读:37 留言:0更新日期:2019-05-16 09:09
本发明专利技术公开了一种面部识别模型的训练方法和训练设备。该方法包括:去除从实际场景获取的、包含面部的图像组成的第一实际场景数据中的黑眼眶、墨镜,以得到第二实际场景数据;统计第二实际场景数据中戴眼镜的比例;将由包含面部的图像组成的原始训练数据划分为戴眼镜的第一训练数据和不戴眼镜的第二训练数据,其中,原始训练数据中戴眼镜的比例低于第二实际场景数据中戴眼镜的比例;基于眼镜数据和第二训练数据,生成戴眼镜的第三训练数据;基于第三训练数据和原始训练数据,生成其中戴眼镜的比例等于第二实际场景数据中戴眼镜的比例的第四训练数据;以及基于第四训练数据,训练面部识别模型。

【技术实现步骤摘要】
面部识别模型的训练方法和训练设备
本专利技术一般地涉及信息处理
具体而言,本专利技术涉及一种能够以符合实际场景的戴眼镜比例的训练数据训练面部识别模型的方法和设备。
技术介绍
近年来,随着信息技术的发展,基于人脸识别的系统和应用越来越多。这得益于大量的训练数据和卷积神经网络CNN。然而,对于戴眼镜的人脸图像进行人脸识别存在巨大挑战。主要原因在于缺少戴眼镜的人脸图像用于对人脸识别模型的训练。当前存在开放的人脸数据库,如WebFace和MS-Celeb-1M数据库。但是这些数据库中主要是名人的图像数据,而名人通常很少戴眼镜,因此,这些数据库中戴眼镜的比例低于常规人群中戴眼镜的比例。另外,名人带的眼镜大多数为墨镜,不同于常规人群常带的近视镜。收集大量的戴眼镜的人脸数据显然是耗费人力和资源的。为了解决上述问题,本专利技术提出了生成戴眼镜图像的方法,使得训练图像中戴眼镜的比例与实际场景中戴眼镜的比例相符,从而利于训练面部识别模型。因此,本专利技术旨在提供一种以符合实际场景的戴眼镜比例的训练数据训练面部识别模型的方法和设备。
技术实现思路
在下文中给出了关于本专利技术的简要概述,以便提供关于本专利技术的某些方面的基本理解。应当理解,这个概述并不是关于本专利技术的穷举性概述。它并不是意图确定本专利技术的关键或重要部分,也不是意图限定本专利技术的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详细描述的前序。本专利技术的目的是提出一种以符合实际场景的戴眼镜比例的训练数据训练面部识别模型的方法和设备。为了实现上述目的,根据本专利技术的一个方面,提供了一种面部识别模型的训练方法,该方法包括:去除从实际场景获取的、包含面部的图像组成的第一实际场景数据中的黑眼眶、墨镜,以得到第二实际场景数据;统计第二实际场景数据中戴眼镜的比例;将由包含面部的图像组成的原始训练数据划分为戴眼镜的第一训练数据和不戴眼镜的第二训练数据,其中,原始训练数据中戴眼镜的比例低于第二实际场景数据中戴眼镜的比例;基于眼镜数据和第二训练数据,生成戴眼镜的第三训练数据;基于第三训练数据和原始训练数据,生成其中戴眼镜的比例等于第二实际场景数据中戴眼镜的比例的第四训练数据;以及基于第四训练数据,训练面部识别模型。根据本专利技术的另一个方面,提供了一种面部识别模型的训练设备,该设备包括:去除装置,被配置为:去除从实际场景获取的、包含面部的图像组成的第一实际场景数据中的黑眼眶、墨镜,以得到第二实际场景数据;统计装置,被配置为:统计第二实际场景数据中戴眼镜的比例;划分装置,被配置为:将由包含面部的图像组成的原始训练数据划分为戴眼镜的第一训练数据和不戴眼镜的第二训练数据,其中,原始训练数据中戴眼镜的比例低于第二实际场景数据中戴眼镜的比例;加眼镜装置,被配置为:基于眼镜数据和第二训练数据,生成戴眼镜的第三训练数据;比例调整装置,被配置为:基于第三训练数据和原始训练数据,生成其中戴眼镜的比例等于第二实际场景数据中戴眼镜的比例的第四训练数据;以及模型训练装置,被配置为:基于第四训练数据,训练面部识别模型。另外,根据本专利技术的另一方面,还提供了一种存储介质。所述存储介质包括机器可读的程序代码,当在信息处理设备上执行所述程序代码时,所述程序代码使得所述信息处理设备执行根据本专利技术的上述方法。此外,根据本专利技术的再一方面,还提供了一种程序产品。所述程序产品包括机器可执行的指令,当在信息处理设备上执行所述指令时,所述指令使得所述信息处理设备执行根据本专利技术的上述方法。附图说明参照下面结合附图对本专利技术的实施例的说明,会更加容易地理解本专利技术的以上和其它目的、特点和优点。附图中的部件只是为了示出本专利技术的原理。在附图中,相同的或类似的技术特征或部件将采用相同或类似的附图标记来表示。附图中:图1示出了根据本专利技术的实施例的面部识别模型的训练方法的流程图;图2示出了将原始训练数据中包含面部的图像按照是否戴眼镜进行划分的方法的流程图;图3示出了生成戴眼镜的第三训练数据的方法;图4示出了使得眼睛变小的合并方法;图5示出了根据本专利技术的实施例的面部识别模型的训练设备的结构方框图;以及图6示出了可用于实施根据本专利技术的实施例的方法和设备的计算机的示意性框图。具体实施方式在下文中将结合附图对本专利技术的示范性实施例进行详细描述。为了清楚和简明起见,在说明书中并未描述实际实施方式的所有特征。然而,应该了解,在开发任何这种实际实施方式的过程中必须做出很多特定于实施方式的决定,以便实现开发人员的具体目标,例如,符合与系统及业务相关的那些限制条件,并且这些限制条件可能会随着实施方式的不同而有所改变。此外,还应该了解,虽然开发工作有可能是非常复杂和费时的,但对得益于本公开内容的本领域技术人员来说,这种开发工作仅仅是例行的任务。在此,还需要说明的一点是,为了避免因不必要的细节而模糊了本专利技术,在附图中仅仅示出了与根据本专利技术的方案密切相关的装置结构和/或处理步骤,而省略了与本专利技术关系不大的其他细节。另外,还需要指出的是,在本专利技术的一个附图或一种实施方式中描述的元素和特征可以与一个或更多个其它附图或实施方式中示出的元素和特征相结合。下面将参照图1描述根据本专利技术的实施例的面部识别模型的训练方法的流程。图1示出了根据本专利技术的实施例的面部识别模型的训练方法的流程图。如图1所示,该方法包括如下步骤:去除从实际场景获取的、包含面部的图像组成的第一实际场景数据中的黑眼眶、墨镜,以得到第二实际场景数据(步骤S1);统计第二实际场景数据中戴眼镜的比例(步骤S2);将由包含面部的图像组成的原始训练数据划分为戴眼镜的第一训练数据和不戴眼镜的第二训练数据,其中,原始训练数据中戴眼镜的比例低于第二实际场景数据中戴眼镜的比例(步骤S3);基于眼镜数据和第二训练数据,生成戴眼镜的第三训练数据(步骤S4);基于第三训练数据和原始训练数据,生成其中戴眼镜的比例等于第二实际场景数据中戴眼镜的比例的第四训练数据(步骤S5);以及基于第四训练数据,训练面部识别模型(步骤S6)。面部识别模型的训练对于面部模型的识别精度、准确率影响很大。面部识别模型的训练又主要依赖于训练数据。前文提到,现有面部识别模型对于戴眼镜的人脸图像识别困难的主要原因就在于缺少大量的戴眼镜的训练数据。事实上,在不同的实际应用场景中,戴眼镜的比例是不同的。例如,每个公司的打卡机主要应用于特定公司的职员,不同公司的戴眼镜的比例不同,小学校园和大学校园、医院的戴眼镜比例也都不一致。希望针对每个应用的实际场景,生成与实际场景中戴眼镜比例相同的训练数据来训练面部识别模型,从而提高该面部识别模型在该实际场景中识别的准确率。因此,首先需要获知具体应用的实际场景中戴眼镜的比例。从具体应用的实际场景获取包含面部的图像,组成第一实际场景数据。与一般采用的直接判断图像数据是否戴眼镜的方式相比,本专利技术进行预处理,以提高判断的准确度。因为黑眼眶和墨镜对判断是否戴眼镜具有较强的干扰作用,所以,在步骤S1中,去除第一实际场景数据中的黑眼眶、墨镜,以得到第二实际场景数据。使用第二实际场景数据进行戴眼镜的判断更为准确。在步骤S2中,统计第二实际场景数据中戴眼镜的比例。例如,可采用训练好的分类器或卷积神经网络来判断第二实际场景数据中包含面部的图像是否戴眼镜,并进本文档来自技高网...

【技术保护点】
1.一种面部识别模型的训练方法,包括:去除从实际场景获取的、包含面部的图像组成的第一实际场景数据中的黑眼眶、墨镜,以得到第二实际场景数据;统计第二实际场景数据中戴眼镜的比例;将由包含面部的图像组成的原始训练数据划分为戴眼镜的第一训练数据和不戴眼镜的第二训练数据,其中,原始训练数据中戴眼镜的比例低于第二实际场景数据中戴眼镜的比例;基于眼镜数据和第二训练数据,生成戴眼镜的第三训练数据;基于第三训练数据和原始训练数据,生成其中戴眼镜的比例等于第二实际场景数据中戴眼镜的比例的第四训练数据;以及基于第四训练数据,训练面部识别模型。

【技术特征摘要】
1.一种面部识别模型的训练方法,包括:去除从实际场景获取的、包含面部的图像组成的第一实际场景数据中的黑眼眶、墨镜,以得到第二实际场景数据;统计第二实际场景数据中戴眼镜的比例;将由包含面部的图像组成的原始训练数据划分为戴眼镜的第一训练数据和不戴眼镜的第二训练数据,其中,原始训练数据中戴眼镜的比例低于第二实际场景数据中戴眼镜的比例;基于眼镜数据和第二训练数据,生成戴眼镜的第三训练数据;基于第三训练数据和原始训练数据,生成其中戴眼镜的比例等于第二实际场景数据中戴眼镜的比例的第四训练数据;以及基于第四训练数据,训练面部识别模型。2.如权利要求1所述的方法,其中,所述划分步骤包括:检测原始训练数据中面部的位置;将原始训练数据中的面部与标准脸对齐;利用深度卷积神经网络或分类器判断对齐的原始训练数据中的面部是否戴眼镜,以将原始训练数据划分为第一训练数据和第二训练数据。3.如权利要求1所述的方法,其中,眼镜数据包括各种类型的眼镜的关键点信息、眼镜图像、镜片信息,关键点信息表征了眼镜的形状结构,镜片信息标识了镜片与镜框的边界。4.如权利要求3所述的方法,其中,所述基于眼镜数据和第二训练数据,生成戴眼镜的第三训练数据包括:从已有眼镜类型中随机选择眼镜类型;随机改变所选择的眼镜类型对应的眼镜图像;识别第二训练数据中的眼睛附近的关键点信息;基于随机改变的眼镜图像对应的关键点信息和所识别的眼睛附近的关键点信息,利用仿射变换,合并第二训练数据中的包含面部的图像与随机改变的眼镜图像,以得到第三训练数据。5.如权利要求4所述的方法,其中,随机改变所选择的眼镜类型对应的眼镜图像包括下述中的至少一个:随机选择已有类型的眼镜框,替换眼镜图像中的眼镜框;随机改变眼镜框的粗细;随机改变眼镜框的形状;随机改变眼镜片的颜色。6.如权利要求4所述的方法,其中,在所选择的眼镜类型为近视镜的情况下,所述合并步骤包括:基于随机改变的眼镜图像对应的关键点信息、镜片信息、以及所识别的眼睛附近的关键点信息,利用仿射变换,确定所识别的眼睛周围的合并区域和镜片区域;将第二训练数据中的包含面部的图像中眼...

【专利技术属性】
技术研发人员:张梦刘汝杰孙俊
申请(专利权)人:富士通株式会社
类型:发明
国别省市:日本,JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1