图像处理方法、模型训练方法及对应装置制造方法及图纸

技术编号:19635547 阅读:13 留言:0更新日期:2018-12-01 16:12
本发明专利技术涉及图像处理技术领域,提供一种图像处理方法、模型训练方法及对应装置。其中,图像处理方法包括:获得第一深度图像;对第一深度图像进行增广处理,获得第一深度图像的至少一个增广图像,其中,增广处理包括以下至少一种:特征点偏移处理、随机距离变换处理、遮挡处理、数据缺失处理以及高斯模糊处理。由于该方法能够对第一深度图像进行多种不同的增广处理,获得用于模拟不同场景的共至少一个增广图像,使得可用于训练模型的深度图像样本的数量显著增加,图像覆盖的场景也较为全面,从而有利于改善训练出的模型的精度,提高模型的鲁棒性。

Image Processing Method, Model Training Method and Corresponding Device

The invention relates to the field of image processing technology, and provides an image processing method, a model training method and a corresponding device. Among them, image processing methods include: obtaining the first depth image; augmenting the first depth image to obtain at least one augmented image of the first depth image, in which the augmentation processing includes at least one of the following: feature point offset processing, random distance transformation processing, occlusion processing, data missing processing and so on. Gauss Fuzzy Processing. Because this method can carry out various augmentation processing on the first depth image and obtain at least one augmented image for simulating different scenes, the number of depth image samples that can be used for training model is significantly increased, and the scene covered by image is more comprehensive, which is conducive to improving the precision of the trained model. Degree, improve the robustness of the model.

【技术实现步骤摘要】
图像处理方法、模型训练方法及对应装置
本专利技术涉图像处理
,具体而言,涉及一种图像处理方法、模型训练方法及对应装置。
技术介绍
在生物识别系统中,为防止恶意者伪造和窃取他人的生物特征用于身份认证,生物识别系统需具有活体检测功能,即判断提交的生物特征是否来自有生命的个体。人脸活体检测是一种最为常见的活体检测方式,在现有技术中,通过深度摄像头采集包括活体人脸的深度图像,并基于深度图像训练深度活体模型,该模型能够用于人脸活体检测并输出分类结果,即待检测人脸是否为活体。然而,在采集活体人脸的深度图像的过程中,由于人力财力的限制,采集的深度图像难以覆盖到所有的场景,从而训练出的深度活体模型鲁棒性较差。
技术实现思路
有鉴于此,本专利技术实施例提供一种图像处理方法、模型训练方法及对应装置,以解决上述技术问题。为实现上述目的,本专利技术提供如下技术方案:第一方面,本专利技术实施例提供一种图像处理方法,包括:获得第一深度图像,第一深度图像包括目标对象与摄像头之间的距离信息;对第一深度图像进行增广处理,获得第一深度图像的至少一个增广图像,其中,增广处理包括以下至少一种:特征点偏移处理、随机距离变换处理、遮挡处理、数据缺失处理以及高斯模糊处理。上述方案能够对第一深度图像进行多种不同的增广处理,获得用于模拟不同场景的共至少一个增广图像,使得可用于训练模型的深度图像样本的数量显著增加,图像覆盖的场景也较为全面,从而有利于改善训练出的模型的精度,提高模型的鲁棒性。结合第一方面,在第一方面的第一种可能的实现方式中,获得第一深度图像,包括:获得目标场景的红外图像以及第二深度图像,第二深度图像包括目标场景与摄像头之间的距离信息,目标场景包括目标对象;在红外图像中确定目标对象的第一特征点集合;将第一特征点集合投射到第二深度图像中,在第二深度图像中确定与第一特征点集合对应的第二特征点集合;在第二深度图像中确定一个包括第二特征点集合的第一矩形区域,并将第一矩形区域确定为第一深度图像。第一深度图像可以从第二深度图像中抠取,从而排除掉第二深度图像中除目标对象以外的部分,有利于改善训练出的模型的精度。现有的对目标对象的检测方法很多并不针对深度图像,因此,可以在红外图像上进行检测后,再将检测出的第一特征点集合投射到第二深度图像上,以实现对第一深度图像的抠取。结合第一方面的第一种可能的实现方式,在第一方面的第二种可能的实现方式中,在第二深度图像中确定一个包括第二特征点集合的第一矩形区域,包括:确定第二特征点集合中的第二特征点的横坐标最小值xmin、横坐标最大值xmax、纵坐标最小值ymin以及纵坐标最大值ymax;将以点(xmin,ymin)、(xmax,ymin)、(xmin,ymax)以及(xmax,ymax)为顶点的矩形区域确定为第一矩形区域。确定第二特征点集合中的位于集合边缘处的第二特征点,能够快速确定出一个包括第二特征点集合的矩形区域。结合第一方面或第一方面的第一种或第二种可能的实现方式,在第一方面的第三种可能的实现方式中,获得第一深度图像之后,对第一深度图像进行增广处理之前,方法还包括:对第一深度图像进行缩放处理。通过对第一深度图像进行缩放,使得其尺寸统一,便于后续处理。此外,在某些计算资源存在限制或对精度要求不高的情况下,对第一深度图像进行缩小,再进行后续处理,有利于加快处理速度。结合第一方面的第一种或第二种可能的实现方式,在第一方面的第四种可能的实现方式中,对第一深度图像进行特征点偏移处理,获得第一深度图像的任一增广图像,包括:在第二深度图像中对第二特征点集合中的每个第二特征点在水平方向上进行随机偏移和/或在竖直方向上进行随机偏移,获得偏移后的第二特征点集合;在第二深度图像中确定一个包括偏移后的第二特征点集合的第二矩形区域,并将第二矩形区域确定为增广图像。在实际中,通常采集红外线图像和采集第二深度图像之间存在一定的时间间隔,在这一时间间隔内,目标对象可能会产生一定的移动或变化,导致将第一特征点集合投射到第二深度图像上时存在一定的偏差,即第二特征点集合可能并不对应第二深度图像上目标对象的实际特征点集合。这种情况可以通过对第二特征点集合中的第二特征点进行随机偏移来模拟,实现对第一深度图像的增广。结合第一方面的第四种可能的实现方式,在第一方面的第五种可能的实现方式中,对第二特征点集合中的每个第二特征点在水平方向上进行随机偏移和/或在竖直方向上进行随机偏移,包括:获得第一矩形区域在水平方向上的第一边长;将第一边长与区间[a1,b1]内的随机数相乘并随机确定乘积的正负号,获得水平偏移量,其中,a1为非负数,b1小于或等于1;在第二深度图像中基于水平偏移量对第二特征点集合中的每个第二特征点在水平方向上进行偏移;和/或获得第一矩形区域在竖直方向上的第二边长;将第二边长与区间[a2,b2]内的随机数相乘并随机确定乘积的正负号,获得竖直偏移量,其中,a2为非负数,b2小于或等于1;在第二深度图像中基于竖直偏移量对第二特征点集合中的每个第二特征点在竖直方向上进行偏移。在上述模拟随机偏移的实现方式中,每个第二特征点的具有相同的随机偏移量,用于模拟目标对象在采集红外线图像和采集第二深度图像之间的时间间隔内存在整体移动的情况。结合第一方面的第四种可能的实现方式,在第一方面的第六种可能的实现方式中,在第二深度图像中对第二特征点集合中的每个第二特征点在水平方向上进行随机偏移和/或在竖直方向上进行随机偏移,包括:获得第一矩形区域在水平方向上的第一边长;将第一边长与区间[a1,b1]内针对每个第二特征点的随机数相乘并随机确定乘积的正负号,获得针对每个第二特征点的水平偏移量,其中,a1为非负数,b1小于或等于1,针对不同的第二特征点的随机数可以不同;在第二深度图像中对第二特征点集合中的每个第二特征点,基于针对该第二特征点的水平偏移量在水平方向上进行偏移;和/或获得第一矩形区域在竖直方向上的第二边长;将第二边长与区间[a2,b2]内针对每个第二特征点的随机数相乘并随机确定乘积的正负号,获得针对每个第二特征点的竖直偏移量,其中,a2为非负数,b2小于或等于1,针对不同的第二特征点的随机数可以不同;在第二深度图像中对第二特征点集合中的每个第二特征点,基于针对该第二特征点的竖直偏移量在竖直方向上进行偏移。在上述模拟随机偏移的实现方式中,每个第二特征点的随机偏移量可以是不同的,用于模拟目标对象在采集红外线图像和采集第二深度图像之间的时间间隔内存在局部移动或其他运动变化的情况。结合第一方面,在第一方面的第七种可能的实现方式中,对第一深度图像进行随机距离变换处理,获得第一深度图像的任一增广图像,包括:将第一深度图像与区间[a3,b3]内的随机数相乘,获得增广图像,其中,a3以及b3均为非负数。上述实现方式用于模拟目标对象与摄像头之间具有不同距离的场景。结合第一方面,在第一方面的第八种可能的实现方式中,对第一深度图像进行遮挡处理,获得第一深度图像的任一增广图像,包括:确定第一深度图像中的图像区域S1;将S1中的像素的像素值用区间[a4,b4]内的随机数替代,获得增广图像,其中,a4为非负数,b4小于或等于目标对象与摄像头之间的距离。上述实现方式用于模拟目标对象与摄像头之间存在遮挡物本文档来自技高网...

【技术保护点】
1.一种图像处理方法,其特征在于,包括:获得第一深度图像,所述第一深度图像包括目标对象与摄像头之间的距离信息;对所述第一深度图像进行增广处理,获得所述第一深度图像的至少一个增广图像,其中,所述增广处理包括以下至少一种:特征点偏移处理、随机距离变换处理、遮挡处理、数据缺失处理以及高斯模糊处理。

【技术特征摘要】
1.一种图像处理方法,其特征在于,包括:获得第一深度图像,所述第一深度图像包括目标对象与摄像头之间的距离信息;对所述第一深度图像进行增广处理,获得所述第一深度图像的至少一个增广图像,其中,所述增广处理包括以下至少一种:特征点偏移处理、随机距离变换处理、遮挡处理、数据缺失处理以及高斯模糊处理。2.根据权利要求1所述的图像处理方法,其特征在于,所述获得第一深度图像,包括:获得目标场景的红外图像以及第二深度图像,所述第二深度图像包括所述目标场景与所述摄像头之间的距离信息,所述目标场景包括所述目标对象;在所述红外图像中确定所述目标对象的第一特征点集合;将所述第一特征点集合投射到所述第二深度图像中,在所述第二深度图像中确定与所述第一特征点集合对应的第二特征点集合;在所述第二深度图像中确定一个包括所述第二特征点集合的第一矩形区域,并将所述第一矩形区域确定为所述第一深度图像。3.根据权利要求2所述的图像处理方法,其特征在于,所述在所述第二深度图像中确定一个包括所述第二特征点集合的第一矩形区域,包括:确定所述第二特征点集合中的第二特征点的横坐标最小值xmin、横坐标最大值xmax、纵坐标最小值ymin以及纵坐标最大值ymax;将以点(xmin,ymin)、(xmax,ymin)、(xmin,ymax)以及(xmax,ymax)为顶点的矩形区域确定为所述第一矩形区域。4.根据权利要求1-3中任一项所述的图像处理方法,其特征在于,所述获得第一深度图像之后,所述对所述第一深度图像进行增广处理之前,所述方法还包括:对所述第一深度图像进行缩放处理。5.根据权利要求2或3所述的图像处理方法,其特征在于,对所述第一深度图像进行特征点偏移处理,获得所述第一深度图像的任一增广图像,包括:在所述第二深度图像中对所述第二特征点集合中的每个第二特征点在水平方向上进行随机偏移和/或在竖直方向上进行随机偏移,获得偏移后的第二特征点集合;在所述第二深度图像中确定一个包括所述偏移后的第二特征点集合的第二矩形区域,并将所述第二矩形区域确定为所述增广图像。6.根据权利要求5所述的图像处理方法,其特征在于,所述在所述第二深度图像中对所述第二特征点集合中的每个第二特征点在水平方向上进行随机偏移和/或在竖直方向上进行随机偏移,包括:获得所述第一矩形区域在水平方向上的第一边长;将所述第一边长与区间[a1,b1]内的随机数相乘并随机确定乘积的正负号,获得水平偏移量,其中,a1为非负数,b1小于或等于1;在所述第二深度图像中基于所述水平偏移量对所述第二特征点集合中的每个第二特征点在水平方向上进行偏移;和/或获得所述第一矩形区域在竖直方向上的第二边长;将所述第二边长与区间[a2,b2]内的随机数相乘并随机确定乘积的正负号,获得竖直偏移量,其中,a2为非负数,b2小于或等于1;在所述第二深度图像中基于所述竖直偏移量对所述第二特征点集合中的每个第二特征点在竖直方向上进行偏移。7.根据权利要求5所述的图像处理方法,其特征在于,所述在所述第二深度图像中对所述第二特征点集合中的每个第二特征点在水平方向上进行随机偏移和/或在竖直方向上进行随机偏移,包括:获得所述第一矩形区域在水平方向上的第一边长;将所述第一边长与区间[a1,b1]内针对每个第二特征点的随机数相乘并随机确定乘积的正负号,获得针对每个第二特征点的水平偏移量,其中,a1为非负数,b1小于或等于1,针对不同的第二特征点的随机数可以不同;在所述第二深度图像中对所述第二特征点集合中的每个第二特征点,基于针对该第二特征点的水平偏移量在水平方向上进行偏移;和/或获得所述第一矩形区域在竖直方向上的第二边长;将所述第二边长与区间[a2,b2]内针对每个第二特征点的随机数相乘并随机确定乘积的正负号,获得针对每个第二特征点的竖直偏移量,其中,a2为非负数,b2小于或等于1,针对不同的第二特征点的随机数可以不同;在所述第二深度图像中对所述第二特征点集合中的每个第二特征点,基于针对该第二特征点的竖直偏移量在竖直方向上进行偏移。8.根据权利...

【专利技术属性】
技术研发人员:何益升
申请(专利权)人:北京旷视科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1