一种基于实例分割的监控视频多目标人脸检测方法及系统技术方案

技术编号:20944866 阅读:21 留言:0更新日期:2019-04-24 02:32
本发明专利技术公开了一种基于实例分割的监控视频多目标人脸检测方法及系统,其中,所述方法包括:采集待训练的人脸图像数据集,基于标注工具对人脸图像数据集进行标注,获取训练数据集;基于监控设备条件设置用于训练人脸检测系统的模型参数;基于标记后的人脸图像数据集和模型参数对所述人脸检测系统进行训练,获取训练后的人脸检测系统;将监控视频中的每一帧图像输入训练后的人脸检测系统中,对输入的每一帧图像进行多目标人脸检测,获取检测结果。在本发明专利技术实施例中,提高了对人脸目标图像的识别准确率。

A Multi-objective Face Detection Method and System for Monitoring Video Based on Case Segmentation

The invention discloses a multi-objective face detection method and system for monitoring video based on instance segmentation, in which the methods include: collecting the face image data set to be trained, tagging the face image data set based on tagging tool, acquiring the training data set, setting model parameters for training the face detection system based on the condition of monitoring equipment, and human being based on tagging. Face image data set and model parameters are trained to acquire the trained face detection system. Each frame of the surveillance video is input into the trained face detection system, and multi-target face detection is carried out for each frame of the input image to obtain the detection results. In the embodiment of the present invention, the recognition accuracy of the face target image is improved.

【技术实现步骤摘要】
一种基于实例分割的监控视频多目标人脸检测方法及系统
本专利技术涉及多目标人脸检测
,尤其涉及一种基于实例分割的监控视频多目标人脸检测方法及系统。
技术介绍
随着科技的迅速发展,生物特征(人脸、指纹、虹膜等)检测识别技术被广泛应用于安防监控、身份认证、信息安全等领域,其中多目标人脸检测技术是生物特征检测识别
的一个主流研究方向;在安防监控领域,有文献表明,专业人员在监视两个监视画面的情况下,22分钟后将会错过95%的监控画面中的行为;而多目标人脸检测技术在安防监控的应用可以达到解放人力、提高检测准确率的效果;此外,通过多目标人脸检测技术检测到的人脸图像,可通过图像处理技术(如:跟踪、重构、识别等),从监控视频中获得更为重要的信息;因此,多目标人脸检测技术在安防监控领域有很好的应用价值。现阶段的多目标人脸检测技术主要包括基于传统机器学习算法的人脸检测方法和基于深度学习的人脸检测方法;基于传统机器学习的人脸检测算法多是基于滑动窗口的框架或是根据特征点进行匹配,具有明显的速度优势;而基于深度学习的人脸检测方法主要是利用卷积神经网络进行特征提取,在准确率及多目标检测方面具有很好的实现效果,并且相对于传统的机器学习算法能够以较少的时间花费换取大幅度的准确率提升,因此基于深度学习的人脸检测算法已成为多目标人脸检测的主流研究方向。现有的多目标人脸检测算法主要实现了人脸的检测及人脸目标框的定位,其提取的人脸目标特征维度大,空间量化较为粗糙,无法准确定位,具有一定的背景噪声,不利于进一步的图像处理,导致部分高效、实用的图像处理技术(如:人脸图像超分辨率重构、人脸图像矫正等)在监控视频上的应用难以实现。因此,急需一种面向监控视频的多目标人脸检测分割方法。
技术实现思路
本专利技术的目的在于克服现有技术的不足,本专利技术提供了一种基于实例分割的监控视频多目标人脸检测方法及系统,减少训练时间,提高了对人脸目标图像的识别准确率,能够在复杂的监控画面上获取精确的人脸信息,将为监控视频的人脸图像超分辨率重构、人脸图像矫正等技术提供了一种新思路。为了解决上述技术问题,本专利技术实施例提供了一种基于实例分割的监控视频多目标人脸检测方法,所述方法包括:采集待训练的人脸图像数据集,基于标注工具对人脸图像数据集进行标注,获取训练数据集;基于监控设备条件设置用于训练人脸检测系统的模型参数;基于标记后的人脸图像数据集和模型参数对所述人脸检测系统进行训练,获取训练后的人脸检测系统;将监控视频中的每一帧图像输入训练后的人脸检测系统中,对输入的每一帧图像进行多目标人脸检测,获取检测结果。可选的,所述基于标注工具对人脸图像数据集进行标注,包括:基于最近邻域差值算法将所述人脸图像数据集中的图像放缩至统一的尺寸;基于所述标注工具对尺寸统一的人脸图像数据集中绘出人脸图像的二值掩码和目标的类别进行标注,获取标注人脸图像数据集;将所述人脸图像数据集保存至Image文件,将所述标注人脸图像数据集保存至JSON文件中;所述JSON文件为标注文件信息的存储格式文件,所述JSON文件包括图像的尺寸信息、各点的位置信息和标签信息。可选的,所述基于监控设备条件设置用于训练人脸检测系统的模型参数,包括:设置模型图像规格大小,使所述模型图像与所述人脸图像数据集中的图像大小相同;基于监控设备条件设置GPU数目,所述人脸检测系统的训练类别标签、迭代次数和学习率;设置训练数据集的路径,将训练数据集导入待训练的人脸检测系统。可选的,所述基于标记后的人脸图像数据集和模型参数对所述人脸检测系统进行训练,获取训练后的人脸检测系统,包括:基于COCO物体检测数据集预训练所述人脸检测系统,对所述人脸检测系统进行泛化,初始化所述人脸检测系统的系统参数;将所述训练数据集输入所述泛化的人脸检测系统;基于卷积神经网络对输入的训练数据集中的每一张图像进行特征提取,获取特征图像;基于区域建议网络对所述特征图像生成候选区域,获取候选区域特征图像;对候选区域特征图像进行候选区域匹配,获得固定尺寸的特征图像;将所述固定尺寸的特征图像输入分类分支和二值掩码分支,进行人脸图像的目标框定位、分类并描绘出对应的二值掩码,获得特征图像中人脸图像的目标框和二值掩码;根据所述特征图像中人脸图像的目标框和二值掩码进行掩码占比计算,获取占比结果;对每个候选区域设置损失函数;基于所述模型参数对所述人脸检测系统进行迭代训练,并根据训练过程调整学习率和迭代次数,获取训练后的人脸检测系统。可选的,所述对候选区域特征图像进行候选区域匹配,获得固定尺寸的特征图像,包括:基于双线差值算法对候选区域特征图像进行候选区域匹配,获得固定尺寸的特征图像。可选的,所述对每个候选区域设置损失函数的损失函数公式为:L=Lcls+Lbox+Lmask;其中,Lcls表示分类的损失值,Lbox表示定位框的损失值,Lmask表示二值掩码的损失值。可选的,所述将监控视频中的每一帧图像输入训练后的人脸检测系统中,对输入的每一帧图像进行多目标人脸检测,获取检测结果,包括:将监控视频中的每一帧图像输入训练后的人脸检测系统中;基于卷积神经网络对输入的监控视频中的每一帧图像进行特征提取,获取监控特征图像;基于区域建议网络对所述监控特征图像生成候选区域,获取候选区域监控特征图像;对候选区域监控特征图像进行候选区域匹配,从所述候选区域监控特征图像中提取固定尺寸的监控特征图像;将所述固定尺寸的监控特征图像输入分类分支和二值掩码分支,进行人脸图像的目标框定位、分类并描绘出对应的二值掩码,获得监控图像特征中人脸图像的目标框和二值掩码;基于所述监控图像特征中人脸图像的目标框和二值掩码进行多目标人脸检测,获取检测结果。可选的,所述基于所述监控图像特征中人脸图像的目标框和二值掩码进行多目标人脸检测,获取检测结果,包括:根据所述监控图像特征中人脸图像的目标框和二值掩码进行掩码占比计算,获取计算结果;判断所述计算结果是否大于或等于预设阈值,若是,则检测到的监控图像为人脸目标图像;若否,则检测到的监控图像为非人脸目标图像;输出检测结果。另外,本专利技术实施例还提供了一种基于实例分割的监控视频多目标人脸检测系统,所述系统包括:训练数据获取模块:用于采集待训练的人脸图像数据集,基于标注工具对人脸图像数据集进行标注,获取训练数据集;参数设置模块:用于基于监控设备条件设置用于训练人脸检测系统的模型参数;训练模块:用于基于标记后的人脸图像数据集和模型参数对所述人脸检测系统进行训练,获取训练后的人脸检测系统;检测模块:用于将监控视频中的每一帧图像输入训练后的人脸检测系统中,对输入的每一帧图像进行多目标人脸检测,获取检测结果。在本专利技术实施例中,提高了识别精度,并使多目标人脸检测后图像像素点定位精准度达到像素级,从而满足了实例分割技术对像素点精准度的要求;可以对监控视频的多目标人脸图像进行实例分割,画出人脸二值掩码,将人脸图像与背景图像分割开,从而减少背景噪声的干扰,能够在复杂的监控画面上获取精确的人脸信息;通过MOB(Maskofboundingbox,掩码占比)算法,进行了预测结果的筛选,提高了识别准确率。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附本文档来自技高网
...

【技术保护点】
1.一种基于实例分割的监控视频多目标人脸检测方法,其特征在于,所述方法包括:采集待训练的人脸图像数据集,基于标注工具对人脸图像数据集进行标注,获取训练数据集;基于监控设备条件设置用于训练人脸检测系统的模型参数;基于标记后的人脸图像数据集和模型参数对所述人脸检测系统进行训练,获取训练后的人脸检测系统;将监控视频中的每一帧图像输入训练后的人脸检测系统中,对输入的每一帧图像进行多目标人脸检测,获取检测结果。

【技术特征摘要】
1.一种基于实例分割的监控视频多目标人脸检测方法,其特征在于,所述方法包括:采集待训练的人脸图像数据集,基于标注工具对人脸图像数据集进行标注,获取训练数据集;基于监控设备条件设置用于训练人脸检测系统的模型参数;基于标记后的人脸图像数据集和模型参数对所述人脸检测系统进行训练,获取训练后的人脸检测系统;将监控视频中的每一帧图像输入训练后的人脸检测系统中,对输入的每一帧图像进行多目标人脸检测,获取检测结果。2.根据权利要求1所述的监控视频多目标人脸检测方法,其特征在于,所述基于标注工具对人脸图像数据集进行标注,包括:基于最近邻域差值算法将所述人脸图像数据集中的图像放缩至统一的尺寸;基于所述标注工具对尺寸统一的人脸图像数据集中绘出人脸图像的二值掩码和目标的类别进行标注,获取标注人脸图像数据集;将所述人脸图像数据集保存至Image文件,将所述标注人脸图像数据集保存至JSON文件中;所述JSON文件为标注文件信息的存储格式文件,所述JSON文件包括图像的尺寸信息、各点的位置信息和标签信息。3.根据权利要求1所述的监控视频多目标人脸检测方法,其特征在于,所述基于监控设备条件设置用于训练人脸检测系统的模型参数,包括:设置模型图像规格大小,使所述模型图像与所述人脸图像数据集中的图像大小相同;基于监控设备条件设置GPU数目,所述人脸检测系统的训练类别标签、迭代次数和学习率;设置训练数据集的路径,将训练数据集导入待训练的人脸检测系统。4.根据权利要求1所述的监控视频多目标人脸检测方法,其特征在于,所述基于标记后的人脸图像数据集和模型参数对所述人脸检测系统进行训练,获取训练后的人脸检测系统,包括:基于COCO物体检测数据集预训练所述人脸检测系统,对所述人脸检测系统进行泛化,初始化所述人脸检测系统的系统参数;将所述训练数据集输入所述泛化的人脸检测系统;基于卷积神经网络对输入的训练数据集中的每一张图像进行特征提取,获取特征图像;基于区域建议网络对所述特征图像生成候选区域,获取候选区域特征图像;对候选区域特征图像进行候选区域匹配,获得固定尺寸的特征图像;将所述固定尺寸的特征图像输入分类分支和二值掩码分支,进行人脸图像的目标框定位、分类并描绘出对应的二值掩码,获得特征图像中人脸图像的目标框和二值掩码;根据所述特征图像中人脸图像的目标框和二值掩码进行掩码占比计算,获取占比结果;对每个候选区域设置损失函数;基于所述模型参数对所述人脸检测系统进行迭代训练,并根据训...

【专利技术属性】
技术研发人员:林凯瀚赵慧民吕巨建詹瑾陈荣军
申请(专利权)人:广东技术师范学院
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1