当前位置: 首页 > 专利查询>福州大学专利>正文

一种基于机器学习的复杂背景下人数检测系统技术方案

技术编号:20390499 阅读:13 留言:0更新日期:2019-02-20 03:05
本发明专利技术涉及一种基于机器学习的复杂背景下人数检测系统。可在复杂背景下通过视频监控检测人数,提出了一种搭载红外摄像头的基于机器学习的人数检测系统,增强了夜间及弱环境光、低照明度下的人数检测能力,采用基于头肩的聚合通道特征(ACF)算法和Adaboost算法相结合的方法,可以提高在面部存在遮挡、光照不均匀、存在噪声等复杂背景下实时检测人数的正确率和速度,并且可以检测多角度的人体,正面、背面、侧面均可检测。

【技术实现步骤摘要】
一种基于机器学习的复杂背景下人数检测系统
本专利技术涉及一种基于机器学习的复杂背景下人数检测系统。
技术介绍
目前,在视频中监测人数的主要方法有:使用sobel和canny等算子边缘检测人脸的结构特征、检测基于面部不变的特征(如眼睛、眉毛)、使用匹配算法来检测视频中人脸是否存在与模板相匹配的部分、使用经过训练的分类器来检测人脸。使用sobel和canny算子检测人脸的结构特征方法简单,检测速度较快,但是在复杂背景下精度较差,容易出现较大的误检。由于复杂背景下存在面部遮挡,光照不均匀等情况,检测面部不变特征的方法很容易受到其影响,精度较差。由于人种、肤色、胖瘦等因素,使用匹配算法需要采集大量的样本,才可以得到一个稳定的人脸模板,匹配过程中计算量太大,不适合用于存在多人的实时视频监控。使用经过训练的分类器是目前常用且效果较好的方法。主要的方法有提取每帧图片的方向梯度直方图(HOG)特征和支持向量机(SVM)相结合的方法。但是这种方法容易受到噪声的干扰,而且一旦人脸被遮挡,检测精度就会大大下降。由于在实际应用中,人脸不会总是面对摄像头,所以需要检测多角度的人脸,甚至需要检测人体背面,以上几种方法在此方面表现不佳。
技术实现思路
本专利技术的目的在于提供一种基于机器学习的复杂背景下人数检测系统,可在复杂背景下通过视频监控检测人数,提出了一种搭载红外摄像头的基于机器学习的人数检测系统,增强了夜间及弱环境光、低照明度下的人数检测能力,采用基于头肩的聚合通道特征(ACF)算法和Adaboost算法相结合的方法,可以提高在面部存在遮挡、光照不均匀、存在噪声等复杂背景下实时检测人数的正确率和速度,并且可以检测多角度的人体,正面、背面、侧面均可检测。为实现上述目的,本专利技术的技术方案是:一种基于机器学习的复杂背景下人数检测系统,包括红外摄像头、搭载基于头肩的聚合通道特征算法和Adaboost算法的ACF检测器的微处理器;所述红外摄像头,用于实时采集图像,形成视频流,并将每一帧图像送入微处理器的ACF检测器中;所述微处理器对输入原始图像进行处理,处理过程如下:(1)通过ACF检测器根据输入图像的高度和宽度计算图像特征金字塔尺度数量,即特征金字塔的层数;生成每个尺度的缩放比例,对输入原始图像进行下采样,即对上一层图像做高斯内核卷积,舍弃偶数行和偶数列,重复以上计算,得到所有层数的图像;(2)使用OpenCV的split函数,将所有层数的图像BGR像素格式拆分为R通道、G通道、B通道,使用OpenCV的rgb2luv_sse函数进行转换,将图像转换到LUV颜色空间,得到L、U、V三个颜色特征通道;(3)对所有层数的图像像素进行非线性变换,计算梯度幅值和梯度方向;梯度幅值取垂直方向的幅值梯度,梯度方向的角度范围为[0,π);与(-1,0,1)梯度算子做卷积得到水平方向梯度Gx,与(-1,0,1)T梯度算子做卷积得到垂直方向梯度Gy,梯度方向为使用2D三角滤波器进行图像的快速卷积;将梯度幅值进行归一化消除不同特征之间量纲不同带来的影响;得到梯度幅值一个特征通道;(4)计算梯度方向直方图;将梯度方向[0,π)分为6个区间,将所有层数的图像的梯度幅值作为权重,把图像的梯度方向投影到6个区间,统计6个区间的投影数,计算梯度方向直方图,得到6个通道特征;(5)经过(2)、(3)、(4)步骤的计算,所有层数图像中每个像素都有一个包含10个特征通道的聚合通道特征;若取得的通道尺寸和预先设定的通道尺寸不匹配,则进行降采样,计算每个通道的系数,以给定的系数进行特征图的重采样,接着调用OpenCV的convTri函数进行图像平滑,最后进行图像填充,前三个通道为颜色通道,采用复制方式进行填充,其余通道为梯度幅值通道和梯度方向直方图通道,采用0进行填充;(6)对所有层数的图像的聚合通道特征进行滑动窗口检测。选取16×16像素大小的窗口,以8像素为步长,从图像的左上角开始,向右和向下滑动,将当前窗口的特征描述子送入经过头肩样本训练的增强弱分类器,分类器对特征描述子进行评分;如果当前窗口评分低于阈值,则立即停止判断,若当前窗口评分高于阈值,则记录该窗口的位置和置信度,框出人体的位置,直到滑动窗口到达图片的右下角;(7)使用caltech行人数据集和MATLAB计算机视觉工具箱处理样本和训练模型;提取行人数据集中的头肩样本的聚合通道特征,采用Adaboost算法训练,得到基于增强决策树的头肩检测分类器;(8)由于在不同尺度下的图片进行特征提取的滑动窗口的大小是不变的,所以需要将经过标记后的图像金字塔中每个尺度的图片放大到原始图像的大小;根据步骤(1)得到的缩放比例,使用OpenCV的resize函数,将经过标记的不同尺度的图像恢复到原始图像大小,就可以把原始图像上的所有人体都标记出来;(9)由于采用滑动窗口检测,同一个人体可能会出现多个标记框,每个框都带有分类器的得分,每个框有可能互相重叠;因此需要去除冗余的标记框,只保留最准确的标记框;由于一帧视频里面可能存在多个人,单纯取得分最高的标记框是不可行的,因此采用非极大值抑制算法,即首先将所有的框按照分类器得分从低到高排序;选择得分最高的框,遍历其余的框,如果和得分最高的框的重叠面积与这两个框面积之间最小值的比值大于设定的阈值,则删除该框;接着从剩下还未处理的框中选取得分最高的框继续以上处理,直到不存在重叠的标记框;(10)统计标记框的个数,即为检测到的人数;并在每个框旁显示置信度。在本专利技术一实施例中,还包括一WIFI模块,用于将微处理器处理后的每一帧图像通过无线发送至监控室接收端,实现实时监控人数。在本专利技术一实施例中,所述步骤(3)中,使用2D三角滤波器进行图像的快速卷积,其半径取值为5。在本专利技术一实施例中,所述步骤(3)中,将梯度幅值进行归一化的归一化系数为0.005。相较于现有技术,本专利技术具有以下有益效果:本专利技术基于机器学习的复杂背景下人数检测系统具有较好的检测正确率和检测速度。搭载的红外摄像头使得检测系统在夜间及弱环境光、低照明度下仍可以进行视频监控。微处理器搭载基于头肩的聚合通道特征(ACF)算法和Adaboost算法的ACF检测器,通过对每个像素采集10个聚合通道特征送入分类器分类,可以提高面部存在遮挡、光照不均匀、存在噪声等复杂背景下的人数检测正确率和检测速度,并且可以检测多角度的人体,正面、背面、侧面均可识别。WIFI模块将经过人数标记的视频实时发送到监控端。所以本专利技术提出的系统可以24小时,多角度实时检测人数。附图说明图1为本专利技术人数检测系统框图。图2为本专利技术算法工作流程图。图3为本专利技术人数检测系统工作流程图。具体实施方式下面结合附图,对本专利技术的技术方案进行具体说明。本专利技术提供了一种基于机器学习的复杂背景下人数检测系统,包括红外摄像头、搭载基于头肩的聚合通道特征算法和Adaboost算法的ACF检测器的微处理器;所述红外摄像头,用于实时采集图像,形成视频流,并将每一帧图像送入微处理器的ACF检测器中;所述微处理器对输入原始图像进行处理,处理过程如下:(1)通过ACF检测器根据输入图像的高度和宽度计算图像特征金字塔尺度数量,即特征金字塔的层数;生成每个尺度的缩放比例,对输入原始图像进行下采样,即本文档来自技高网...

【技术保护点】
1.一种基于机器学习的复杂背景下人数检测系统,其特征在于,包括红外摄像头、搭载基于头肩的聚合通道特征算法和Adaboost算法的ACF检测器的微处理器;所述红外摄像头,用于实时采集图像,形成视频流,并将每一帧图像送入微处理器的ACF检测器中;所述微处理器对输入原始图像进行处理,处理过程如下:(1)通过ACF检测器根据输入图像的高度和宽度计算图像特征金字塔尺度数量,即特征金字塔的层数;生成每个尺度的缩放比例,对输入原始图像进行下采样,即对上一层图像做高斯内核卷积,舍弃偶数行和偶数列,重复以上计算,得到所有层数的图像;(2)使用OpenCV的split函数,将所有层数的图像BGR像素格式拆分为R通道、G通道、B通道,使用OpenCV的rgb2luv_sse函数进行转换,将图像转换到LUV颜色空间,得到L、U、V三个颜色特征通道;(3)对所有层数的图像像素进行非线性变换,计算梯度幅值和梯度方向;梯度幅值取垂直方向的幅值梯度,梯度方向的角度范围为[0,π);与(‑1,0,1)梯度算子做卷积得到水平方向梯度Gx,与(‑1,0,1)

【技术特征摘要】
1.一种基于机器学习的复杂背景下人数检测系统,其特征在于,包括红外摄像头、搭载基于头肩的聚合通道特征算法和Adaboost算法的ACF检测器的微处理器;所述红外摄像头,用于实时采集图像,形成视频流,并将每一帧图像送入微处理器的ACF检测器中;所述微处理器对输入原始图像进行处理,处理过程如下:(1)通过ACF检测器根据输入图像的高度和宽度计算图像特征金字塔尺度数量,即特征金字塔的层数;生成每个尺度的缩放比例,对输入原始图像进行下采样,即对上一层图像做高斯内核卷积,舍弃偶数行和偶数列,重复以上计算,得到所有层数的图像;(2)使用OpenCV的split函数,将所有层数的图像BGR像素格式拆分为R通道、G通道、B通道,使用OpenCV的rgb2luv_sse函数进行转换,将图像转换到LUV颜色空间,得到L、U、V三个颜色特征通道;(3)对所有层数的图像像素进行非线性变换,计算梯度幅值和梯度方向;梯度幅值取垂直方向的幅值梯度,梯度方向的角度范围为[0,π);与(-1,0,1)梯度算子做卷积得到水平方向梯度Gx,与(-1,0,1)T梯度算子做卷积得到垂直方向梯度Gy,梯度方向为使用2D三角滤波器进行图像的快速卷积;将梯度幅值进行归一化消除不同特征之间量纲不同带来的影响;得到梯度幅值一个特征通道;(4)计算梯度方向直方图;将梯度方向[0,π)分为6个区间,将所有层数的图像的梯度幅值作为权重,把图像的梯度方向投影到6个区间,统计6个区间的投影数,计算梯度方向直方图,得到6个通道特征;(5)经过(2)、(3)、(4)步骤的计算,所有层数图像中每个像素都有一个包含10个特征通道的聚合通道特征;若取得的通道尺寸和预先设定的通道尺寸不匹配,则进行降采样,计算每个通道的系数,以给定的系数进行特征图的重采样,接着调用OpenCV的convTri函数进行图像平滑,最后进行图像填充,前三个通道为颜色通道,采用复制方式进行填充,其余通道为梯度幅值通道和梯度方向直方图通道,采用0进行填充;(6)对所有层数的图像的聚合通道特征进行滑动窗口检测。选取16×16像素大小的窗口,以8像素...

【专利技术属性】
技术研发人员:魏榕山欧阳魁杨培祥
申请(专利权)人:福州大学
类型:发明
国别省市:福建,35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1