一种基于机器学习的复杂背景下人数检测系统技术方案

技术编号：20390499 阅读：13 留言：0更新日期：2019-02-20 03:05

本发明专利技术涉及一种基于机器学习的复杂背景下人数检测系统。可在复杂背景下通过视频监控检测人数，提出了一种搭载红外摄像头的基于机器学习的人数检测系统，增强了夜间及弱环境光、低照明度下的人数检测能力，采用基于头肩的聚合通道特征（ACF）算法和Adaboost算法相结合的方法，可以提高在面部存在遮挡、光照不均匀、存在噪声等复杂背景下实时检测人数的正确率和速度，并且可以检测多角度的人体，正面、背面、侧面均可检测。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于机器学习的复杂背景下人数检测系统
本专利技术涉及一种基于机器学习的复杂背景下人数检测系统。
技术介绍
目前，在视频中监测人数的主要方法有：使用sobel和canny等算子边缘检测人脸的结构特征、检测基于面部不变的特征(如眼睛、眉毛)、使用匹配算法来检测视频中人脸是否存在与模板相匹配的部分、使用经过训练的分类器来检测人脸。使用sobel和canny算子检测人脸的结构特征方法简单，检测速度较快，但是在复杂背景下精度较差，容易出现较大的误检。由于复杂背景下存在面部遮挡，光照不均匀等情况，检测面部不变特征的方法很容易受到其影响，精度较差。由于人种、肤色、胖瘦等因素，使用匹配算法需要采集大量的样本，才可以得到一个稳定的人脸模板，匹配过程中计算量太大，不适合用于存在多人的实时视频监控。使用经过训练的分类器是目前常用且效果较好的方法。主要的方法有提取每帧图片的方向梯度直方图(HOG)特征和支持向量机(SVM)相结合的方法。但是这种方法容易受到噪声的干扰，而且一旦人脸被遮挡，检测精度就会大大下降。由于在实际应用中，人脸不会总是面对摄像头，所以需要检测多角度的人脸，甚至需要检测人体背面，以上几种方法在此方面表现不佳。
技术实现思路
本专利技术的目的在于提供一种基于机器学习的复杂背景下人数检测系统，可在复杂背景下通过视频监控检测人数，提出了一种搭载红外摄像头的基于机器学习的人数检测系统，增强了夜间及弱环境光、低照明度下的人数检测能力，采用基于头肩的聚合通道特征(ACF)算法和Adaboost算法相结合的方法，可以提高在面部存在遮挡、光照不均匀、存在噪声等复杂背景下实时检测...

【技术保护点】
1.一种基于机器学习的复杂背景下人数检测系统，其特征在于，包括红外摄像头、搭载基于头肩的聚合通道特征算法和Adaboost算法的ACF检测器的微处理器；所述红外摄像头，用于实时采集图像，形成视频流，并将每一帧图像送入微处理器的ACF检测器中；所述微处理器对输入原始图像进行处理，处理过程如下：(1)通过ACF检测器根据输入图像的高度和宽度计算图像特征金字塔尺度数量，即特征金字塔的层数；生成每个尺度的缩放比例，对输入原始图像进行下采样，即对上一层图像做高斯内核卷积，舍弃偶数行和偶数列，重复以上计算，得到所有层数的图像；(2)使用OpenCV的split函数，将所有层数的图像BGR像素格式拆分为R通道、G通道、B通道，使用OpenCV的rgb2luv_sse函数进行转换，将图像转换到LUV颜色空间，得到L、U、V三个颜色特征通道；(3)对所有层数的图像像素进行非线性变换，计算梯度幅值和梯度方向；梯度幅值取垂直方向的幅值梯度，梯度方向的角度范围为[0,π)；与(‑1,0,1)梯度算子做卷积得到水平方向梯度Gx，与(‑1,0,1)

【技术特征摘要】
1.一种基于机器学习的复杂背景下人数检测系统，其特征在于，包括红外摄像头、搭载基于头肩的聚合通道特征算法和Adaboost算法的ACF检测器的微处理器；所述红外摄像头，用于实时采集图像，形成视频流，并将每一帧图像送入微处理器的ACF检测器中；所述微处理器对输入原始图像进行处理，处理过程如下：(1)通过ACF检测器根据输入图像的高度和宽度计算图像特征金字塔尺度数量，即特征金字塔的层数；生成每个尺度的缩放比例，对输入原始图像进行下采样，即对上一层图像做高斯内核卷积，舍弃偶数行和偶数列，重复以上计算，得到所有层数的图像；(2)使用OpenCV的split函数，将所有层数的图像BGR像素格式拆分为R通道、G通道、B通道，使用OpenCV的rgb2luv_sse函数进行转换，将图像转换到LUV颜色空间，得到L、U、V三个颜色特征通道；(3)对所有层数的图像像素进行非线性变换，计算梯度幅值和梯度方向；梯度幅值取垂直方向的幅值梯度，梯度方向的角度范围为[0,π)；与(-1,0,1)梯度算子做卷积得到水平方向梯度Gx，与(-1,0,1)T梯度算子做卷积得到垂直方向梯度Gy，梯度方向为使用2D三角滤波器进行图像的快速卷积；将梯度幅值进行归一化消除不同特征之间量纲不同带来的影响；得到梯度幅值一个特征通道；(4)计算梯度方向直方图；将梯度方向[0,π)分为6个区间，将所有层数的图像的梯度幅值作为权重，把图像的梯度方向投影到6个区间，统计6个区间的投影数，计算梯度方向直方图，得到6个通道特征；(5)经过(2)、(3)、(4)步骤的计算，所有层数图像中每个像素都有一个包含10个特征通道的聚合通道特征；若取得的通道尺寸和预先设定的通道尺寸不匹配，则进行降采样，计算每个通道的系数，以给定的系数进行特征图的重采样，接着调用OpenCV的convTri函数进行图像平滑，最后进行图像填充，前三个通道为颜色通道，采用复制方式进行填充，其余通道为梯度幅值通道和梯度方向直方图通道，采用0进行填充；(6)对所有层数的图像的聚合通道特征进行滑动窗口检测。选取16×16像素大小的窗口，以8像素...

【专利技术属性】
技术研发人员：魏榕山，欧阳魁，杨培祥，
申请(专利权)人：福州大学，
类型：发明
国别省市：福建,35

全部详细技术资料下载我是这个专利的主人