视频流中行人检测方法与系统技术方案

技术编号:15640276 阅读:63 留言:0更新日期:2017-06-16 04:53
本发明专利技术提供一种视频流中行人检测方法与系统,获取多路视频流,对每路视频流分别进行移动目标检测,分割出每张图片的移动目标区域,通过基于分治的合并算法将拼接成单张大图,获得拼接图像,通过卷积神经网络对拼接图像进行神经网络预测,获得检测结。整个过程中,通过分治的区域合并算法将移动目标检测算法和卷积神经网络行人检测算法高效的结合在一起,实现高效且准确对视频流中行人检测。

【技术实现步骤摘要】
视频流中行人检测方法与系统
本专利技术涉及图像跟踪
,特别是涉及视频流中行人检测方法与系统。
技术介绍
视频流中行人检测技术目前广泛应用于智能家居及工业安防领域。行人检测技术通过对前端摄像头采集的视频流逐帧分析获得行人区域,并以此为触发条件将检测得到的人行物体上报给用户。视频流中行人检测技术大体分为两类:1、基于移动目标的检测,该类技术通过无人的静止图像作为前景图像,实时分析每一帧图像与前景图像的差值,对每个位置的像素建立其属于静止目标或移动目标的概率,将属于移动目标的位置合并联通为行人区域,该类技术具有检测速度快的优点;2、基于卷积神经网络的检测,该类技术设计对行人区域有高响应值的卷积神经网络,将每一帧图像通过卷积神经网络获得其特征图像,在特征图像上滑窗检测计算每个窗口的响应值,将高响应值的窗口输出为行人区域,该类技术具有检测精度高的优点。虽然上述两类视频流中行人检测技术都能实现行人检测且具有各自的优点,但基于移动目标的检测技术容易造成误报,其检测结果不准确,基于卷积神经网络的检测检测过程数据处理复杂,效率低且结果不准确。
技术实现思路
基于此,有必要针对一般视频流中行人检测技术检测效率低且检测结果不准确的问题,提供一种检测效率高且检测结果准确的视频流中行人检测方法与系统。一种视频流中行人检测方法,包括步骤:获取多路视频流,对每路视频流分别进行移动目标检测,分割出每张图片的移动目标区域;通过基于分治的合并算法将每张图像的移动目标区域拼接成单张大图,获得拼接图像;通过卷积神经网络对拼接图像进行神经网络预测,获得检测结果。一种视频流中行人检测系统,包括:分割模块,用于获取多路视频流,对每路视频流分别进行移动目标检测,分割出每张图片的移动目标区域;拼接模块,用于通过基于分治的合并算法将每张图像的移动目标区域拼接成单张大图,获得拼接图像;检测模块,用于通过卷积神经网络对拼接图像进行神经网络预测,获得检测结果。本专利技术视频流中行人检测方法与系统,获取多路视频流,对每路视频流分别进行移动目标检测,分割出每张图片的移动目标区域,通过基于分治的合并算法将拼接成单张大图,获得拼接图像,通过卷积神经网络对拼接图像进行神经网络预测,获得检测结。整个过程中,通过分治的区域合并算法将移动目标检测算法和卷积神经网络行人检测算法高效的结合在一起,实现高效且准确对视频流中行人检测。附图说明图1为本专利技术视频流中行人检测方法第一个实施例的流程示意图;图2为本专利技术视频流中行人检测方法第二个实施例的流程示意图;图3至图7为在本专利技术视频流中行人检测方法其中一个应用实例中,每张图片的移动目标区域填充过程示意图;图8为本专利技术视频流中行人检测系统第一个实施例的结构示意图;图9为本专利技术视频流中行人检测系统第一个实施例的结构示意图。具体实施方式为了清楚解释说明本专利技术视频流中行人检测方法与系统的技术方案,下面将针对后续内容中出现的符号定义进行说明,具体如下表1、表2、表3以及表4所示。表1为符号与定义第一对应表符号idxfullvalidroi说明移动帧侧区域序号最终合并后的图像可填充区域真实填充区域表2为符号与定义第二对应表符号rightdown说明填充后右侧剩余区域填充后下方剩余区域表3为符号与定义第三对应表表4为符号与定义第四对应表如图1所示,一种视频流中行人检测方法,其特征在于,包括步骤:S200:获取多路视频流,对每路视频流分别进行移动目标检测,分割出每张图片的移动目标区域。获取多路视频流,并且针对每路视频分别进行移动目标检测,在检测之后分割出每张图片的移动目标区域。在这里,获取视频流的方式可以是采用相机等视频拍摄设备实时采集,也可以是外部存储的数据直接获取导入的视频流。在分割出的每张图片的移动目标区域中可能有行人也可能没有行人。S400:通过基于分治的合并算法将每张图像的移动目标区域拼接成单张大图,获得拼接图像。针对步骤S200获得的每张图片的移动目标区域进行拼接,具体采用分治的合并算法进行拼接,获得拼接图像。S600:通过卷积神经网络对拼接图像进行神经网络预测,获得检测结果。卷积神经网络主要用来识别位移、缩放及其他形式扭曲不变性的图形。卷积神经网络可以并行学习,另外,卷积神经网络以其局部权值共享的特殊结构在语音识别和图像处理方面有着独特的优越性,其布局更接近于实际的生物神经网络,权值共享降低了网络的复杂性,特别是多维输入向量的图像可以直接输入网络这一特点避免了特征提取和分类过程中数据重建的复杂度。在这里,采用卷积神经网络对拼接图像进行神经网络预测,获得检测结果。由于卷积神经网络只需针对单个图像(拼接图像)进行神经网络预测,在进行视频流中行人检测过程需要处理的数据量已经大大减小。非必要的,在获得检测结果可以将检测结果推送至用户,推送方式可以采用远程数据传输,例如通过无线网络远程传输方式推送,以便用户及时且准确了解视频流中行人检测结果。本专利技术视频流中行人检测方法,获取多路视频流,对每路视频流分别进行移动目标检测,分割出每张图片的移动目标区域,通过基于分治的合并算法将拼接成单张大图,获得拼接图像,通过卷积神经网络对拼接图像进行神经网络预测,获得检测结。整个过程中,通过分治的区域合并算法将移动目标检测算法和卷积神经网络行人检测算法高效的结合在一起,实现高效且准确对视频流中行人检测。如图2所示,在其中一个实施例中,步骤S200包括:S220:通过分布式服务器集群应用移动目标检测算法,并行检测每路视频流中每一帧的移动区域,获得移动区域检测结果。分布式服务器集群是指一定数量服务器分布式设置,通过这些分布服务器群,能够第一时间对获取的视频流进行并行处理。在每个服务器内应用移动目标检测算法,每个服务器处理自身获取的一路视频流,并行检测该路视频流中每一帧的移动区域。S240:根据移动区域检测结果,分割出每张图片的移动目标区域。针对步骤S220中检测得到的每路视频流中每一帧的移动区域,分割出每张图片的移动目标区域。具体来说,输入多视频流通过并行服务器的移动目标检测算法获得所有待合并(检测)的移动区域。Q{Iidx}={I1,I2...IN},idx∈[1,N],Q{Sidx}={S1,S2...SN}。如图2所示,在其中一个实施例中,步骤S400包括:S420:获取卷积神经网络中设定的固定宽度与高度值。卷积神经网络中设定的固定宽度与高度值是基于行业准则设定好的数值,可以将卷积神经网络处理图片的尺寸大小理解为一个处理窗口的大小,这个窗口固定有宽度和高度,而这个宽度和高度即为卷积神经网络中设定的固定宽度与高度值。S440:根据卷积神经网络模型中设定的固定宽度与高度值,确定拼接图像的初始矩形区域大小,获得初始拼接图像。最终获得的拼接图像的尺寸大小即为卷积神经网络中固定宽度与高度值。简单来说,在这里划设一个拼接图像的矩形区域,这个矩形区域的宽度与高度值等于卷积神经网络模型中设定的固定宽度与高度值。S460:根据每张图片的移动目标区域的高度值,对每张图片的移动目标区域根据高度值由大到小进行优先级排序,获得移动目标区域排序集合。在步骤S200获得的每张图片的移动目标区域中,有的图片的移动目标区域的高度大、有的小,为了将一定数量的图片的移动目标区域填充至步骤S44本文档来自技高网...
视频流中行人检测方法与系统

【技术保护点】
一种视频流中行人检测方法,其特征在于,包括步骤:获取多路视频流,对每路所述视频流分别进行移动目标检测,分割出每张图片的移动目标区域;通过基于分治的合并算法将所述每张图像的移动目标区域拼接成单张大图,获得拼接图像;通过卷积神经网络对所述拼接图像进行神经网络预测,获得检测结果。

【技术特征摘要】
1.一种视频流中行人检测方法,其特征在于,包括步骤:获取多路视频流,对每路所述视频流分别进行移动目标检测,分割出每张图片的移动目标区域;通过基于分治的合并算法将所述每张图像的移动目标区域拼接成单张大图,获得拼接图像;通过卷积神经网络对所述拼接图像进行神经网络预测,获得检测结果。2.根据权利要求1所述的视频流中行人检测方法,其特征在于,所述对每路所述视频流分别进行移动目标检测,分割出每张图片的移动目标区域的步骤包括:通过分布式服务器集群应用移动目标检测算法,并行检测每路所述视频流中每一帧的移动区域,获得移动区域检测结果;根据所述移动区域检测结果,分割出每张图片的移动目标区域。3.根据权利要求1所述的视频流中行人检测方法,其特征在于,所述通过基于分治的合并算法将所述每张图像的移动目标区域拼接成单张大图,获得拼接图像的步骤包括:获取卷积神经网络中设定的固定宽度与高度值;根据所述卷积神经网络模型中设定的固定宽度与高度值,确定拼接图像的初始矩形区域大小,获得初始拼接图像;根据所述每张图片的移动目标区域的高度值,对所述每张图片的移动目标区域根据高度值由大到小进行优先级排序,获得移动目标区域排序集合;根据优先级顺序依次将所述每张图片的移动目标区域填充至所述初始拼接图像,获得所述每张图像的移动目标区域拼接成的无缝单张大图。4.根据权利要求3所述的视频流中行人检测方法,其特征在于,所述根据优先级顺序依次将所述每张图片的移动目标区域填充至所述初始拼接图像的步骤包括:在所述初始拼接图像中构建坐标,其中,所述初始拼接图像的任意一个角作为坐标原点,坐标X轴表征所述移动目标区的宽度,坐标Y轴表征所述移动目标区的高度;确定当前可填充区域,初始时,可填充区域为所述初始拼接图像;从所述移动目标区域排序集合中第一元素开始,查找图片的移动目标区域的宽度值与高度值均小于或等于所述当前可填充区域的宽度值与高度值的元素;若查找到,则确定当前真实填充区域,并将查找到的图片的移动目标区域的像素填充至所述当前真实填充区域,其中,所述当前真实填充区域的高度值等于查找到的图片的移动目标区域的高度值,所述当前真实填充区域的宽度值等于查找到的图片的移动目标区域的宽度值,所述当前真实填充区域的起始点为当前可填充区域四个方位角中与坐标原点方位相同的一个角;计算填充后所述真实填充区域X轴方向侧剩余的可填充区域以及Y轴方向侧剩余的可填充区域;分别使用真实填充区域X轴方向侧剩余的可填充区域以及Y轴方向侧剩余的可填充区域作为当前可填充区域,返回确定当前可填充区域的步骤。5.根据权利要求1所述的视频流中行人检测方法,其特征在于,所述通过卷积神经网络对所述拼接图像进行神经网络预测,获得检测结果的步骤之后还包括:推送所...

【专利技术属性】
技术研发人员:陈榕齐
申请(专利权)人:深圳市智美达科技股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1