基于颜色和深度的行人检索方法技术

技术编号:15895808 阅读:67 留言:0更新日期:2017-07-28 20:03
本发明专利技术提供了一种基于颜色和深度图像行人检索方法,其特征在于,包括步骤:a)行人检测:使用深度学习方法中的YOLO检测器从RGB图像中检测到行人的BoundingBox;b)行人分割:取深度图像中与RGB图BoundingBox对应的矩形区域,使用区域增长方法,分割出行人区域;c)行人特征提取:利用深度图像中的分割后的mask获取RGB中行人区域,使用卷积神经网络CNN提取矢量特征;d)相似度比较:计算检索输入图像特征与图像库中的特征相似度,按相似度排序返回检索结果。

Color and depth based pedestrian retrieval method

The invention provides a retrieval method based on color and depth images of pedestrians, characterized by comprising the steps of: a) pedestrian detection: YOLO detector using deep learning method in the detection of RGB image from the BoundingBox to the pedestrian; b) pedestrian segmentation: rectangular area take and RGB map BoundingBox depth images corresponding to the use. A region growing method, segmentation of the pedestrian area; c) pedestrian feature extraction: get the pedestrian area using RGB depth image segmentation in mask after using convolutional neural network CNN vector characteristics; d) similarity comparison: Calculation of similarity retrieval and image feature in the input image database, the retrieval results are sorted by similarity.

【技术实现步骤摘要】
基于颜色和深度的行人检索方法
本专利技术涉及人工智能、机器学习、视频检索、统计学等
,具体涉及一种基于颜色和深度图像的行人检索方法。
技术介绍
在智能化监控视频分析应用中,普通监控摄像机视频分辨率普遍较低,通过人脸信息不足以进行身份的辨别,因此采取通过比较人的外貌如衣服、裤子的相似程度来确定不同视角下拍摄的对象是否为相同人。这种方法进行人识别是基于人在短时间内不会变更自身的外貌着装的假设下进行的,跨摄像头行人检索正是基于行人的外貌着装相似程度确定行人在监控视频中出现的片段,为侦查人员提供了方面。在图像侦查的领域,跨摄像头行人检索具有重大的应用价值。在监控摄像机场景进行行人识别步骤包括行人检测,行人分割,特征提取和相似度计算,其中困难之一在于单于通过RGB图像信息不能很好的将行人前景区域与背景区域分离。微软2010年6月份推出的Kinect摄像机同步采集深度视频数据和彩色图像视频数据。由于在现实场景中抓拍到的行人图像前景与背景是有一定距离的,本专利技术利用深度相机在行人分割中利用深度信息改善行人分割性能,实行跨场景的行人检索功能。
技术实现思路
本专利技术的目的在于提供了一种基于颜色本文档来自技高网...
基于颜色和深度的行人检索方法

【技术保护点】
一种基于颜色和深度图像行人检索方法,其特征在于,包括步骤:a)行人检测:使用深度学习方法中的YOLO检测器从RGB图像中检测到行人的BoundingBox;b)行人分割:取深度图像中与RGB图BoundingBox对应的矩形区域,使用区域增长方法,分割出行人区域;c)行人特征提取:利用深度图像中的分割后的mask获取RGB中行人区域,使用卷积神经网络CNN提取矢量特征;d)相似度比较:计算检索输入图像特征与图像库中的特征相似度,按相似度排序返回检索结果。

【技术特征摘要】
1.一种基于颜色和深度图像行人检索方法,其特征在于,包括步骤:a)行人检测:使用深度学习方法中的YOLO检测器从RGB图像中检测到行人的BoundingBox;b)行人分割:取深度图像中与RGB图BoundingBox对应的矩形区域,使用区域增长方法,分割出行人区域;c)行人特征提取:利用深度图像中的分割后的mask获取RGB中行人区域,使用卷积神经网络CNN提取矢量特征;d)相似度比较:计算检索输入图像特征与图像库中的特征相似度,按相似度排序返回检索结果。2.根据权利要求1所述的方法,其特征在于:所述步骤a)YOLO检测器从RGB图像中检测到行人:其中所述YOLO是一个端到端的物体检测器,使用了24个级联的卷积conv层和2个全连接fc层,其中所述conv层包括3*3和1*1两种Kernel,最后一个fc层即YOLO网络的输出。3.根据权利要求1所述的方法,其特征在于:所述步骤b)取深度图像中与RGB图BoundingBox对应的矩形区域,使用区域增长法在深度图像上分割行人,所述区域增长算法是一种基于区域与其邻近像素点的相似度判断某区域属于背景或前景。4.根据权利要求3所述的方法,其特征在于:所述区域增长算法的步骤具体包括:步骤401)选取种子点:在深度图像中物体部分区域的深度值要比背景区域深度值小很多,极小值区域刚好反应了物体与背景的区别,本发明选取深度图像的极小值...

【专利技术属性】
技术研发人员:王海滨阳平
申请(专利权)人:中科唯实科技北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1