一种雷达与摄像机融合的行人检测方法和系统技术方案

技术编号：23558723 阅读：23 留言：0更新日期：2020-03-25 04:11

本发明专利技术公开了一种雷达与摄像机融合的行人检测方法和系统，方法包括：构建用于行人检测的Mask RCNN网络结构，并对Mask RCNN网络结构进行预训练；接收雷达获取的待检测区域的雷达数据，对雷达数据进行聚类处理得到多种聚类点簇，并根据行人的物理属性对聚类点簇进行过滤，得到针对行人的聚类点簇；接收摄像机获取的待检测区域的图像数据，根据摄像机内外参将针对行人的聚类点簇转换为图像中的像素坐标，并通过卷积变换规则提取图像的感兴趣区域；将提取的感兴趣区域输入至预训练好的Mask RCNN网络结构中进行行人识别，输出行人检测结果。本发明专利技术将雷达和摄像机数据融合行人检测，利用硬件优势代替软件计算，降低了软件计算的复杂度，兼顾了准确性和时效性。

A pedestrian detection method and system based on the fusion of radar and camera

全部详细技术资料下载

【技术实现步骤摘要】
一种雷达与摄像机融合的行人检测方法和系统
本申请属于智能交通管理领域，具体涉及一种雷达与摄像机融合的行人检测方法和系统。
技术介绍
行人检测作为汽车辅助驾驶的重要环节，近年来得到了广泛的关注和研究。行人检测是计算机领域的热门研究课题之一。单传感器行人检测方法基于雷达、红外、激光、摄像机等。其特点是设备简单，经济性好。然而采用单一传感器检测行人容易造成信息盲区，且信息表达具有局限性，利用多种传感器的信息融合已成为行人检测的发展趋势。行人检测的难点主要在两个方面：一是由于不同的行人之间的体型、姿态和着装等具有很大的差异，导致从可见光图像提取行人的特征具有一定的难度；二是可见光图像容易受到不同光照条件和阴影的影响，导致行人目标之间在图像上具有显著的差异。另外，现有方法仍然存在计算复杂、实时性不强等问题。利用卷积神经网络学习目标特征最具代表性的是单阶段网络YOLO系列算法和两阶段网络RCNN系列算法。YOLO系列算法的第一个版本YOLOv1是Redmon等人2016年提出的，它是在保证检测准确率可观的基础上大幅度增加了检测网络的速度，而后相继提出的YOLO9000和YOLOv3更加有效地解决了YOLOv1网络的局限性，提高了网络检测对成群小目标检测准确率，并优化了目标难以精确定位的问题。尽管单阶段网络的时效性已可以满足工业需求，但其准确率的提升仍然是一个瓶颈。两阶段网络RCNN系列算法被广泛应用在大多数行人检测器中。通过构建区域建议网络(RPN)提取可能含有行人的区域，利用检测网络对目标区域进行判别和分类。两

【技术保护点】
1.一种雷达与摄像机融合的行人检测方法，用于对待检测区域内的行人进行识别检测，其特征在于，所述雷达与摄像机融合的行人检测方法，包括：/n构建用于行人检测的Mask RCNN网络结构，并对Mask RCNN网络结构进行预训练；所述Mask RCNN网络结构包括两部分：第一部分是共享的卷积层，第二部分是对感兴趣区域进行分类的神经网络classifier；/n接收雷达获取的待检测区域的雷达数据，对雷达数据进行聚类处理得到多种聚类点簇，并根据行人的物理属性对聚类点簇进行过滤，得到针对行人的聚类点簇；/n接收摄像机获取的待检测区域的图像数据，根据摄像机内外参将针对行人的聚类点簇转换为图像中的像素坐标，并通过卷积变换规则提取图像的感兴趣区域；/n将提取的感兴趣区域输入至预训练好的Mask RCNN网络结构中进行行人识别，输出行人检测结果。/n

【技术特征摘要】
1.一种雷达与摄像机融合的行人检测方法，用于对待检测区域内的行人进行识别检测，其特征在于，所述雷达与摄像机融合的行人检测方法，包括：
构建用于行人检测的MaskRCNN网络结构，并对MaskRCNN网络结构进行预训练；所述MaskRCNN网络结构包括两部分：第一部分是共享的卷积层，第二部分是对感兴趣区域进行分类的神经网络classifier；
接收雷达获取的待检测区域的雷达数据，对雷达数据进行聚类处理得到多种聚类点簇，并根据行人的物理属性对聚类点簇进行过滤，得到针对行人的聚类点簇；
接收摄像机获取的待检测区域的图像数据，根据摄像机内外参将针对行人的聚类点簇转换为图像中的像素坐标，并通过卷积变换规则提取图像的感兴趣区域；
将提取的感兴趣区域输入至预训练好的MaskRCNN网络结构中进行行人识别，输出行人检测结果。

2.如权利要求1所述的雷达与摄像机融合的行人检测方法，其特征在于，所述对MaskRCNN网络结构进行预训练，包括：
通过摄像机获取指定区域的若干样本图像，对样本图像进行标注，并且对标注后的样本图像进行平移变换和旋转变换得到新的样本图像，将所有标注后的样本图像以及从公开数据集COCO获取的样本图像按预设比例拆分为训练集和测试集；
利用所述训练集迭代优化MaskRCNN网络结构，直至利用所述测试集验证MaskRCNN网络结构满足要求。

3.如权利要求2所述的雷达与摄像机融合的行人检测方法，其特征在于，所述利用训练集迭代优化MaskRCNN网络结构，直至利用测试集验证MaskRCNN网络结构满足要求，包括：
定义混淆矩阵；
根据所述混淆矩阵，以及MaskRCNN网络结构输出的行人检测结果和测试集中样本图像，计算准确率和召回率；
若准确率>0.9且召回率>0.9，则结束训练并输出当前的MaskRCNN网络结构；否则重新利用训练集优化MaskRCNN网络结构。

4.如权利要求2所述的雷达与摄像机融合的行人检测方法，其特征在于，所述神经网络classifier包括全连接层FClayers，所述全连接层FClayers的输出尺寸为2。

5.一种雷达与摄像机融合的行人检测...

【专利技术属性】
技术研发人员：刘云鹏，智伟，王谦，朱芸，
申请(专利权)人：中电海康集团有限公司，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人