The embodiment of the present invention provides a pedestrian detection method and device. Among them, the method includes: input the image to be detected into the region extraction layer of the pedestrian detection model, output several candidate boxes; input several candidate boxes into the feature extraction layer of the pedestrian detection model, output the characteristics of each candidate box; input the characteristics of each candidate box into the discriminant prediction layer of the pedestrian detection model, output pedestrian detection results; The model is obtained by training the sample image; several candidate frames are obtained by multi-level enhancement feature map of the image to be detected; multi-level enhancement feature map is obtained by feature enhancement of multi-level original feature map of the detected image; multi-level original feature map is obtained by pre-processing the detected image according to the hierarchical feature extraction method. . The pedestrian detection method and device provided by the embodiment of the present invention can improve the detection accuracy on the premise of ensuring high detection speed.
【技术实现步骤摘要】
行人检测方法和装置
本专利技术实施例涉及计算机视觉
,尤其涉及一种行人检测方法和装置。
技术介绍
行人检测是计算机视觉中的一项重要组成部分,也是许多人工智能应用的基础,例如机动车自动驾驶和辅助驾驶、机器人自主导航和人机交互、无人机追踪、智能监控、视频结构化分析等。在实际应用中,不同运动状态的行人目标需要给予不同的关注程度和后续处理方法。行人检测和一般物体检测有相似之处,其检测步骤均由区域建议、特征提取、模式分类组成;但是行人检测面临着尺度变化范围大、外观和姿态复杂、光照遮挡等外部因素影响等困难。在许多实际应用场景中,对行人检测的速度、精度和模型大小还有较高要求,而在自动驾驶和辅助驾驶任务中,往往还需要对行人的运动趋势进行判断。现有的基于深度学习的一般物体检测方法存在以下问题:单一的区域提取单元难以应对行人大范围的尺度变化;由于深度学习的卷积和池化层步长限制,无法对小尺度行人提取足够的特征;深度学习常用的多层感知器(MLP)参数过多,可能弱化分类结果,也限制了检测速度;不能在行人检测的同时给出行人运动趋势。因而现有行人检测技术难以兼顾检测准确率和检测速度。
技术实现思路
针对现有技术存在的问题,本专利技术实施例提供一种克服上述问题或者至少部分地解决上述问题的行人检测方法和装置。第一方面,本专利技术实施例提供一种行人检测方法,包括:将待检测图片输入至行人检测模型中的区域提取层,输出若干个候选框;将所述若干个候选框输入至所述行人检测模型中的特征提取层,输出每一所述候选框的特征;将各所述候选框的特征输入至所述行人检测模型中的判别预测层,输出行人检测结果;其中,所 ...
【技术保护点】
1.一种行人检测方法,其特征在于,包括:将待检测图片输入至行人检测模型中的区域提取层,输出若干个候选框;将所述若干个候选框输入至所述行人检测模型中的特征提取层,输出每一所述候选框的特征;将各所述候选框的特征输入至所述行人检测模型中的判别预测层,输出行人检测结果;其中,所述行人检测模型是根据样本图片进行训练后获得的;所述若干个候选框是根据所述待检测图片多层次的增强特征图获得的;所述多层次的增强特征图是对所述待检测图片多层次的原始特征图进行特征增强后获得的;所述多层次的原始特征图是根据层次化特征提取方法对所述待检测图片进行预处理后获得的。
【技术特征摘要】
1.一种行人检测方法,其特征在于,包括:将待检测图片输入至行人检测模型中的区域提取层,输出若干个候选框;将所述若干个候选框输入至所述行人检测模型中的特征提取层,输出每一所述候选框的特征;将各所述候选框的特征输入至所述行人检测模型中的判别预测层,输出行人检测结果;其中,所述行人检测模型是根据样本图片进行训练后获得的;所述若干个候选框是根据所述待检测图片多层次的增强特征图获得的;所述多层次的增强特征图是对所述待检测图片多层次的原始特征图进行特征增强后获得的;所述多层次的原始特征图是根据层次化特征提取方法对所述待检测图片进行预处理后获得的。2.根据权利要求1所述的行人检测方法,其特征在于,获取所述多层次的增强特征图的具体步骤包括:对所述多层次的原始特征图进行特征降维,获取多层次的降维特征图;对于所述多层次的降维特征图中的每一非最深层次降维特征图,根据层次深于所述非最深层次降维特征图的降维特征图生成掩膜;根据掩膜和所述非最深层次降维特征图,生成所述非最深层次降维特征图对应的增强特征图。3.根据权利要求2所述的行人检测方法,其特征在于,所述输出若干个候选框的具体步骤包括:对于每一所述增强特征图,根据区域提取网络获取候选框。4.根据权利要求3所述的行人检测方法,其特征在于,将所述若干个候选框输入至所述行人检测模型中的特征提取层,输出每一所述候选框的特征的具体步骤包括:对于每一所述候选框,根据所述候选框的坐标,裁剪相应的原始特征图、降维特征图或增强特征图,获取所述候选框的特征。5.根据权利要求1至4任一所述的行人检测方法,其特征在于,将各所述候选框的特征输入至所述行人检测模型中的判别预测层,输出行人检测结果的具体步骤包括:对于每一所述候选框,将所述候选框的特征输入至所述判别预测层中的级联分类器;对于本级分类器,根据所述候选框的特征输出所述候选框包含行人的评分;若判断获知已评分的各级分类器的评分之和大于预设的判别阈值,则将所述候选框的特征输入至下一级分类器;若判断获知已评分的各级...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。