【技术实现步骤摘要】
一种多尺度自注意力特征融合的行人检测方法
:
[0001]本专利技术涉及一种多尺度自注意力特征融合的行人检测方法,属于人工智能领域。
技术介绍
:
[0002]行人检测作为计算机视觉中一个极具研究价值的领域,其广泛应用于汽车无人驾驶,人体行为分析,智能交通,智能视频监控等领域;它是车辆辅助驾驶,智能视频监控和人体行为分析等应用中的第一步,近年来也应用在航拍图像、受害者营救等新兴领域中;由于人体姿态高度随意,形体复杂多变,且有附着和遮挡等问题,准确的在各种场景下检测到行人的理论和技术仍然需要深入探索和研究;行人检测的流程是:对输入的图片或者视频进行检测,判断其中是否包含行人,若有行人,则给出行人信息。
[0003]传统的行人检测算法核心是提取输入信息的特征并对特征进行分类,利用手工设计的特征提取器很难全方位分析行人的信息,所以这种行人检测方法的检测效果并不理想;随着计算机算力的提升,近几年深度学习得到了飞速发展;基于深度学习的方法显著提升了目标检测的效果;因此,本文提出了一种多尺度自注意力特征融合的行人检测方法;以Fast ...
【技术保护点】
【技术特征摘要】
1.一种多尺度自注意力特征融合的行人检测方法,其特征在于,该方法包括以下步骤:步骤1:行人检测图像数据的采集;步骤2:检测图像中行人尺寸的设计;步骤3:行人数据集正负样本的划分;步骤4:行人检测模型的搭建。2.根据权利要求1所述的一种多尺度自注意力特征融合的行人检测方法,其特征在于:所述步骤1中,行人检测图像数据的采集,行人检测数据集是在图像和视频中检测直立行人的研究工作中收集的,数据集中的行人主要是直立状态,并且高于100个像素,图片清晰度高,图片大部分选自个人照片,谷歌以及相机拍摄。3.根据权利要求1所述的一种基多尺度自注意力特征融合的行人检测方法,其特征在于,所述步骤2中,检测图像中行人尺寸的设计,具体步骤为:利用K
‑
means算法针对行人数据集重新聚类,得到更适应本模型的anchor size,为了更快更准确的迭代出最终结果,改用IoU即预测框和anchor box的重叠度作为度量,即目标函数:Distance=1
–
IoU(Box,Center),其中Box表示真实物体包围框的集合,Center表示聚类中心框集合,对行人数据进行聚类最终得到4个中心点,分别是(12,22),(25,38),(41,77),(48,91)。4.根据权利要求1所述的一种多尺度自注意力特征融合的行人检测方法,其特征在于,所述步骤3中...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。