一种基于改进双候选框交叉替换策略和损失函数的拥挤场景行人检测方法技术

技术编号:35736875 阅读:30 留言:0更新日期:2022-11-26 18:39
本发明专利技术提供了一种基于改进双候选框交叉替换策略和损失函数的拥挤场景行人检测方法,包括以下步骤:S1:将图像输入到主干网络,提取不同尺度下的特征;S2:将步骤S1提取的特征输入到基于简化CIoU和K

【技术实现步骤摘要】
一种基于改进双候选框交叉替换策略和损失函数的拥挤场景行人检测方法


[0001]本专利技术涉及目标检测
,具体涉及一种基于改进双候选框交叉替换策略和损失函数的拥挤场景行人检测方法。

技术介绍

[0002]行人检测这些年一直受到众多研究者的关注,可以为一些现实场景提供重要的技术支持。例如,在车辆驾驶系统中,帮助车辆在行驶过程中检测行人,从而辅助车辆行驶规避行人,减少交通事故发生;在智能监控系统中,通过监控视频或图片的内容,识别罪犯、拥挤行人等潜在的安全隐患,从而及时采取行动,提高居民和城市安全;在机器人以及高级人机交互系统中,赋予机器智能,解放工人双手。此外,行人检测也是多目标追踪、人体姿态估计和人像搜索的前提。
[0003]近年来,随着人民物质生活水平的逐渐提高和城市化进程的不断加快,城市居民数量得到了迅速的增长,导致许多场景经常会出现人群拥挤情况,如商场、车站、街道、医院、景区等场景,这些拥挤场景存在着较大的安全隐患。尽管现有行人检测模型在KITTI、CityPersons 和Caltech等经典行人检测数据集上取得了不错的结果,本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于改进双候选框交叉替换策略和损失函数的拥挤场景行人检测方法,其特征在于,包括以下步骤:S1:将图像输入到主干网络,提取不同尺度下的特征;S2:将步骤S1中提取的特征输入到基于简化CIoU和K

means聚类算法的锚框优化方法的双锚框区域建议网络中获取候选框;S3:采用改进的双候选框交叉替换策略对步骤S2生成的候选框对进行比对、替换,生成包含头部和全身候选框的高质量候选框对;S4:将经过RoIAlign后的头部和全身候选框对应的特征输入全连接层进行融合,生成融合后的特征图信息;S5:根据目标内容对融合后的特征图信息,采用基于改进的损失函数对融合后的特征图信息进行分类和回归处理,获得多个预测框,预测行人的位置和类别信息,其中改进的回归损失函数计算公式见公式(1):L
E

RepLoss
=L
E

Attr

α*L
E

RepGT

β*L
E

RepBox
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)公式(1)中,L
E

RepLoss
是改进的损失函数,L
E

Attr
是吸引力损失,L
E

RepGT
、L
E

RepBox
是排斥力损失,α和β为平衡系数;公式(1)中,吸引力损失L
E

Attr
的计算方法见公式(2),其作用是使目标的预测边界框尽可能靠近自己的真实框:公式(2)中,b和分别表示行人的预测边界框和与之对应的真实框,w表示预测边界框的宽,h表示预测边界框的高,表示真实框的宽,表示真实框的高,c表示两个边界框最小外接矩形的对角线,ρ表示两个边界框最小外接矩形的中心点的距离,C
w
和C
h
分别为两个边界框最小外接矩形的宽和高;公式(1)中,L
E

RepGT
为预测边界框与相邻目标真实框的排斥力损失函数,计算方法见公式(3):公式(3)中,是b与所有真实框交并比值第二大时的真实框,和是其对应的宽和高;公式(1)中,L
E

RepBox
为行人预测边界框与相邻行人预测边界框损失函数,计算方法见公式(4):公式(4)中,b
i
和b
j
表示行人i跟行人j的预测边界框,w
i
、h
i
表示行人i的预测边界框的宽跟高,w
j
、h
j
表示行人j的预测边界框的宽跟高;S6:剔除冗余预测框,输出带有最优预测框的图像。2.如权利要求1所述的一种基于改进双候选框交叉替换策略和损失函数的拥挤场景行
人检测方法,其特征在于,所述步骤S1,进一步包括步骤S11至步骤S12:S11:加载在ImageNet分类数据集上预训练后生成的深度残差卷积神经网络模型ResNet50;S12:将待检测的图像输入到深度残差卷积神经网络ResNet50中提取不同尺度下的深度卷积特征。3.如权利要求1所述的一种基于改进双候选框交叉替换策略和损失函数的拥挤场景行人检测方法,其特征在于,所述步骤S2,进一步包括步骤S21至步骤S22:S21:采用基于简化CIoU和K

means聚类算法的锚框优化方法对双锚框区域建议网络进行锚框优化,进一步包括步骤S211至步骤S215:S211:将数据集中所有全身标注框的宽和高(x
i
,y
i
)作为待聚类样本,其中,i∈(1,2,...N),N为样本个数,x
i
为第i个标注框的宽,y
i
为第i个标注框的高;S212:给定K个聚类中心点的坐标(SW
j
,SH
j
),其中,(SW
j

【专利技术属性】
技术研发人员:周欣欣孟炫宇张龙衣雪婷郭月晨薛青常李茂源杨峰
申请(专利权)人:东北电力大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1