【技术实现步骤摘要】
超低空无人机视角下的多行人检测与姿态估计方法
[0001]本专利技术专利属于计算机视觉领域,具体提供了一种超低空无人机视角下的多行人检测与姿态估计方法。
技术介绍
[0002]目前突发的公共安全事故通常只有监控视频作为依据,且排查和预警大多依赖人工,不仅耗费人力物力,往往会导致问题发现不及时,从而造成严重后果。由于无人机搭载云台等图像或视频采集设备,可通过无线传输技术获取实时高分辨率的图像和视频,对交通枢纽、重点监控区、地貌物体等目标对象进行拍摄,以获取目标对象的图像信息。因此,在公共安全领域,可依赖无人机对公共领域进行常规巡查,填补因警务力量不足等因素造成的巡查漏洞。无人机巡检系统可以对林业区域、电力线路等进行巡检,提高巡检效率,但超低空无人机视角下的多行人检测与姿态估计方法仍然处在发展之中。当无人机执行飞行任务时,具有一定的飞行速度,导致采集到的图像或视频与真实场景出现偏差,采集到的行人画面存在运动模糊、视频散焦、姿势遮挡等问题。同时,画面中人体目标较小、相似度高、交互频繁等问题都为多人检测与姿态估计任务造成了阻碍。
技术实现思路
[0003]为了解决上述问题,本专利技术提供了一种超低空无人机视角下的多行人检测与姿态估计方法,包括,
[0004]利用无人机采集图像数据,对数据集进行数据预处理;
[0005]对数据集进行数据增强;
[0006]利用YOLOv5算法使用增强后的数据训练目标检测网络;
[0007]利用训练好的目标检测网络进行多行人检测,利用单人姿态估计算 ...
【技术保护点】
【技术特征摘要】
1.超低空无人机视角下的多行人检测与姿态估计方法,其特征在于:包括,利用无人机采集图像数据,对数据集进行数据预处理;对数据集进行数据增强;利用YOLOv5算法使用增强后的数据训练目标检测网络;利用训练好的目标检测网络进行多行人检测,利用单人姿态估计算法进行姿态估计。2.如权利要求1所述的超低空无人机视角下的多行人检测与姿态估计方法,其特征在于:对选用的Okutama
‑
Action数据集按照如下标签进行筛选:包括,目标ID、标注框左上角的x坐标、标注框左上角的y坐标、标注框右下角的x坐标、标注框右下角的y坐标、该标注对应的帧号、目标是否丢失、目标是否有遮挡、是否为生成的标注和标注对应的类别;目标若丢失则标注为1、目标若遮挡则标注为1、该标注是通过自动插值生成的则标注为1;180帧内,拥有相同ID的是一个人;在下一个180帧会有新的ID,一个人缺席90帧就会有新的ID;标注框左上是坐标xy最小值;标注框右下的坐标xy最大值。3.如权利要求2所述的超低空无人机视角下的多行人检测与姿态估计方法,其特征在于:对筛选后的标签信息采用如下规则进行预处理剔除无效信息:1)若同一行人在180帧的倍数帧存在信息重复,则选用较大帧数下对应的目标ID信息作为本帧的标签信息;2)丢失情况标注为1的标签丢弃,丢失情况标注为0的标签保留;3)遮挡情况标注为1的标签保留,遮挡情况标注为0的标签保留;4)插值生成情况标注为1的标签丢弃,插值生成情况标注为0的标签保留。4.如权利要求3所述的超低空无人机视角下的多行人检测与姿态估计方法,其特征在于:将筛选后的有效标签信息表示为:(track ID,x
min
,y
min
,x
max
,y
max
,label),其中,track ID表示目标ID,x
min
为标注框左上角的x坐标,y
min
为标注框左上角的y坐标,x
max
为标注框右下角的x坐标,y
max
为标注框右下角的y坐标,label为类别;将(track ID,x
min
,y
min
,x
max
,y
max
,label)转换为(cls_id,x,y,w,h)并归一化,含义为(目标类别,目标的中心坐标x值,目标的中心坐标y值,目标标注框的宽,目标标注框的高),由于label中只包含person...
【专利技术属性】
技术研发人员:任艳,刘昱玮,陈新禹,张天博,乔志华,
申请(专利权)人:沈阳航空航天大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。