【技术实现步骤摘要】
一种目标动态卷积核的高空抛物跟踪方法
[0001]本专利技术涉及目标检测
,尤其涉及一种目标动态卷积核的高空抛物跟踪方法
。
技术介绍
[0002]随着城市化的快速发展,高层建筑物不断涌现,这为高空抛物问题提供了更多的可能性
。
高楼大厦和高架桥等高空位置成为潜在的抛物来源,因此高空抛物问题在城市化背景下变得更加突出
。
同时人口的增长导致城市变得更加拥挤,公共场所的人员密度增大
。
这增加了高空抛物事件造成人员伤害的概率,因为更多的人可能会处于抛物物体的下方
。
[0003]目前的解决方案包括:部署智能监控摄像头,通过计算机视觉和图像识别技术,监测潜在的高空抛物行为,一旦监测到异常情况,系统可以自动发出警报,通知执法部门或相关人员;开发声音识别系统,能够识别窗户摔落等物体撞击地面时产生的声音,一旦系统识别到类似的声音模式,就会触发警报;在高空抛物易发区域安装振动传感器,能够感知物体从高处落下时所产生的振动,从而及时发出警报;开发预警系统,通过实时监测大型建筑物
、
桥梁等高空位置的稳定性和物体运动情况,预测潜在的抛物风险;利用人工智能和机器学习技术,分析历史数据和模式,预测高抛事件的可能发生地点和时间,以便提前采取防范措施;使用无人机进行高空巡检,定期检查建筑物外墙
、
窗户等高处,以发现并修复潜在的高空抛物风险;开发智能报警设备,可以安装在窗户或高空位置,一旦检测到异常的抛物行为,即可发出声音
、 ...
【技术保护点】
【技术特征摘要】
1.
一种目标动态卷积核的高空抛物跟踪方法,其特征在于:具体包括如下步骤:
S1
:构建跟踪目标动态卷积核采集高空抛物视频数据,标注视频帧的目标检测框和目标类别,提取跟踪目标的
Key
和
Query
特征,计算获得跟踪目标动态卷积核;
S2
:训练目标检测模型训练集成动态卷积核后的目标检测模型,获得初始目标检测模型;
S3
:构建困难目标动态卷积核使用初始目标检测模型获得目标检测框,计算目标检测损失值,根据目标检测损失值的阈值获得困难样本,提取困难目标的
Key
和
Query
特征,计算获得困难目标动态卷积核;
S4
:构建干扰目标动态卷积核确定干扰样本类别,从
ImageNet
数据集获得干扰样本集,扩充干扰样本集,提取干扰目标的
Key
和
Query
特征,计算获得干扰目标动态卷积核;
S5
:训练多目标类别动态卷积核的目标检测模型训练初始目标检测模型,获得多目标动态卷积核的目标检测模型;
S6
:测试视频高空抛物跟踪使用多目标动态卷积核的目标检测模型检测测试视频帧获得目标检测框,通过状态转移矩阵预测跟踪框,使用算法匹配跟踪框与检测框,对后续帧执行同样操作,获得高空抛物目标运动轨迹
。2.
根据权利要求1所述的一种目标动态卷积核的高空抛物跟踪方法,其特征在于:步骤
S1
具体包括如下步骤:步骤1‑1:通过摄像头采集高空抛物视频;步骤1‑2:将视频数据采样为连续的视频帧数据,获得视频帧集合;步骤1‑3:标注每个视频帧中的运动目标边界框和目标中心点坐标其中为边界框左上角坐标,为边界框右下角坐标;步骤1‑4:标注每个视频帧中运动目标的类别,得到目标的类别标签;步骤1‑5:获得初始样本集:
Init
=
<Frame
init
,Box
init
,Label
init
>
,其中
Frame
init
表示将边界框与标签合并获得的帧,
Box
init
表示初始样本边界框,
Label
init
表示初始样本标签;步骤1‑6:创建动态卷积模块,在当前层,
Key
特征和
Query
特征从视频帧的像素中获得:步骤1‑6‑1:提取跟踪目标区域:在不同分辨率下,对应像素是变化的,将目标中心点坐标处
h
×
w
范围内像素作为
Key
特征:特征:
H、W
分别为当前层视频帧的高度分辨率和宽度分辨率,在目标中心点附近区域内,与中心点相邻的像素作为
Query
特征:相邻像素的坐标范围是
u∈{h
‑
1,h,h+1},v∈{w
‑
1,w,w+1}
;步骤1‑6‑2:用点积乘法计算区域内
Key
特征和所有
Query
特征之间的相似度
,
对相似度得分使用
Softmax
函数作为权重
:
其中,
C
track
为特征维度;
步骤1‑6‑3:对所有像素进行上述操作获得权重集合步骤1‑6‑4:将获得的权重值作为卷积核,获得跟踪目标动态卷积核
。3.
根据权利要求2所述的一种目标动态卷积核的高空抛物跟踪方法,其特征在于:步骤
S2
具体包括如下步骤:步骤2‑1:选择
RetinaNet
作为预训练模型,在模型卷积操作前调用步骤1‑6动态卷积模块获取动态卷积核,将原始卷积核替换为跟踪目标动态卷积核,使用该模型检测步骤1‑5标注后的初始样本集,处理每个样本,获得目标检测框和目标检测得分
score
pre,i
,其中
i
是样本编号,为目标检测框左上角坐标,为目标检测框右下角坐标;步骤2‑2:给定样本数为
M
init
计算目标检测损失值,其中包括两个损失值
L
pre,box
和
L
pre,label
;步骤2‑2‑1:计算目标检测框与标注的边界框的损失:其中
Smooth L1 Loss
的计算公式为:
*
表示数字乘法,
x1为检测坐标值,
x2为真实坐标值;步骤2‑2‑2:计算目标预测概率得分
score
pre,i
与真实概率得分
score
gt
的损失:步骤2‑2‑3:总损失为边界框损失和预测得分损失之和:
L
pre
=
L
pre,box
+L
pre,label
步骤2‑3:使用步骤2‑3‑3计算获得的总损失,使用反向传播训练模型,获得初始目标检测模型
。4.
根据权利要求3所述的一种目标动态卷积核的高空抛物跟踪方法,其特征在于:步骤
S3
具体包括如下步骤:步骤3‑1:使用步骤
S2
‑3获得的初始目标检测模型,检测步骤1‑5标注后的数据获得目标检测框;步骤3‑2:获得目标预测概率得分
score
init,i
;步骤3‑3:设置困难样本预测得分阈值;步骤3‑4:将预测得分小于阈值的样本,作为困难样本;步骤3‑5:获得困难样本集:
Diff
=
<Frame
diff
,Box
diff
,Label
diff
>
,其中
Frame
diff
表示困难帧,
Box
diff
表示困难样本边界框,
Label
diff
表示困难样本标签;步骤3‑6:创建动态卷积模块,在当前层,
Key
特征和
Query
特征从视频帧的像素中获得;步骤3‑6‑1:提取跟踪目标区域:在不同分辨率下,对应像素是变化的,将目标中心点坐
标处
h
×
w
范围内像素作为
Key
特征:
H、W
分别为当前层视频帧的高度分辨率和宽度分辨率,在目标中心点附近区域内,与中心点相邻的像素作为
Query
特征:相邻像素的坐标范围是
u∈{h
‑
1,h,h+1},v∈{w
‑
1,w,w+1}
;步骤3‑6‑2:用点积乘法计算区域内
Key
特征和所有
Query
特征之间的相似度;其中,
C
diff
为特征维度;步骤3‑6‑3:对所有像素进行上述操作获得权重集合步骤3‑6‑4:将获得的权重值作为卷积核,获得困难目标动态卷积核
。5.
根据权利要求4所述的一种目标动态卷积核的高空抛物跟踪方法,其特征在于:步骤
S4
具体包括如下步骤:步骤4‑1:确定干扰样本类别为飞鸟,树叶,衣服,被子;步骤4‑2:从
ImageNet
数据集,获得包含飞鸟,树叶,衣服,被子的干扰目标数据集;步骤4‑3:数据预处理和数据增强;步骤4‑3‑1:通过尺寸归一化,把干扰目标数据集中图像缩放为
256x256
分辨率;步骤4‑3‑2:在0‑
180
°
范围内随机翻转图像;步骤4‑3‑3:设置目标边界框位置,将边界框放入图像,合成图片得到
Frame
disturb
;步骤4‑4:获得干扰样本集:
Disturb
=
<Frame
disturb
,Box
disturb
,Label
disturb
>
,其中
Frame
disturb
表示干扰帧,
Box
disturb
表示边界框,
Label
disturb
表示标签;步骤4‑5:创建动态卷积模块,在当前层,
Key
特征和
Query
特征从视频帧的像素中获得;步骤4‑5‑1:提取跟踪目标区域:在不同分辨率下,对应像素是变化的,将目标中心点坐标处
h
×
w
范围内像素作为
Key
特征:特征:
H、W
分别为当前层视频帧的高度分辨率和宽度分辨率,在目标中心点附近区域内,与中心点相邻的像素作为
Query
特征:相邻像素的坐标范围是
u∈{h
‑
1,h,h+1},v∈{w
‑
1,w,w+1}
;步骤4‑5‑2:用点积乘法计算区域内
Key
特征和所有
Query
特征之间的相似度;其中,
C
disturb
为特征维度;步骤4‑5‑3:对所有像素进行上述操作获得权重集合步骤4‑5‑4:将获得的权重值作为卷积核,获得干扰目标动态卷积核
。6.
根据权利要求5所述的一种目标动态卷积核的高空抛物跟踪方法,其特征在于:步骤
S5
具体包括如下步骤:步骤5‑1:融合跟踪目标类的初始样本集
Init
,困难样本集
Diff
和干扰样本集
Disturb
,获得主动样本集,用于训练主动目标检测模型
Fuse
=
<Init,Diff,Disturb>
,
Fuse
=
<Frame
fuse
,Box
Fuse
,Label
fuse
>
其中
Frame
fuse<...
【专利技术属性】
技术研发人员:杨兴明,王冠,吴克伟,孙永宣,郭丹,谢昭,
申请(专利权)人:合肥工业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。