【技术实现步骤摘要】
一种基于多算法融合的多目标实时检测、识别及跟踪方法
本专利技术涉及图像处理
,具体涉及一种基于多算法融合的多目标实时检测、识别及跟踪方法。
技术介绍
随着人工智能领域和深度学习技术的发展,目标检测已经成为人工智能和计算机视觉领域中的一个研究重点和难点。目前,目标检测在各个领域中都有着非常重要的应用,比如人脸识别、交通运输、自动驾驶等领域。目标检测就是识别出图像中感兴趣的区域并预测出目标的具体位置,并且快速、准确地识别出图像中的目标。目标跟踪就是在目标检测的基础上进行的,是在视频图像中的每一幅图像中确定出我们感兴趣的运动目标的位置,并把不同帧中同一目标对应起来。现有的目标检测算法主要分为两类,one-stage算法和two-stage算法。one-stage算法是端到端的一步到位的算法,获取获选区域和对目标进行分类是同时进行的;two-stage算法是需要先获取候选区域,第二步再进行分类。One-stage算法的主要代表是YOLO系列和SSD系列,YOLO的网络结构延续了GoogleNet的核心思想,利用 ...
【技术保护点】
1.一种基于多算法融合的多目标实时检测、识别及跟踪方法,其特征在于,包括以下步骤:/n步骤1,通过改进的CenterNet算法完成多目标实时检测;/n具体为:结合知识蒸馏的方法对CenterNet算法进行改进,选用Hourglass网络作为Centernet算法的多目标检测特征提取网络,在Hourglass网络中进行预训练,作为teachernet,收集预训练的特征数据得到训练数据集;将每两个初始的Hourglass网络改为一个,作为student net,调整student net网络参数,将Hourglass网络预训练的特征数据输入,同时输入训练数据集以及训练数据集对应 ...
【技术特征摘要】
1.一种基于多算法融合的多目标实时检测、识别及跟踪方法,其特征在于,包括以下步骤:
步骤1,通过改进的CenterNet算法完成多目标实时检测;
具体为:结合知识蒸馏的方法对CenterNet算法进行改进,选用Hourglass网络作为Centernet算法的多目标检测特征提取网络,在Hourglass网络中进行预训练,作为teachernet,收集预训练的特征数据得到训练数据集;将每两个初始的Hourglass网络改为一个,作为studentnet,调整studentnet网络参数,将Hourglass网络预训练的特征数据输入,同时输入训练数据集以及训练数据集对应的标签,用来提取先验知识,即让studentnet的模型学习teachernet的模型的泛化能力;将视频帧输入studentnet提取特征数据即可完成多目标实时检测;
步骤2,对步骤1检测到的感兴趣区域进行多目标识别;
在Centernet算法中加入基于SENet的残差块,由SENet残差块首先对步骤1得到的特征图进行Squeeze操作,得到全局特征,然后对全局特征进行Excitation操作,学习各个通道间的关系,也得到不同通道的权重,最后通过Reweight操作乘以原来的特征图得到最终特征,完成目标识别;
步骤3,在步骤1和步骤2的基础上,进行多目标跟踪;
把Deepsort算法和Centernet算法进行了融合,对Deepsort算法引入基于LSTM模型的目标交互匹配对进行改进,将多目标实时检测后的帧视频数据调用改进后的Deepsort算法,使用运动特征匹配、表观特征匹配和目标交互特征匹配来确定跟踪目标下一帧的位置,实现多目标的跟踪。
2.根据权利要求1所述的一种基于多算法融合的多目标实时检测、识别及跟踪方法,其特征在于:所述步骤2中Squeeze操作就是采用全局平均池化操作对得到的每个特征图进行压缩,使其C个特征图最后变成1*1*C的实数数列,公式如下:
其中,Fsq代表进行squeeze操作,uc代表c个featuremap的集合,H和W分别代表高度和宽度。
3.根据权利要求1所述的一种基于多算法融合的多目标实时检测、识别及跟踪方法,其特征在于:所述步骤2中Excitation操作的目的是完全捕获通道相关性,具体为:先用W1乘以squeeze操作得到的结果z,就是一个全连接层操作,W1的维度是C/n×C,这里n是一个缩放参数,因为z的维度是1×1×C,所以W1z的结果就是1×1×C/n;然后再经过一个ReLU层,输出的维度不变;然后再经过一个全连接层的过程,和W2相乘,W2的维度是C×C/n,因此输出的维度就是1×1×C;最后再...
【专利技术属性】
技术研发人员:杨帆,王兴,李凯,赵志毅,张学军,武靖恺,侯鹏亮,杨昆,
申请(专利权)人:山西讯龙科技有限公司,太原科技大学,北京中科讯龙科技有限公司,
类型:发明
国别省市:山西;14
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。