【技术实现步骤摘要】
本专利技术涉及目标检测,更具体的说,它涉及一种基于yolo的多尺度目标检测方法。
技术介绍
1、目标检测是对图像中感兴趣目标进行识别和定位的技术,解决了图像中物体是什么和在哪里的问题,在很多领域都有着非常重要的作用。目标检测算法经常需要被应用在一些需要实时处理图像(如视频、监控画面等)的地方,所以对算法的实时性也提出了要求,通常称处理图像的速度达到30fps以上的算法为实时目标检测算法,随着深度学习时代的来临,目标检测方法已经从基于手工特征提取的传统检测算法发展为基于深度学习的目标检测算法,通过深层次的神经网络学习更为复杂的特征信息,以进一步增强模型对图像的表达能力。目前基于深度学习的目标检测算法主要分为两个方向:二阶段检测算法和一阶段检测算法。二阶段检测算法以r-cnn系列为代表,使用最广泛的有fast rcnn、fasterrcnn等,这类基于区域的检测算法首先要从图片中搜索出一些可能存在对象的候选区,然后再对每个候选区进行对象识别。而以yolo、ssd和retinanet等为代表的一阶段检测算法则是直接在网络中提取特征来预测物体分
...【技术保护点】
1.一种基于YOLO的多尺度目标检测方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于YOLO的多尺度目标检测方法,其特征是:所述目标定位损失函数包括将对角线长度和宽高比关系结合,建立一个新的损失函数;将其引入YOLOv5进行训练,得到实验数据;寻找宽高比和最小外接矩形框的关系,对损失函数进行优化,并将其引入YOLOv5进行训练,得到实验数据;思考标定框和预测框是否有新的位置关系,并尝试用新的关系对损失函数进行改进,将其引入YOLOv5进行训练,得到实验数据;比较不同损失函数对算法预测框准确度的影响,选择表现更好的损失函数作为改进算法的损失
...【技术特征摘要】
1.一种基于yolo的多尺度目标检测方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于yolo的多尺度目标检测方法,其特征是:所述目标定位损失函数包括将对角线长度和宽高比关系结合,建立一个新的损失函数;将其引入yolov5进行训练,得到实验数据;寻找宽高比和最小外接矩形框的关系,对损失函数进行优化,并将其引入yolov5进行训练,得到实验数据;思考标定框和预测框是否有新的位置关系,并尝试用新的关系对损失函数进行改进,将其引入yolov5进行训练,得到实验数据;比较不同损失函数对算法预测框准确度的影响,选择表现更好的损失函数作为改进算法的损失函数,已达到使算法定位准确度更高的要求。
3.根据权利要求1所述的一种基于yolo的多尺度目标检测方法,其特征是:所述多尺度融合结构框架包括在颈部网络高层的骨干网络连接处引入1×1卷积遍历高层特征图,以减小高层网络的通道数,在保持高层信息不丢失的情况下降低计算量,使改进算法的速度有一个提升。
4.根据权利要求1所述的一种基于yolo的多尺度目标检测方法,其特征是:所述多尺度融合结构框架还包括在颈部网络的采用分别上采样加融合下采样的方式,增加对骨干网络特征的利用层数,增加可利用信息,达到增加算法精度的目标。
5.根据权利要求1所述的一种基于yolo的多尺度目标检测方法,其特征是:所述多尺度融合结构框架还包括对颈部网络的第一步对算法速度进行了提升,为第二步预计增加的计算量进行一定控制;通过设立选择不同的层数进行对比实验,找到一个fps没有明显下降,而准确度得到提升的算法框架。
6.根据权利要求2所述的一种基于yolo的多尺度目标检测方法,其特征是:所述步骤二还包括特征提取:将训练集输入到特征提取模块中提取语义特征,将提取到的语义...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。