System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于PDNet的目标检测方法技术_技高网

一种基于PDNet的目标检测方法技术

技术编号:41313720 阅读:5 留言:0更新日期:2024-05-13 14:56
本发明专利技术公开一种基于PDNet的轻量化目标检测方法,包括提出了一种新的卷积模块PDConv,解决特征图冗余问题。相较于传统方法,PDConv在处理冗余特征图上表现优异,尤其在深层网络中。其FLOPs与深度可分离卷积相当,却具有更高的准确度。基于PDConv,本文设计了PDBottleneck以及PDC2f,并在此基础设计了轻量化网络PDNet。其设计原则着重于轻量化,旨在应对现代计算环境下对模型性能和效率的双重需求。

【技术实现步骤摘要】

本专利技术涉及目标检测领域算法的改进,具体的说是一种对模型的进一步轻量化方法。


技术介绍

1、目标检测模型轻量化是近年来在计算机视觉领域备受关注的一个重要趋势。目标检测模型作为图像识别、视频分析等任务中的关键组成部分,其准确性和性能已经取得了巨大的进步。然而,随着应用场景的不断扩展和技术需求的提高,追求轻量化模型已经成为了一个重要的目标。目标检测模型轻量化的关键优势在于其在保持高准确性的同时,大大降低了模型的计算复杂度和资源消耗。这一优势带来了多方面的益处:实时性与高效性,轻量化目标检测模型具有更快的推理速度和更低的延迟,能够实现实时目标识别和响应。在需要快速决策和即时反馈的场景中,其高效性尤为重要。适用性广泛,轻量化模型在资源受限的环境下表现出色,可以轻松部署在移动设备、嵌入式系统和边缘计算平台中。这种广泛的适用性使得轻量化模型能够满足多样化的应用需求。节约成本与能源,由于其更高的运行效率,轻量化目标检测模型在计算资源和能源消耗方面表现出色,有助于降低运行成本和能源开支。增强用户体验,快速响应和高效推理能力改善了用户体验,使得应用程序更具交互性和吸引力。因此,目标检测模型轻量化的优势不仅在于提高了模型的实际应用性,更在于其对于计算资源的高效利用,这使得它成为了当前计算机视觉领域中备受关注的前沿技术之一。

2、目前的大部分轻量化网络(如mobilenet、xception、shufflenets、ghostnet)都基于dw,这些网络为了克服上述这些问题进行了改进,例如,mobilenets引入了pointwiseconvolution(pw)卷积,利用1x1卷积有效地融合通道间的特征图。shufflenets通过打乱通道重组方式来增强效果,促进通道间更好的信息交流。ghost则通过halved sc来提高模型的效果,增强信息传递。还有轻量化网络如fasternet通过partial sc压缩参数和计算量。这些网络在处理冗余特征图时通常采用保留部分特征或者使用廉价操作来保留重要信息,这些方法在提高模型性能方面表现良好。借鉴这些思想,有可能只保留冗余特征图的部分内容却能实现接近或相同的特征表达效果。针对生成的特征图进行观察后,发现一些特征图之间存在几乎完全相同的情况。即便采用廉价操作保留部分特征,仍然会导致不必要的重复信息。


技术实现思路

1、针对现有技术中的上述不足,本专利技术提出一种新的卷积pdconv,设计pdbottleneck以及pdc2f并构建轻量化模型pdnet,来降低网络复杂度问题,减少网络计算。

2、本专利技术为实现上述目的所采用的技术方案是:

3、一种基于pdnet的轻量化目标检测方法,包括以下步骤:

4、s1、采集目标场景图像数据并数据增强、标签分类、建立带有分类标签的配对数据集。

5、s2、对yolov8网络结构进行改进,建立基于pdconv的pdbottleneck以及pdc2f的骨干网络,将其与yolov8的脖颈、检测头组合为新网络结构,即轻量化网络pdnet,利用配对数据集进行训练优化;

6、s3、采集图像数据,输入优化训练后的pdnet的轻量化目标检测网络,自动定位目标位置预测框和输出预测分类标签。

7、所述网络结构包括:骨干、脖颈、检测头;骨干为一系列卷积层和池化层组成,用于捕获图像的低级特征;脖颈是连接在骨干网络和最终输出层之间的中间层,用于进行特征融合和维度适应;检测头是网络的顶部包括全连接层或卷积层,用于执行具体的目标检测、图像分类或语义分割,将最终的特征表示映射到任务的输出。

8、所述标签分类为人工对目标进行分类。

9、所述骨干网络中的pdc2f结构包括依次连接的cbs模块、split操作、n路pdbottleneck模块、concat拼接、cbs模块,用于解决深度网络中特征丢失。

10、所述pdbottleneck结构包括:

11、当输入通道和输出通道相同时,采用残差连接结构,首先进行通道数的升维,接着应用3x3的pdconv进行卷积操作,之后通过适应维度的方式进行通道数的降维并与源输入特征图相加;

12、当输入通道和输出通道不同时,只对其进行一次普通的1x1卷积和接下来的3x3pdconv操作。

13、所述轻量化卷积pdconv,减少特征图冗余,其算法步骤共五个stage:

14、stage1:通过1x1卷积对源输入特征图进行降维操作输出特征图y1;特征图y1与原特征图相似特征图,通道数减半;

15、stage2:对y1特征图进行3x3的深度卷积输出特征图y2通道数和输入通道数相同;

16、stage3:使用卷积核为1x1对y2特征图进行逐点卷积,用于加权不同空间的相同通道信息;输出特征图y3通道数为输入一半,即源输入通道1/4;

17、stage4:为适应维度对特征图y3进行升维输出特征图y4,通道数变为输入通道二倍;

18、stage5:将y1与y4进行通道维度concat拼接为输出特征图。

19、所述stage2的深度卷积采用分组卷积,分组数g为输入特征图通道数。

20、本专利技术具有以下有益效果及优点:

21、首先,本专利技术提出了一种全新的卷积方法,即pdconv,其在卷积操作中表现出更快的处理速度,并能够在精确度方面取得优异的成绩。这一创新的方法为现有的卷积技术带来了显著的改进,为深度学习模型的效率和准确性提供了全新的可能性。

22、其次,本专利技术基于pdconv设计pdbottleneck以及pdc2f,并在此基础搭建pdnet。通过这一技术的应用,本专利技术成功简化了模型结构,使其在保持性能的同时大幅减少了计算和参数的需求。这项改进使得网络在处理复杂任务时具备了更高的效率和可扩展性。

本文档来自技高网...

【技术保护点】

1.一种基于PDNet的轻量化目标检测方法,其特征在于,包括以下步骤:

2.根据权利1所述的一种基于PDNet的轻量化目标检测方法,其特征在于,所述网络结构包括:骨干、脖颈、检测头;骨干为一系列卷积层和池化层组成,用于捕获图像的低级特征;脖颈是连接在骨干网络和最终输出层之间的中间层,用于进行特征融合和维度适应;检测头是网络的顶部包括全连接层或卷积层,用于执行具体的目标检测、图像分类或语义分割,将最终的特征表示映射到任务的输出。

3.根据权利1所述的一种基于PDNet的轻量化目标检测方法,其特征在于,所述标签分类为人工对目标进行分类。

4.根据权利1所述的一种基于PDNet的轻量化目标检测方法,其特征在于,所述骨干网络中的PDC2f结构包括依次连接的CBS模块、split操作、n路PDBottleneck模块、concat拼接、CBS模块,用于解决深度网络中特征丢失。

5.根据权利1所述的一种基于PDNet的轻量化目标检测方法,其特征在于,所述PDBottleneck结构包括:

6.根据权利5所述的一种基于PDNet的轻量化目标检测方法,其特征在于,所述轻量化卷积PDConv,减少特征图冗余,其算法步骤共五个stage:

7.根据权利6所述的一种基于PDNet的轻量化目标检测方法,其特征在于,所述Stage2的深度卷积采用分组卷积,分组数g为输入特征图通道数。

...

【技术特征摘要】

1.一种基于pdnet的轻量化目标检测方法,其特征在于,包括以下步骤:

2.根据权利1所述的一种基于pdnet的轻量化目标检测方法,其特征在于,所述网络结构包括:骨干、脖颈、检测头;骨干为一系列卷积层和池化层组成,用于捕获图像的低级特征;脖颈是连接在骨干网络和最终输出层之间的中间层,用于进行特征融合和维度适应;检测头是网络的顶部包括全连接层或卷积层,用于执行具体的目标检测、图像分类或语义分割,将最终的特征表示映射到任务的输出。

3.根据权利1所述的一种基于pdnet的轻量化目标检测方法,其特征在于,所述标签分类为人工对目标进行分类。

4.根据权利1所述的一种基于pdnet的轻量化目...

【专利技术属性】
技术研发人员:王卫孟源泽于金刚于波张成红李顺
申请(专利权)人:中国科学院沈阳计算技术研究所有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1