目标检测与分类方法及计算机可读存储介质技术

技术编号：31744565 阅读：18 留言：0更新日期：2022-01-05 16:23

本发明专利技术公开了一种目标检测与分类方法及计算机可读存储介质，方法包括：获取样本集；分别对各样本图片中的待测目标进行标注，得到与各样本图片一一对应的标注文件；构建神经网络模型，并根据样本图片及其对应的标注文件，对神经网络模型进行训练；获取待测图片，并输入训练后的神经网络模型，得到检测结果；其中，神经网络模型包括深度残差网络模块、特征金字塔网络模块、区域候选网络模块以及分类与回归子网络模块；特征金字塔网络模块用于对C2

全部详细技术资料下载

【技术实现步骤摘要】
目标检测与分类方法及计算机可读存储介质

[0001]本专利技术涉及目标识别
，尤其涉及一种目标检测与分类方法及计算机可读存储介质。

技术介绍

[0002]近年来，随着交通物流的发展，越来越多的物流车辆服务于人们的工作和生活中，使得物流园中每天都有大量的物流车辆进出或停放于园区中，导致园区对物流车辆的管理难度系统大大提升。若能识别物流车辆类型，则可方便物流园区对车辆的管理。
[0003]目前，物流园区都安装有监控摄像头，可通过监控摄像头拍摄的视频图像进行车辆识别。然而，园区中往往存在较多的车辆目标，并且，由于监控摄像头一般设置在高处且景深很远，因此存在部分车辆占图片比例很小的现象，即存在小目标的问题，而小目标的颜色与车型容易与背景元素混淆，增大了车辆检测与分类的难度。同时，还存在部分车辆大比例被遮挡的现象，即存在强遮挡的问题，导致目标能利用的信息有限，也增大了检测与分类的难度。
[0004]另外，部分待识别目标之间容易混淆，也进一步加大了分类的难度。例如，货车需要分为仓栅式、栏板式和厢式的细粒度识别，行人、摩托车和自行车在小目标上非常相似，三轮车与面包车的背部非常相似，三轮车与摩托车的前部和侧部非常相似，面包车的一些车型如mini
‑
van和轿车非常相似等等。
[0005]虽然目前已有许多车辆检测方法，但针对小目标且高遮挡的多类型车辆目标的检测场景，均无法很好地进行检测，或检测效果大幅下降。因此，如何对小目标且高遮挡的物流园车辆进行准确地检测与分类成为有待解决的问题。r/>
技术实现思路

[0006]本专利技术所要解决的技术问题是：提供一种目标检测与分类方法及计算机可读存储介质，可实现对尺寸较小且高遮挡的目标的检测与分类。
[0007]为了解决上述技术问题，本专利技术采用的技术方案为：一种目标检测与分类方法，包括：
[0008]获取样本集，所述样本集中包括多张包含待测目标的样本图片；
[0009]分别对各样本图片中的待测目标进行标注，得到与各样本图片一一对应的标注文件，所述标注文件包括待测目标的边界框坐标以及待测目标的类别；
[0010]构建神经网络模型，并根据所述样本图片及其对应的标注文件，对所述神经网络模型进行训练；
[0011]获取待测图片，并将所述待测图片输入训练后的神经网络模型，得到检测结果；
[0012]其中，所述神经网络模型包括深度残差网络模块、特征金字塔网络模块、区域候选网络模块以及分类与回归子网络模块；
[0013]所述深度残差网络模块用于对输入图片进行特征提取，自下而上地得到C1特征
图、C2特征图、C3特征图、C4特征图和C5特征图，并将所述C2特征图、C3特征图、C4特征图和C5特征图输出至特征金字塔网络；
[0014]所述特征金字塔网络模块用于对所述C2特征图、C3特征图、C4特征图和C5特征图进行特征提取、特征融合以及卷积处理，得到P2特征图、P3特征图、P4特征图和P5特征图，并对所述C5特征图进行步长为2的3
×
3卷积处理，得到P6特征图；
[0015]所述区域候选网络模块用于根据P2特征图、P3特征图、P4特征图、P5特征图和P6特征图，在输入图片中映射得到锚框，并根据预设的n个尺度和m个宽高比，生成各锚框对应的候选框，所述m大于3；
[0016]所述分类与回归子网络模块用于根据预设的淘汰评分、交并比阈值和评分排名，对所述候选框进行过滤与合并，得到预测框及其类别。
[0017]本专利技术还涉及一种计算机可读存储介质，其上存储有计算机程序，所述程序被处理器执行时实现如上所述的方法的步骤。
[0018]本专利技术的有益效果在于：在特征金字塔网络模块中，通过增加P2特征图的使用，可实现对小尺寸目标和强遮挡目标的检测，通过减少P7特征图的使用，可节约计算成本，从而增强尺寸较小的目标的检测能力，且尺寸较大的目标的检测能力没有明显下降；在区域候选网络模块中，通过设置更多的宽高比，以生成更密集的预测框，从而避免对小尺寸目标和强遮挡目标的漏检；在分类与回归子网络模块中，通过设置合适的非极大值抑制参数，可以更好地应用于小尺寸且高遮挡的目标检测与分类场景，提高检测与分类的准确性。
附图说明
[0019]图1为本专利技术的一种目标检测与分类方法的流程图；
[0020]图2为本专利技术实施例一的方法流程图；
[0021]图3为本专利技术实施例一的样本图片中标注的边界框示意图；
[0022]图4为本专利技术实施例一的更新前后的标注文件；
[0023]图5为本专利技术实施例一的检测结果示意图；
[0024]图6为现有的RetinaNet的结构示意图；
[0025]图7为现有的深度残差网络ResNet的结构示意图；
[0026]图8为现有的特征金字塔网络FPN的特征提取网络结构示意图；
[0027]图9为本专利技术实施例一的特征提取网络结构示意图；
[0028]图10为本专利技术实施例一的神经网络模型的结构示意图；
[0029]图11为本专利技术实施例一的神经网络模型与五种现有模型的COCOs评价指标对比图。
具体实施方式
[0030]为详细说明本专利技术的
技术实现思路
、所实现目的及效果，以下结合实施方式并配合附图详予说明。
[0031]请参阅图1，一种目标检测与分类方法，包括：
[0032]获取样本集，所述样本集中包括多张包含待测目标的样本图片；
[0033]分别对各样本图片中的待测目标进行标注，得到与各样本图片一一对应的标注文
件，所述标注文件包括待测目标的边界框坐标以及待测目标的类别；
[0034]构建神经网络模型，并根据所述样本图片及其对应的标注文件，对所述神经网络模型进行训练；
[0035]获取待测图片，并将所述待测图片输入训练后的神经网络模型，得到检测结果；
[0036]其中，所述神经网络模型包括深度残差网络模块、特征金字塔网络模块、区域候选网络模块以及分类与回归子网络模块；
[0037]所述深度残差网络模块用于对输入图片进行特征提取，自下而上地得到C1特征图、C2特征图、C3特征图、C4特征图和C5特征图，并将所述C2特征图、C3特征图、C4特征图和C5特征图输出至特征金字塔网络；
[0038]所述特征金字塔网络模块用于对所述C2特征图、C3特征图、C4特征图和C5特征图进行特征提取、特征融合以及卷积处理，得到P2特征图、P3特征图、P4特征图和P5特征图，并对所述C5特征图进行步长为2的3
×
3卷积处理，得到P6特征图；
[0039]所述区域候选网络模块用于根据P2特征图、P3特征图、P4特征图、P5特征图和P6特征图，在输入图片中映射得到锚框，并根据预设的n个尺度和m个宽高比，生成各锚框对应的候选框，所述m大于3；
[0040]所述分类与回归子网络模块用于根据预设的淘汰评分、交并比阈值和评分排名，本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种目标检测与分类方法，其特征在于，包括：获取样本集，所述样本集中包括多张包含待测目标的样本图片；分别对各样本图片中的待测目标进行标注，得到与各样本图片一一对应的标注文件，所述标注文件包括待测目标的边界框坐标以及待测目标的类别；构建神经网络模型，并根据所述样本图片及其对应的标注文件，对所述神经网络模型进行训练；获取待测图片，并将所述待测图片输入训练后的神经网络模型，得到检测结果；其中，所述神经网络模型包括深度残差网络模块、特征金字塔网络模块、区域候选网络模块以及分类与回归子网络模块；所述深度残差网络模块用于对输入图片进行特征提取，自下而上地得到C1特征图、C2特征图、C3特征图、C4特征图和C5特征图，并将所述C2特征图、C3特征图、C4特征图和C5特征图输出至特征金字塔网络；所述特征金字塔网络模块用于对所述C2特征图、C3特征图、C4特征图和C5特征图进行特征提取、特征融合以及卷积处理，得到P2特征图、P3特征图、P4特征图和P5特征图，并对所述C5特征图进行步长为2的3
×
3卷积处理，得到P6特征图；所述区域候选网络模块用于根据P2特征图、P3特征图、P4特征图、P5特征图和P6特征图，在输入图片中映射得到锚框，并根据预设的n个尺度和m个宽高比，生成各锚框对应的候选框，所述m大于3；所述分类与回归子网络模块用于根据预设的淘汰评分、交并比阈值和评分排名，对所述候选框进行过滤与合并，得到预测框及其类别。2.根据权利要求1所述的目标检测与分类方法，其特征在于，所述分别对各样本图片中的待测目标进行标注，得到与各样本图片一一对应的标注文件之后，进一步包括：分别将各样本图片缩放为预设的大小，并根据缩放后的各样本图片，对应更新各标注文件。3.根据权利要求1所述的目标检测与分类方法，其特征在于，所述分别对各样本图片中的待测目标进行标注，得到与各样本图片一一对应的标注文件之后，进一步包括：对所述样本集进行数据增强处理。4.根据权利要求1所述的目标检测与分类方法，其特征在于，所述根据所述样本图片及其对应的标注文件，对所述神经网络模型进行训练具体为：遍历所述样本集，依次获取一样本图片；将所述一样本图片输入所述神经网络模型，得到所述一样本图片对应的预测结果，所述预测结果包括预测框及其类别；根据所述一样本图片对应的预测结果和标注文件，计算所述一样本图片对应的损失值；根据所述损失值，通过反向传播算法更新所述神经网络模型；当遍历完所述样本集后，计算各样本图片对应的损失值的平均值，得到平均损失值；判断所述平均损失值是否小于预设的阈值；若否，则根据所述损失值，通过反向传播算法更新所述神经网络模型，并继续执行所述遍历所述样本集，依次获取一样本图片的步骤；
若是，则结束训练，得到训练后的神经网络模型。5.根据权利要求1所述的目标检测与分类方法，其特征在于，所述根据所述样本图片及其对应的标注文件，对所述神经网络模型进...

【专利技术属性】
技术研发人员：袁炳杰，梅汇伟，许国锐，张立军，
申请(专利权)人：厦门汇利伟业科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人