基于特征图双轴Transformer模块的车辆检测方法技术

技术编号:37192406 阅读:12 留言:0更新日期:2023-04-20 22:52
本发明专利技术涉及计算机视觉的目标检测领域。目的是提供一种基于特征图双轴Transformer模块的车辆检测方法,该方法应具有检测精度高的特点。技术方案是基于特征图双轴Transformer模块的车辆检测方法,包括以下步骤:1)采集道路监控图片并对图片中的车辆轮廓进行标注形成数据集;2)将数据集输入双轴Transformer模块进行训练;3)利用双轴Transformer模块对道路监控图片进行检测。监控图片进行检测。监控图片进行检测。

【技术实现步骤摘要】
基于特征图双轴Transformer模块的车辆检测方法


[0001]本专利技术涉及计算机视觉的目标检测领域,具体是一种基于特征图双轴Transformer模块的车辆检测方法。

技术介绍

[0002]目标检测技术从阶段上分为二阶段检测技术和一阶段检测技术。
[0003]二阶段检测技术的基本流程是先提出目标候选框,在第一阶段计算目标框的粗略位置、大小和前景概率,在第二阶段计算精确的目标框位置、大小及类别,代表性的方法有:RCNN(RegionswithCNNfeatures)、SPP

NET(SpatialPyramidPooling)、FastRCNN、FasterRCNN等。一阶段检测技术的做法是直接通过深度神经网络计算目标的大小、位置和类别,代表性的方法有YOLO(YouOnlyLookOnce)、SSD(SingleShotMultiBoxDetector)。二阶段检测技术的架构具有较高的检测精度,但也限制了检测速度,一阶段检测技术的优势是速度快,劣势是精度下降。
[0004]近年来,Transformer在自然语言处理、搜索推荐领域取了显著的应用成果。Transformer由自然语言处理领域知名论文《attentionisallyouneed》提出,通过attention机制对不同的信息赋予不同的权重,同时考虑到信息间的交互关系,进行融合编码。Transformer结构对信息提取和处理能力优于卷积结构。Transformer在机器视觉中的应用如VIT(visiontransformer)等,但是Transformer结构计算复杂度高(Transformer属于一阶段检测技术),Transformer提升模型效果的同时会大幅增加计算量。为了保证模型的效率,SwinTransformer、C

SwinTransformer相继被提出,其主要方式是通过滑动窗口方法计算窗口内Attention。上述方法在采用Transformer模块时多使用在输入图像或Backbone阶段,此时,图像尺寸较大,Transformer计算复杂度较高。

技术实现思路

[0005]本专利技术的目的是克服上述
技术介绍
中的不足,提供一种基于特征图双轴Transformer模块的车辆检测方法,该方法应具有检测精度高的特点。
[0006]本专利技术的技术方案是:
[0007]基于特征图双轴Transformer模块的车辆检测方法,包括以下步骤:
[0008]1)采集道路监控图片并对图片中的车辆轮廓进行标注形成数据集;
[0009]2)将数据集输入双轴Transformer模块进行训练;
[0010]3)利用双轴Transformer模块对道路监控图片进行检测;
[0011]所述双轴Transformer模块包括Backbone网络、Neck网络、Prediction网络;
[0012]所述Backbone网络包括依次连接的Focus层、第一卷积层、第一残差结构卷积层、第二卷积层、第二残差结构卷积层、第三卷积层、第三残差结构卷积层、第四卷积层、空间金字塔池化层、第四残差结构卷积层;
[0013]所述Neck网络包括依次连接的第五卷积层、第一上采样层、拼接层、第六卷积层、
第二上采样层、第一CTCR层、第一CTPR层、第七卷积层、第二CTCR层、第二CTPR层、第八卷积层、第三CTCR层、第三CTPR层;
[0014]所述Prediction网络基于预设定尺寸的候选框对特征图的目标进行分类和边界预测,Prediction网络包括第一检测层、第二检测层、第三检测层;
[0015]所述第二残差结构卷积层的输出还连接第一CTCR层的输入,第三残差结构卷积层的输出还连接拼接层的输入,第五卷积层的输出还连接第三CTPR层的输入,拼接层的输出还连接第一CTPR层的输入,第六卷积层的输出还连接第二CTPR层的输入;所述第一CTPR层的输出还连接第一检测层的输入,第二CTPR层的输出还连接第二检测层的输入,第三CTPR层的输出连接第三检测层的输入。
[0016]所述第一CTCR层、第二CTCR层、第三CTCR层均包括:
[0017]S1

1、对输入特征图进行两次卷积操作;
[0018]S1

2、对输入特征图经过Transformer_C模块处理;
[0019]S1

3、将S1

1的输出、S1

2的输出、输入特征图进行拼接,再进行卷积操作;
[0020]所述第一CTPR层、第二CTPR层、第三CTPR层均包括:
[0021]S2

1、对输入特征图进行两次卷积操作;
[0022]S2

2、对输入特征图经过Transformer_P模块处理;
[0023]S2

3、将S2

1的输出、S2

2的输出、输入特征图进行拼接,再进行卷积操作。
[0024]所述Transformer_C模块依次包括:先对输入的特征图按通道级进行展开,再给每个向量增加位置参数,然后所有向量均经过Attention模块处理后进行拼接,接着经过全连接层得到输出向量,最后通过Reshape操作还原向量。
[0025]所述Transformer_P模块依次包括:先对特征图进行区域划分得到区域块,再按区域块进行展开,然后给每个区域块向量增加位置参数,接着所有向量均经过Attention模块处理后进行拼接,经过全连接层得到输出向量,最后通过Reshape操作还原向量。
[0026]所述Attention模块依次包括先将输入向量映射成Query向量、Key向量、Value向量,再用Query向量和Key向量计算关联性作为加权Value的权重,然后经过全连接层进行计算得到输出结果。
[0027]所述Focus层包括:对图片进行切片操作,将每张图片分成四张互补的图片,再将四张图片拼接后进行卷积操作,得到二倍下采样特征图。
[0028]所述第一卷积层、第二卷积层、第三卷积层、第四卷积层、第五卷积层、第六卷积层、第七卷积层、第八卷积层、卷积操作的步骤相同。
[0029]所述第一残差结构卷积层、第二残差结构卷积层、第三残差结构卷积层、第四残差结构卷积层均包括:
[0030]S3

1、对输入特征图进行两次卷积操作;
[0031]S3

2、将S3

1的输出与输入特征图进行相加;
[0032]S3

3、将输入特征图进行一次卷积操作;
[0033]S3

4、将S3

2和S3

3的输出进行拼接,然后再进行一次卷积操作。
[0034]所述空本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于特征图双轴Transformer模块的车辆检测方法,包括以下步骤:1)采集道路监控图片并对图片中的车辆轮廓进行标注形成数据集;2)将数据集输入双轴Transformer模块进行训练;3)利用双轴Transformer模块对道路监控图片进行检测;所述双轴Transformer模块包括Backbone网络、Neck网络、Prediction网络;所述Backbone网络包括依次连接的Focus层、第一卷积层、第一残差结构卷积层、第二卷积层、第二残差结构卷积层、第三卷积层、第三残差结构卷积层、第四卷积层、空间金字塔池化层、第四残差结构卷积层;所述Neck网络包括依次连接的第五卷积层、第一上采样层、拼接层、第六卷积层、第二上采样层、第一CTCR层、第一CTPR层、第七卷积层、第二CTCR层、第二CTPR层、第八卷积层、第三CTCR层、第三CTPR层;所述Prediction网络基于预设定尺寸的候选框对特征图的目标进行分类和边界预测,Prediction网络包括第一检测层、第二检测层、第三检测层;所述第二残差结构卷积层的输出还连接第一CTCR层的输入,第三残差结构卷积层的输出还连接拼接层的输入,第五卷积层的输出还连接第三CTPR层的输入,拼接层的输出还连接第一CTPR层的输入,第六卷积层的输出还连接第二CTPR层的输入;所述第一CTPR层的输出还连接第一检测层的输入,第二CTPR层的输出还连接第二检测层的输入,第三CTPR层的输出连接第三检测层的输入。所述第一CTCR层、第二CTCR层、第三CTCR层均包括:S1

1、对输入特征图进行两次卷积操作;S1

2、对输入特征图经过Transformer_C模块处理;S1

3、将S1

1的输出、S1

2的输出、输入特征图进行拼接,再进行卷积操作;所述第一CTPR层、第二CTPR层、第三CTPR层均包括:S2

1、对输入特征图进行两次卷积操作;S2

2、对输入特征图经过Transformer_P模块处理;S2

3、将S2

1的输出、S2

2的输出、输入特征图进行拼接,再进行卷积操作。2.根据权利要求1所述的基于特征图双轴Transformer模块的车辆检测方法,其特征在于:所述Transformer_C模块依次包括:先对输入的特征图按通道级进行展开,再给每个向量增加位置参数,然后所有向量均经过Attention模块处理后进行拼接,接着经过全连接层得到输出向量,最后通过Reshape操作还原向量。3.根据权利要求2所述的基于特征图双轴...

【专利技术属性】
技术研发人员:刘尧张玉杰杜逸李炎金忠富
申请(专利权)人:浙江省交通投资集团有限公司智慧交通研究分公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1