【技术实现步骤摘要】
基于特征图双轴Transformer模块的车辆检测方法
[0001]本专利技术涉及计算机视觉的目标检测领域,具体是一种基于特征图双轴Transformer模块的车辆检测方法。
技术介绍
[0002]目标检测技术从阶段上分为二阶段检测技术和一阶段检测技术。
[0003]二阶段检测技术的基本流程是先提出目标候选框,在第一阶段计算目标框的粗略位置、大小和前景概率,在第二阶段计算精确的目标框位置、大小及类别,代表性的方法有:RCNN(RegionswithCNNfeatures)、SPP
‑
NET(SpatialPyramidPooling)、FastRCNN、FasterRCNN等。一阶段检测技术的做法是直接通过深度神经网络计算目标的大小、位置和类别,代表性的方法有YOLO(YouOnlyLookOnce)、SSD(SingleShotMultiBoxDetector)。二阶段检测技术的架构具有较高的检测精度,但也限制了检测速度,一阶段检测技术的优势是速度快,劣势是精度下降。
[0004]近年来,Transformer在自然语言处理、搜索推荐领域取了显著的应用成果。Transformer由自然语言处理领域知名论文《attentionisallyouneed》提出,通过attention机制对不同的信息赋予不同的权重,同时考虑到信息间的交互关系,进行融合编码。Transformer结构对信息提取和处理能力优于卷积结构。Transformer在机器视觉中的应用如VIT(visiontransf ...
【技术保护点】
【技术特征摘要】
1.基于特征图双轴Transformer模块的车辆检测方法,包括以下步骤:1)采集道路监控图片并对图片中的车辆轮廓进行标注形成数据集;2)将数据集输入双轴Transformer模块进行训练;3)利用双轴Transformer模块对道路监控图片进行检测;所述双轴Transformer模块包括Backbone网络、Neck网络、Prediction网络;所述Backbone网络包括依次连接的Focus层、第一卷积层、第一残差结构卷积层、第二卷积层、第二残差结构卷积层、第三卷积层、第三残差结构卷积层、第四卷积层、空间金字塔池化层、第四残差结构卷积层;所述Neck网络包括依次连接的第五卷积层、第一上采样层、拼接层、第六卷积层、第二上采样层、第一CTCR层、第一CTPR层、第七卷积层、第二CTCR层、第二CTPR层、第八卷积层、第三CTCR层、第三CTPR层;所述Prediction网络基于预设定尺寸的候选框对特征图的目标进行分类和边界预测,Prediction网络包括第一检测层、第二检测层、第三检测层;所述第二残差结构卷积层的输出还连接第一CTCR层的输入,第三残差结构卷积层的输出还连接拼接层的输入,第五卷积层的输出还连接第三CTPR层的输入,拼接层的输出还连接第一CTPR层的输入,第六卷积层的输出还连接第二CTPR层的输入;所述第一CTPR层的输出还连接第一检测层的输入,第二CTPR层的输出还连接第二检测层的输入,第三CTPR层的输出连接第三检测层的输入。所述第一CTCR层、第二CTCR层、第三CTCR层均包括:S1
‑
1、对输入特征图进行两次卷积操作;S1
‑
2、对输入特征图经过Transformer_C模块处理;S1
‑
3、将S1
‑
1的输出、S1
‑
2的输出、输入特征图进行拼接,再进行卷积操作;所述第一CTPR层、第二CTPR层、第三CTPR层均包括:S2
‑
1、对输入特征图进行两次卷积操作;S2
‑
2、对输入特征图经过Transformer_P模块处理;S2
‑
3、将S2
‑
1的输出、S2
‑
2的输出、输入特征图进行拼接,再进行卷积操作。2.根据权利要求1所述的基于特征图双轴Transformer模块的车辆检测方法,其特征在于:所述Transformer_C模块依次包括:先对输入的特征图按通道级进行展开,再给每个向量增加位置参数,然后所有向量均经过Attention模块处理后进行拼接,接着经过全连接层得到输出向量,最后通过Reshape操作还原向量。3.根据权利要求2所述的基于特征图双轴...
【专利技术属性】
技术研发人员:刘尧,张玉杰,杜逸,李炎,金忠富,
申请(专利权)人:浙江省交通投资集团有限公司智慧交通研究分公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。