一种基于PSENet区域分割的列车车厢号定位方法技术

技术编号：39187946 阅读：9 留言：0更新日期：2023-10-27 08:35

本发明专利技术公开了一种基于PSENet区域分割的列车车厢号定位方法，通过结合注意力机制SE模块从卷积通道特征角度对网络权重参数进行再分配，提高残差网络对车厢号特征的提取性能，采用特征金字塔和自底向上路径增强模块，传递浅层网络强定位信息到富含强语义信息的深层网络中，融合来自两种网络的特征得到多尺度特征图后采用渐进尺度扩展算法对车厢号区域进行分割，本发明专利技术可以使货运列车车厢号定位有较高精确率与召回率，有利于后续车厢号识别工作的进行。的进行。的进行。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于PSENet区域分割的列车车厢号定位方法

[0001]本专利技术属于人工智能
，具体涉及一种基于PSENet区域分割的列车车厢号定位方法。

技术介绍

[0002]货运列车车厢号检测是铁路运输管理系统信息化、智能化建设中的一项重要内容，主要功能是实现车次、车号自动识别，为铁路运输管理系统提供车次、车号等实时的基础信息。目前铁路运输站大多使用的基于射频识别(Radio Frequency Identification，RFID)技术的列车车号识别及定位监测系统方案，该方案检测识别准确率高，可以全天候24小时工作，不受光照和天气等客观条件影响，但是随着列车提速和系统使用年限的增加，车厢底部安装的射频标签会损坏或脱落，这会导致该方法的准确率急剧下降。
[0003]近年，基于数字图像处理的列车车号检测定位方法凭借部署容易、使用成本低、精度高和效率高等优点脱颖而出，吸引了很多研究人员针对该方法容易遇到的问题展开了深入研究。有使用数学形态学方法和投影法相结合，将高速列车车号图像分割成多个连通区域，根据车号区域面积的变化范围，确定精确车号位置；也有使用数学形态学方法和连通体分析技术，利用列车车号字符间特定的几何比例关系定位车号区域；还有使用Faster R
‑
CNN神经网络，通过调整特征提取网络来增强特征图的细节特征，采用聚类算法求车号区域长宽比以改进锚定框的尺寸设计，使得目标文本检测框与实际车号区域更加贴合；此外，还有使用连接文本预选区域网络(Connection Text Proposal...

【技术保护点】

【技术特征摘要】
1.一种基于PSENet区域分割的列车车厢号定位方法，其特征在于，所述列车车厢号定位方法包括以下步骤：S1，利用位于铁路两侧的视频监控设备对包含车厢号的货车列车的视频图像进行采集，对采集的车厢图像做预处理，对车厢图像中的车厢号区域做标签后，生成车厢样本图像，并构建样本数据集；S2，构建列车车厢号定位模型，所述列车车厢号定位模型包括残差网络模块、特征金字塔FPN模块、自底向上路径增强模块和渐进尺度扩展模块；具体地，所述残差网络模块对导入的车厢图像进行多尺度特征提取，将提取的不同尺度特征图输出至特征金字塔FPN模块，由特征金字塔FPN模块将不同尺度特征图从深层网络通过上采样的方式与浅层网络进行初次融合，得到不同尺度的初次融合特征图；所述自底向上路径增强模块将特征金字塔FPN模块输出的初次融合特征图从浅层网络通过下采样的方式与深层网络融合得到不同尺度的二次融合特征图，再将不同尺度的二次融合特征图合并成单张特征图；所述渐进尺度扩展模块利用广度优先搜索算法从文本核分割图的最小尺度到最大尺度进行文本区域的尺度扩展，获得最终的文本检测结果；S3，采用样本数据集对列车车厢号定位模型进行训练，利用训练完成的列车车厢号定位模型对待处理的车厢图像进行车厢号定位，输出定位得到的货车列车车厢号。2.根据权利要求1所述的基于PSENet区域分割的列车车厢号定位方法，其特征在于，步骤S1中，对采集的车厢图像做预处理的过程包括以下步骤：从采集的货车列车的视频中提取出全部单帧图像，从中筛选出所有包括车厢号的车厢图像，对筛选出的车厢图像随机进行翻转、裁剪和旋转处理，将处理后的车厢图像尺寸进行标准化，再对标准化后的图像中的车厢号区域打标签。3.根据权利要求1所述的基于PSENet区域分割的列车车厢号定位方法，其特征在于，步骤S2中，所述残差网络模块的主体结构采用ResNet50网络，包括依次连接的五个卷积层，除第一层卷积层之外，其他四层卷积层之后均连接有引入通道注意力机制的SE模块；并且第一层卷积层的卷积核大小为3
×
3；四个SE模块分别输出不同尺度特征图{f2，f3，f4，f5}。4.根据权利要求3所述的基于PSENet区域分割的列车车厢号定位方法，其特征在于，所述SE模块包括两个分支，其中一个分支包括相互连接的压缩单元和激发单元，用来学习每个通道的权重，另一个分支完整保留原特征图信息，再将学习到的每个通道的权重作用于原特征图中；所述压缩单元使用自适应平均池化将大小为H
×
W
×
特征图f压缩成1
×1×
C，特征图的空间信息被压缩在通道域中：其中，z
c
表示被压缩的特征图空间信息，F
sq
表示Squeeze操作，f
c
(c，h，l)表示特征图在空间(h，l)处的值，H和L分别表示特征图在行和列方向上的维度大小；所述激发单元由两个全连接层组成，用于获取通道相关的依赖关系：s＝F
ex
(z
c
)＝σ[D2δ(D1z
c
)]其中，F
ex
表示Excitation操作，D1，D2分别为降维和升维的全连接层，δ表示ReLU函数，σ
表示sigmoid函数。5.根...

【专利技术属性】
技术研发人员：喻春雨，范沐阳，陈刚，
申请(专利权)人：南京邮电大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人