一种基于PSENet区域分割的列车车厢号定位方法技术

技术编号:39187946 阅读:9 留言:0更新日期:2023-10-27 08:35
本发明专利技术公开了一种基于PSENet区域分割的列车车厢号定位方法,通过结合注意力机制SE模块从卷积通道特征角度对网络权重参数进行再分配,提高残差网络对车厢号特征的提取性能,采用特征金字塔和自底向上路径增强模块,传递浅层网络强定位信息到富含强语义信息的深层网络中,融合来自两种网络的特征得到多尺度特征图后采用渐进尺度扩展算法对车厢号区域进行分割,本发明专利技术可以使货运列车车厢号定位有较高精确率与召回率,有利于后续车厢号识别工作的进行。的进行。的进行。

【技术实现步骤摘要】
一种基于PSENet区域分割的列车车厢号定位方法


[0001]本专利技术属于人工智能
,具体涉及一种基于PSENet区域分割的列车车厢号定位方法。

技术介绍

[0002]货运列车车厢号检测是铁路运输管理系统信息化、智能化建设中的一项重要内容,主要功能是实现车次、车号自动识别,为铁路运输管理系统提供车次、车号等实时的基础信息。目前铁路运输站大多使用的基于射频识别(Radio Frequency Identification,RFID)技术的列车车号识别及定位监测系统方案,该方案检测识别准确率高,可以全天候24小时工作,不受光照和天气等客观条件影响,但是随着列车提速和系统使用年限的增加,车厢底部安装的射频标签会损坏或脱落,这会导致该方法的准确率急剧下降。
[0003]近年,基于数字图像处理的列车车号检测定位方法凭借部署容易、使用成本低、精度高和效率高等优点脱颖而出,吸引了很多研究人员针对该方法容易遇到的问题展开了深入研究。有使用数学形态学方法和投影法相结合,将高速列车车号图像分割成多个连通区域,根据车号区域面积的变化范围,确定精确车号位置;也有使用数学形态学方法和连通体分析技术,利用列车车号字符间特定的几何比例关系定位车号区域;还有使用Faster R

CNN神经网络,通过调整特征提取网络来增强特征图的细节特征,采用聚类算法求车号区域长宽比以改进锚定框的尺寸设计,使得目标文本检测框与实际车号区域更加贴合;此外,还有使用连接文本预选区域网络(Connection Text Proposal Network,CTPN),通过融合两个尺度特征图以增强特征信息,采用增加了水平回归层的区域建议网络,并设计了困难样本挖掘策略和边界敏感的文本框回归策略来获得字符级车号的精确定位。
[0004]上述定位方法的前两种是基于传统数字图像处理,此类方法受光照和图像清晰度影响较大,而且货运列车常年运行,车号字符污染变形都是常见情况,容易造成车号字符与背景灰度值接近而难以分割、字符部分缺失不易识别等问题;后两种是基于深度学习中锚定框回归的文本检测,根据货运列车车厢号特征,对现有检测定位方法进行改进,着重针对静止列车车厢的小尺寸和水平文本目标,但在货运列车实际运营场景中效果不佳,非水平目标的漏检率较高,易受到非车号文本信息干扰。在日常监控视频中出现的车厢号图像并不能保证非常理想的视角和光照,因此在光照过强或过暗、车号污染缺损和因为视角造成的车号倾斜畸变的情况下成功完成车厢号检测任务是急需研究的问题。

技术实现思路

[0005]解决的技术问题:本专利技术提供了一种基于PSENet区域分割的列车车厢号定位方法,针对货运列车车厢号特征和运营场景,通过结合注意力机制SE模块(Squeeze

and

Excitation Module,SEM)从卷积通道特征角度对网络权重参数进行再分配,提高残差网络(Residual Network,ResNet)对车厢号特征的提取性能,采用特征金字塔(Feature Pyramid Networks,FPN)和自底向上路径增强(Bottom

Up Path Augmentation,BUPA)模
块,传递浅层网络强定位信息到富含强语义信息的深层网络中,融合来自两种网络的特征得到多尺度特征图后采用渐进尺度扩展算法对车厢号区域进行分割,本专利技术可以使货运列车车厢号定位有较高精确率与召回率,有利于后续车厢号识别工作的进行。
[0006]技术方案:
[0007]一种基于PSENet区域分割的列车车厢号定位方法,所述列车车厢号定位方法包括以下步骤:
[0008]S1,利用位于铁路两侧的视频监控设备对包含车厢号的货车列车的视频图像进行采集,对采集的车厢图像做预处理,对车厢图像中的车厢号区域做标签后,生成车厢样本图像,并构建样本数据集;
[0009]S2,构建列车车厢号定位模型,所述列车车厢号定位模型包括残差网络模块、特征金字塔FPN模块、自底向上路径增强模块和渐进尺度扩展模块;
[0010]具体地,所述残差网络模块对导入的车厢图像进行多尺度特征提取,将提取的不同尺度特征图输出至特征金字塔FPN模块,由特征金字塔FPN模块将不同尺度特征图从深层网络通过上采样的方式与浅层网络进行初次融合,得到不同尺度的初次融合特征图;
[0011]所述自底向上路径增强模块将特征金字塔FPN模块输出的初次融合特征图从浅层网络通过下采样的方式与深层网络融合得到不同尺度的二次融合特征图,再将不同尺度的二次融合特征图合并成单张特征图;
[0012]所述渐进尺度扩展模块利用广度优先搜索算法从文本核分割图的最小尺度到最大尺度进行文本区域的尺度扩展,获得最终的文本检测结果;
[0013]S3,采用样本数据集对列车车厢号定位模型进行训练,利用训练完成的列车车厢号定位模型对待处理的车厢图像进行车厢号定位,输出定位得到的货车列车车厢号。
[0014]进一步地,步骤S1中,对采集的车厢图像做预处理的过程包括以下步骤:
[0015]从采集的货车列车的视频中提取出全部单帧图像,从中筛选出所有包括车厢号的车厢图像,对筛选出的车厢图像随机进行翻转、裁剪和旋转处理,将处理后的车厢图像尺寸进行标准化,再对标准化后的图像中的车厢号区域打标签。
[0016]进一步地,步骤S2中,所述残差网络模块的主体结构采用ResNet50网络,包括依次连接的五个卷积层,除第一层卷积层之外,其他四层卷积层之后均连接有引入通道注意力机制的SE模块;并且第一层卷积层的卷积核大小为3
×
3;四个SE模块分别输出不同尺度特征图{f2,f3,f4,f5}。
[0017]进一步地,所述SE模块包括两个分支,其中一个分支包括相互连接的压缩单元和激发单元,用来学习每个通道的权重,另一个分支完整保留原特征图信息,再将学习到的每个通道的权重作用于原特征图中;
[0018]所述压缩单元使用自适应平均池化将大小为H
×
W
×
C特征图f的压缩成1
×1×
C,特征图的空间信息被压缩在通道域中:
[0019][0020]其中,z
c
表示被压缩的特征图空间信息,F
sq
表示Squeeze操作,f
c
(c,h,l)表示特征图在空间(h,l)处的值,H和L分别表示特征图在行和列方向上的维度大小;
[0021]所述激发单元由两个全连接层组成,用于获取通道相关的依赖关系:
[0022]s=F
ex
(z
c
)=σ[D2δ(D1z
c
)][0023]其中,F
ex
表示Excitation操作,D1,D2分别为降维和升维的全连接层,δ表示ReLU函数,σ表示sigmoid函数。
[0024]进一步地,步骤S2中,所述特征金字塔FPN模块将残差本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于PSENet区域分割的列车车厢号定位方法,其特征在于,所述列车车厢号定位方法包括以下步骤:S1,利用位于铁路两侧的视频监控设备对包含车厢号的货车列车的视频图像进行采集,对采集的车厢图像做预处理,对车厢图像中的车厢号区域做标签后,生成车厢样本图像,并构建样本数据集;S2,构建列车车厢号定位模型,所述列车车厢号定位模型包括残差网络模块、特征金字塔FPN模块、自底向上路径增强模块和渐进尺度扩展模块;具体地,所述残差网络模块对导入的车厢图像进行多尺度特征提取,将提取的不同尺度特征图输出至特征金字塔FPN模块,由特征金字塔FPN模块将不同尺度特征图从深层网络通过上采样的方式与浅层网络进行初次融合,得到不同尺度的初次融合特征图;所述自底向上路径增强模块将特征金字塔FPN模块输出的初次融合特征图从浅层网络通过下采样的方式与深层网络融合得到不同尺度的二次融合特征图,再将不同尺度的二次融合特征图合并成单张特征图;所述渐进尺度扩展模块利用广度优先搜索算法从文本核分割图的最小尺度到最大尺度进行文本区域的尺度扩展,获得最终的文本检测结果;S3,采用样本数据集对列车车厢号定位模型进行训练,利用训练完成的列车车厢号定位模型对待处理的车厢图像进行车厢号定位,输出定位得到的货车列车车厢号。2.根据权利要求1所述的基于PSENet区域分割的列车车厢号定位方法,其特征在于,步骤S1中,对采集的车厢图像做预处理的过程包括以下步骤:从采集的货车列车的视频中提取出全部单帧图像,从中筛选出所有包括车厢号的车厢图像,对筛选出的车厢图像随机进行翻转、裁剪和旋转处理,将处理后的车厢图像尺寸进行标准化,再对标准化后的图像中的车厢号区域打标签。3.根据权利要求1所述的基于PSENet区域分割的列车车厢号定位方法,其特征在于,步骤S2中,所述残差网络模块的主体结构采用ResNet50网络,包括依次连接的五个卷积层,除第一层卷积层之外,其他四层卷积层之后均连接有引入通道注意力机制的SE模块;并且第一层卷积层的卷积核大小为3
×
3;四个SE模块分别输出不同尺度特征图{f2,f3,f4,f5}。4.根据权利要求3所述的基于PSENet区域分割的列车车厢号定位方法,其特征在于,所述SE模块包括两个分支,其中一个分支包括相互连接的压缩单元和激发单元,用来学习每个通道的权重,另一个分支完整保留原特征图信息,再将学习到的每个通道的权重作用于原特征图中;所述压缩单元使用自适应平均池化将大小为H
×
W
×
特征图f压缩成1
×1×
C,特征图的空间信息被压缩在通道域中:其中,z
c
表示被压缩的特征图空间信息,F
sq
表示Squeeze操作,f
c
(c,h,l)表示特征图在空间(h,l)处的值,H和L分别表示特征图在行和列方向上的维度大小;所述激发单元由两个全连接层组成,用于获取通道相关的依赖关系:s=F
ex
(z
c
)=σ[D2δ(D1z
c
)]其中,F
ex
表示Excitation操作,D1,D2分别为降维和升维的全连接层,δ表示ReLU函数,σ
表示sigmoid函数。5.根...

【专利技术属性】
技术研发人员:喻春雨范沐阳陈刚
申请(专利权)人:南京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1