铁路列车加速缓解风缸定位的图像识别方法及系统技术方案

技术编号:28376033 阅读:13 留言:0更新日期:2021-05-08 00:03
本发明专利技术公开了一种铁路列车加速缓解风缸定位的图像识别方法及系统,解决了现有人工检测效率低稳定性差的技术问题,属于图像识别技术领域,其中,该方法包括:构建加速缓解风缸的样本数据集;利用样本数据集对改进的SSD网络进行训练,得到加速缓解风缸定位模型,其中,改进的SSD模型的结构为:resnet50作为主干网络,删除顶层的BN层、池化层和分类输出层,额外增加两层卷积层,卷积核大小为3*3,步长为2;采集实际图像,输入至加速缓解风缸定位模型中,获得加速缓解风缸位置信息。该方法一方面相较于人工检修可提高检测效率和稳定性,另一方面可以提高检测的准确率。

【技术实现步骤摘要】
铁路列车加速缓解风缸定位的图像识别方法及系统
本专利技术涉及图像识别
,特别涉及一种铁路列车加速缓解风缸定位的图像识别方法及系统。
技术介绍
目前对加速缓解风缸的定位还是以人工查看图像或实地检查为主,这种方式效率低下,容易造成故障的遗漏,进而容易造成重大铁路交通事故。因此,亟待一种图像自动识别方式对加速缓解风缸进行故障检测,但由于不同车型的加速缓解风缸在车体上的位置不同,因此,需要一种图像自动识别的方式首先对加速缓解风缸的位置进行定位,然后才能进一步进行后续的故障检测。
技术实现思路
本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本专利技术的一个目的在于提出一种铁路列车加速缓解风缸定位的图像识别方法,该方法提高了检测效率、稳定性以及准确率。本专利技术的另一个目的在于提出一种铁路列车加速缓解风缸定位的图像识别系统。为达到上述目的,本专利技术一方面实施例提出了铁路列车加速缓解风缸定位的图像识别方法,包括以下步骤:步骤S1,构建加速缓解风缸的样本数据集;步骤S2,利用样本数据集对改进的SSD网络进行训练,得到加速缓解风缸定位模型,其中,改进的SSD模型的结构为:resnet50作为主干网络,删除顶层的BN层、池化层和分类输出层,额外增加两层卷积层,卷积核大小为3*3,步长为2;步骤S3,采集实际图像,输入至加速缓解风缸定位模型中,获得加速缓解风缸位置信息。本专利技术实施例的铁路列车加速缓解风缸定位的图像识别方法,采用图像自动识别的方式定位加速缓解风缸的位置,一方面相较于人工检修可提高检测效率和稳定性,另一方面随着深度学习和人工智能技术的不断成熟,可以提高检测的准确率,同时,通过改进SSD算法匹配策略,每个真实边框groundtruthbox会得到等数量的预测边框anchor,解决了正负样本不均衡的问题,加快了训练过程中损失函数的收敛,也提升了算法对于较小的加速缓解风缸的定位的准确率。另外,根据本专利技术上述实施例的铁路列车加速缓解风缸定位的图像识别方法还可以具有以下附加的技术特征:进一步地,在本专利技术的一个实施例中,步骤S1具体包括:获取多个加速缓解风缸的粗定位图像作为原始图像集;标记原始图像集中加速缓解风缸所在区域,作为标记信息集,其中,原始图像集与标记信息集一一对应;利用扩增算法对原始图像集和标记信息集进行扩增,得到样本数据集。进一步地,在本专利技术的一个实施例中,步骤S2具体包括:将样本数据集输入改进的SSD网络中,得到5层特征图;在5层特征图上分别构建两个大小为3*3的卷积核作为回归预测器和多分类预测器;利用回归预测器和多分类预测器在预设特征图上对每个位置的anchor进行预测,利用默认框生成规则,为每个特征图生成默认框,得到固定数目的输出预测,并采用非极大值抑制NMS和top_k阈值对输出预测进行筛选,得到输出框;通过随机采样或困难采样方法取样输出框,以进行损失函数计算,并计算损失函数的梯度值,根据梯度值对参数进行更新,迭代训练,直至达到最大迭代次数,得到加速缓解风缸定位模型。进一步地,在本专利技术的一个实施例中,将每个真实边框groundtruthbox对应的IOU进行降序,然后取前M个IOU对应的预测边框anchor作为样本,每个预测边框anchor有且仅有一次与真实边框groundtruthbox匹配的机会,M为正整数,IOU为预测边框与真实边框的交并比,其中,改进的SSD网络的匹配机制输入为:每个预测边框anchor与真实边框对应的IOU集合,参数N;改进的SSD网络的匹配机制输出为:每个预测边框anchor所匹配得到的真实边框的索引。进一步地,在本专利技术的一个实施例中,步骤S3具体包括:采集实际图像;将实际图像缩放为尺寸1600*256的图像,并将缩放后的图像输入至加速缓解风缸定位模型中进行加速缓解风缸的定位检测,对输出结果进行阈值判断,若位置框的长宽比大于0.8,小于1.2,则认为定位到的缸为加速缓解风缸,进一步输出加速缓解风缸位置信息。为达到上述目的,本专利技术另一方面实施例提出了铁路列车加速缓解风缸定位的图像识别系统,包括:构建模块,用于构建加速缓解风缸的样本数据集;训练模块,用于利用样本数据集对改进的SSD网络进行训练,得到加速缓解风缸定位模型,其中,改进的SSD模型的结构为:resnet50作为主干网络,删除顶层的BN层、池化层和分类输出层,额外增加两层卷积层,卷积核大小为3*3,步长为2;获取模块,用于采集实际图像,输入至加速缓解风缸定位模型中,获得加速缓解风缸位置信息。本专利技术实施例的铁路列车加速缓解风缸定位的图像识别系统,采用图像自动识别的方式定位加速缓解风缸的位置,一方面相较于人工检修可提高检测效率和稳定性,另一方面随着深度学习和人工智能技术的不断成熟,可以提高检测的准确率,同时,通过改进SSD算法匹配策略,每个真实边框groundtruthbox会得到等数量的预测边框anchor,解决了正负样本不均衡的问题,加快了训练过程中损失函数的收敛,也提升了算法对于较小的加速缓解风缸的定位的准确率。另外,根据本专利技术上述实施例的铁路列车加速缓解风缸定位的图像识别系统还可以具有以下附加的技术特征:进一步地,在本专利技术的一个实施例中,构建模块包括:获取单元,用于获取多个加速缓解风缸的粗定位图像作为原始图像集;标记单元,用于标记原始图像集中加速缓解风缸所在区域,作为标记信息集,其中,原始图像集与标记信息集一一对应;扩增单元,用于利用扩增算法对原始图像集和标记信息集进行扩增,得到样本数据集。进一步地,在本专利技术的一个实施例中,训练模块包括:输入单元,用于将样本数据集输入改进的SSD网络中,得到5层特征图;构建单元,用于在5层特征图上分别构建两个大小为3*3的卷积核作为回归预测器和多分类预测器;预测和筛选单元,用于利用回归预测器和多分类预测器在预设特征图上对每个位置的预测边框anchor进行预测,利用默认框生成规则,为每个特征图生成默认框,得到固定数目的输出预测,并采用非极大值抑制NMS和top_k阈值对输出预测进行筛选,得到输出框;迭代单元,用于通过随机采样或困难采样方法取样输出框,以进行损失函数计算,并计算损失函数的梯度值,根据梯度值对参数进行更新,迭代训练,直至达到最大迭代次数,得到加速缓解风缸定位模型。进一步地,在本专利技术的一个实施例中,改进的SSD网络中的算法匹配策略为:将每个真实边框groundtruthbox对应的IOU进行降序,然后取前M个IOU对应的预测边框anchor作为样本,每个预测边框anchor有且仅有一次与真实边框groundtruthbox匹配的机会,M为正整数,IOU为预测边框与真实边框的交并比,其中,改进的SSD网络的匹配机制输入为:每个预测边框anchor与真实边框groundtruthbox对应的IOU集合,参数N;改进的SSD网络的匹配机制输出为:每个预测边框anchor所匹配得到的真实边框groundtruthbox的索引。进一步地,在本专利技术的一个实施例中,获取模块包括:采集本文档来自技高网...

【技术保护点】
1.一种铁路列车加速缓解风缸定位的图像识别方法,其特征在于,包括以下步骤:/n步骤S1,构建加速缓解风缸的样本数据集;/n步骤S2,利用所述样本数据集对改进的SSD网络进行训练,得到加速缓解风缸定位模型,其中,所述改进的SSD模型的结构为:resnet50作为主干网络,删除顶层的BN层、池化层和分类输出层,额外增加两层卷积层,卷积核大小为3*3,步长为2;/n步骤S3,采集实际图像,输入至所述加速缓解风缸定位模型中,获得加速缓解风缸位置信息。/n

【技术特征摘要】
1.一种铁路列车加速缓解风缸定位的图像识别方法,其特征在于,包括以下步骤:
步骤S1,构建加速缓解风缸的样本数据集;
步骤S2,利用所述样本数据集对改进的SSD网络进行训练,得到加速缓解风缸定位模型,其中,所述改进的SSD模型的结构为:resnet50作为主干网络,删除顶层的BN层、池化层和分类输出层,额外增加两层卷积层,卷积核大小为3*3,步长为2;
步骤S3,采集实际图像,输入至所述加速缓解风缸定位模型中,获得加速缓解风缸位置信息。


2.根据权利要求1所述的铁路列车加速缓解风缸定位的图像识别方法,其特征在于,所述步骤S1具体包括:
获取多个加速缓解风缸的粗定位图像作为原始图像集;
标记所述原始图像集中所述加速缓解风缸所在区域,作为标记信息集,其中,所述原始图像集与所述标记信息集一一对应;
利用扩增算法对所述原始图像集和所述标记信息集进行扩增,得到所述样本数据集。


3.根据权利要求1所述的铁路列车加速缓解风缸定位的图像识别方法,其特征在于,所述步骤S2具体包括:
将所述样本数据集输入所述改进的SSD网络中,得到5层特征图;
在所述5层特征图上分别构建两个大小为3*3的卷积核作为回归预测器和多分类预测器;
利用所述回归预测器和所述多分类预测器在预设特征图上对每个位置的预测边框anchor进行预测,利用默认框生成规则,为每个特征图生成默认框,得到固定数目的输出预测,并采用非极大值抑制NMS和top_k阈值对所述输出预测进行筛选,得到输出框;
通过随机采样或困难采样方法取样所述输出框,以进行损失函数计算,并计算损失函数的梯度值,根据所述梯度值对参数进行更新,迭代训练,直至达到最大迭代次数,得到所述加速缓解风缸定位模型。


4.根据权利要求3所述的铁路列车加速缓解风缸定位的图像识别方法,其特征在于,所述改进的SSD网络中的算法匹配策略为:将每个真实边框groundtruthbox对应的IOU进行降序,然后取前M个IOU对应的预测边框anchor作为样本,每个预测边框anchor有且仅有一次与真实边框groundtruthbox匹配的机会,M为正整数,IOU为预测边框与真实边框的交并比,其中,所述改进的SSD网络的匹配机制输入为:每个预测边框anchor与真实边框groundtruthbox对应的IOU集合,参数N;所述改进的SSD网络的匹配机制输出为:每个预测边框anchor所匹配得到的真实边框groundtruthbox的索引。


5.根据权利要求1所述的铁路列车加速缓解风缸定位的图像识别方法,其特征在于,所述步骤S3具体包括:
采集所述实际图像;
将所述实际图像缩放为尺寸1600*256的图像,并将缩放后的图像输入至所述加速缓解风缸定位模型中进行加速缓解风缸的定位检测,对输出结果进行阈值判断,若位置框的长宽比大于0.8,小于1.2,则认为定位到的缸为加速缓解风缸,进一步输出所述加速缓解风缸位置信息。


6.一种铁路列车加速缓解风缸定位的图像识别系统,其特征...

【专利技术属性】
技术研发人员:于婷
申请(专利权)人:哈尔滨市科佳通用机电股份有限公司
类型:发明
国别省市:黑龙江;23

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1