当前位置: 首页 > 专利查询>吉林大学专利>正文

一种基于深度学习的直线目标体识别方法技术

技术编号:38247536 阅读:11 留言:0更新日期:2023-07-25 18:07
本发明专利技术提供了一种基于深度学习的直线目标体识别方法,包括以下步骤:S1:对图像、图片或视频构建数据集;S2:以车道线检测算法为基本框架,参照车道线检测算法中的网络结构和损失函数,搭建神经网络;S3:使用数据集对神经网络进行训练;S4:对训练结果进行后处理,将结果转化进行位置识别;S5:对训练好的网络进行评估;计算预测成功的比例作为准确率。本发明专利技术中,鉴于2D图像中的直线目标体物理特点,以及其在图像中的位置特点,选择深度学习的方法,使用卷积神经网络进行识别;参考车道线检测算法,以ResNet作为特征提取网络,训练时加入用于特征增强的网络层,提高特征提取效果,进而提高识别效果。识别效果。识别效果。

【技术实现步骤摘要】
一种基于深度学习的直线目标体识别方法


[0001]本专利技术属于计算机视觉、目标检测
,涉及一种基于深度学习的直线目标体识别方法。

技术介绍

[0002]目前,利用神经网络进行目标检测主流的方法是采用卷积神经网络,基于卷积网络搭建的许多网络结构已经在目标检测等诸多领域取得了很好的效果及广泛的应用。
[0003]残差网络(ResNet)是一种卷积神经网络,其最初提出是为了解决网络深度加深反而使模型结果变差的情况。残差网络通过利用残差结构,可以很好的解决这一问题。残差网络有效的增加了网络深度,提升了准确率,是目前为止应用最为广泛的卷积神经网络之一。
[0004]针对于2D目标检测,在现有的检测算法中,基于图像的方法无法解决复杂的场景问题,特别是模糊,遮挡等问题;同时,用卷积网络提取特征后直接进行预测,特征提取的效果不是很好,使最终预测效果也不是很好。
[0005]本专利技术参考类比Qin,ZequnandWang,HuanyuandLi,Xi提出的车道线检测算法;我们参考了相关研究更多的车道线检测算法;车道线可以看作是直线目标体的一种,并认为车道线检测算法可以推广到一般性问题上。

技术实现思路

[0006]本专利技术的目的是针对现有的技术存在上述问题,提出了一种基于深度学习的直线目标体识别方法。
[0007]本专利技术的目的可通过下列技术方案来实现:
[0008]一种基于深度学习的直线目标体识别方法,包括以下步骤:
[0009]S1:对图像、图片或视频构建数据集;
[0010]S2:以车道线检测算法为基本框架,参照车道线检测算法中的网络结构和损失函数,搭建神经网络;
[0011]S3:使用数据集对神经网络进行训练;
[0012]S4:对训练结果进行后处理,将结果转化进行位置识别;
[0013]S5:对训练好的网络进行评估;计算预测成功的比例作为准确率。
[0014]进一步的,在S5中,阈值为10像素。
[0015]进一步的,所述评估结果的判定方法为:在每一个水平行上,预测点与真实标记点的距离值小于阈值,则判定预测成功;反之,判定预测失败。
[0016]进一步的,包括输入层;神经网络包括特征提取层、特征增强层和分类预测层;
[0017]输入层,用于获取图片、图像及视频;
[0018]特征提取层,用于图片特征提取,并在18层残差网络的基础上,对网络后三层的输出进行提取,构建网络层进行特征增强;
[0019]特征增强层,为包括卷积、归一化及Relu的conv_bn_relu块,以对残差网络的三个
输出,分别构建由多个conv_bn_relu块组成的网络,最后对三个结果进行合并,对合并后的结果再次进行多个conv_bn_relu块操作以及卷积操作,形成特征增强网络层,用于图片特征增强处理;
[0020]分类预测层,包括全连接层,用于生成预测图。
[0021]进一步的,所述特征提取层包括整体网络的损失函数,损失函数包括整体分类损失、整体预测损失、分割损失以及特征增强层损失,上述损失均采用交叉熵损失函数。
[0022]进一步的,对于图像中的直线目标体,利用神经网络将识别任务视为语义分割任务。
[0023]与现有技术相比,本专利技术具有以下优点:鉴于2D图像中的直线目标体物理特点,以及其在图像中的位置特点,选择深度学习的方法,使用卷积神经网络进行识别;参考车道线检测算法,以ResNet作为特征提取网络,训练时加入用于特征增强的网络层,提高特征提取效果,进而提高识别效果。
附图说明
[0024]图1是本专利技术的系统示意图。
[0025]图2是本专利技术中实施例2训练分类误差示意图。
[0026]图3是本专利技术中实施例2训练特征增强层训练误差示意图。
[0027]图4是本专利技术中实施例2验证集均交并比示意图。
[0028]图5是本专利技术中实施例2top3准确率示意图。
具体实施方式
[0029]以下是本专利技术的具体实施例并结合附图,对本专利技术的技术方案作进一步的描述,但本专利技术并不限于这些实施例。
[0030]如图1所示,本实施例提供一种基于深度学习的直线目标体识别方法,包括以下步骤:
[0031]S1:对图像、图片或视频构建数据集;
[0032]S2:以车道线检测算法为基本框架,参照车道线检测算法中的网络结构和损失函数,搭建神经网络;
[0033]S3:使用数据集对神经网络进行训练;
[0034]S4:对训练结果进行后处理,将结果转化进行位置识别;
[0035]S5:对训练好的网络进行评估;计算预测成功的比例作为准确率。
[0036]所述评估结果的判定方法为:在每一个水平行上,预测点与真实标记点的距离值小于阈值,则判定预测成功;反之,判定预测失败。
[0037]当阈值为10像素时,模型准确率达到95.82%。
[0038]在一个可选实施例中,包括输入层;神经网络包括特征提取层、特征增强层和分类预测层;
[0039]输入层,用于获取图片、图像及视频;
[0040]特征提取层,用于图片特征提取,并在18层残差网络的基础上,对网络后三层的输出进行提取,构建网络层进行特征增强;
[0041]特征增强层,为包括卷积、归一化及Relu的conv_bn_relu块,以对残差网络的三个输出,分别构建由多个conv_bn_relu块组成的网络,最后对三个结果进行合并,对合并后的结果再次进行多个conv_bn_relu块操作以及卷积操作,形成特征增强网络层,用于图片特征增强处理;
[0042]分类预测层,包括全连接层,用于生成预测图。
[0043]需要说明的是,神经网络训练过程中,在18层ResNet网络基础上,对网络后三层的输出进行提取,构建网络层进行特征增强。对于特征增强层,构建了一个由卷积,归一化,Relu组成的conv_bn_relu块,对于Resnet的三个输出,分别构建由多个conv_bn_relu块组成的网络,最后对三个结果进行合并,对合并后的结果再次进行多个conv_bn_relu块操作以及卷积操作。
[0044]其中,特征增强层只在训练过程中使用,在验证测试时并不使用。
[0045]所述特征提取层包括整体网络的损失函数,损失函数包括整体分类损失、整体预测损失、分割损失以及特征增强层损失,上述损失均采用交叉熵损失函数。
[0046]对于图像中的直线目标体,利用神经网络将识别任务视为语义分割任务。
[0047]需要说明的是,鉴于直线目标体的物理特点以及在图像中的位置特点,参考了相关研究更多的车道线检测算法。直线目标体检测和车道线检测有着很强的相似性,因此认为参考车道线检测算法并应用到直线目标体检测上也能取得良好的效果。
[0048]综上,本专利技术中,鉴于2D图像中的直线目标体物理特点,以及其在图像中的位置特点,选择本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的直线目标体识别方法,其特征在于,包括以下步骤:S1:对图像、图片或视频构建数据集;S2:以车道线检测算法为基本框架,参照车道线检测算法中的网络结构和损失函数,搭建神经网络;S3:使用数据集对神经网络进行训练;S4:对训练结果进行后处理,将结果转化进行位置识别;S5:对训练好的网络进行评估;计算预测成功的比例作为准确率。2.根据权利要求1所述的一种基于深度学习的直线目标体识别方法,其特征在于,在S5中,阈值为10像素。3.根据权利要求1所述的一种基于深度学习的直线目标体识别方法,其特征在于,所述评估结果的判定方法为:在每一个水平行上,预测点与真实标记点的距离值小于阈值,则判定预测成功;反之,判定预测失败。4.根据权利要求1所述的一种基于深度学习的直线目标体识别方法,其特征在于,包括输入层;神经网络包括特征提取层、特征增强层和分类预测层;输入层,用于获取图片、图像及视频...

【专利技术属性】
技术研发人员:贾继伟孟祥全詹中涵
申请(专利权)人:吉林大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1