自动驾驶图像的分割方法、装置、设备及存储介质制造方法及图纸

技术编号：38824760 阅读：11 留言：0更新日期：2023-09-15 20:04

本发明专利技术涉及计算机视觉技术领域，公开了一种自动驾驶图像的分割方法、装置、设备及存储介质。该方法包括：获取自动驾驶图像，并将自动驾驶图像输入至预训练的残差神经网络模型，以获取初始特征图；将初始特征图输入至预训练的通道注意力网络模型，以获取特征向量；将初始特征图与特征向量进行相乘，以获取加权特征图，并根据加权特征图将自动驾驶图像分割为多个子图像。本实施例的技术方案，通过采用残差神经网络模型进行特征图提取，并采用通道注意力网络模型对特征图进行加权处理，可以提升对图像中不同语义信息的边缘分割准确度，可以降低图像分割的计算量。低图像分割的计算量。低图像分割的计算量。

全部详细技术资料下载

【技术实现步骤摘要】
自动驾驶图像的分割方法、装置、设备及存储介质

[0001]本专利技术涉及计算机视觉
，尤其涉及一种自动驾驶图像的分割方法、装置、设备及存储介质。

技术介绍

[0002]随着自动驾驶技术的快速发展，对自动驾驶技术的精确性、稳定性以及智能性提出了更高的要求。目前自动驾驶车辆搭载了各式各样的传感器，例如视觉摄像头、激光雷达等，视觉摄像头因为本身成本较低，已经成为自动驾驶量产车型中广泛使用的传感器之一。视觉摄像头由于经常会受到逆光、昏暗等客观条件的影响，会影响原始图像的后期处理效果。要想实现自动驾驶系统的高精度定位和高稳定性，除了使用高精度的传感器之外，对于原始图像的精确分割也是尤为重要的工作之一。
[0003]目前，现有的图像分割方法，主要包括基于阈值的分割方法、基于边缘的分割方法和基于区域的分割方法三类。然而，对于基于阈值的分割方法，其无法适用灰度值比较复杂的图像；对于基于边缘的分割方法，通常由于边缘检测不够准确影响图像分割效果；对于基于区域的分割方法，存在计算量较大和耗时较长的问题。

技术实现思路

[0004]本专利技术提供了一种自动驾驶图像的分割方法、装置、设备及存储介质，可以提升对图像中不同语义信息的边缘分割准确度，可以降低图像分割的计算量。
[0005]根据本专利技术的一方面，提供了一种自动驾驶图像的分割方法，包括：
[0006]获取自动驾驶图像，并将所述自动驾驶图像输入至预训练的残差神经网络模型，并获取所述残差神经网络模型输出的所述自动驾驶图像对应的初始特征图；r/>[0007]将所述初始特征图输入至预训练的通道注意力网络模型，并获取所述通道注意力网络模型输出的所述初始特征图对应的特征向量；其中，所述通道注意力网络模型基于全局平均池化算法和全局最大池化算法建立；
[0008]将所述初始特征图与所述特征向量进行相乘，以获取加权特征图，并根据所述加权特征图将所述自动驾驶图像分割为多个子图像。
[0009]根据本专利技术的另一方面，提供了一种自动驾驶图像的分割装置，包括：
[0010]初始特征图获取模块，用于获取自动驾驶图像，并将所述自动驾驶图像输入至预训练的残差神经网络模型，并获取所述残差神经网络模型输出的所述自动驾驶图像对应的初始特征图；
[0011]特征向量获取模块，用于将所述初始特征图输入至预训练的通道注意力网络模型，并获取所述通道注意力网络模型输出的所述初始特征图对应的特征向量；其中，所述通道注意力网络模型基于全局平均池化算法和全局最大池化算法建立；
[0012]加权特征图获取模块，用于将所述初始特征图与所述特征向量进行相乘，以获取加权特征图，并根据所述加权特征图将所述自动驾驶图像分割为多个子图像。
[0013]根据本专利技术的另一方面，提供了一种电子设备，所述电子设备包括：
[0014]至少一个处理器；以及
[0015]与所述至少一个处理器通信连接的存储器；其中，
[0016]所述存储器存储有可被所述至少一个处理器执行的计算机程序，所述计算机程序被所述至少一个处理器执行，以使所述至少一个处理器能够执行本专利技术任一实施例所述的自动驾驶图像的分割方法。
[0017]根据本专利技术的另一方面，提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机指令，所述计算机指令用于使处理器执行时实现本专利技术任一实施例所述的自动驾驶图像的分割方法。
[0018]本专利技术实施例的技术方案，通过获取自动驾驶图像，并将自动驾驶图像输入至预训练的残差神经网络模型，并获取残差神经网络模型输出的自动驾驶图像对应的初始特征图；然后，将初始特征图输入至预训练的通道注意力网络模型，并获取通道注意力网络模型输出的初始特征图对应的特征向量；最后，将初始特征图与特征向量进行相乘，以获取加权特征图，并根据加权特征图将自动驾驶图像分割为多个子图像；通过采用残差神经网络模型进行特征图提取，并采用通道注意力网络模型对特征图进行加权处理，可以提升对图像中不同语义信息的边缘分割准确度，可以降低图像分割的计算量。
[0019]应当理解，本部分所描述的内容并非旨在标识本专利技术的实施例的关键或重要特征，也不用于限制本专利技术的范围。本专利技术的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0020]为了更清楚地说明本专利技术实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本专利技术的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
[0021]图1A是根据本专利技术实施例一提供的一种自动驾驶图像的分割方法的流程图；
[0022]图1B是根据本专利技术实施例一提供的残差块结构示意图；
[0023]图1C是根据本专利技术实施例一提供的通道注意力网络模型的结构示意图；
[0024]图1D是是根据本专利技术实施例一提供的另一种自动驾驶图像的分割方法的流程图；
[0025]图2是根据本专利技术实施例二提供的一种自动驾驶图像的分割装置的结构示意图；
[0026]图3是实现本专利技术实施例的自动驾驶图像的分割方法的电子设备的结构示意图。
具体实施方式
[0027]为了使本
的人员更好地理解本专利技术方案，下面将结合本专利技术实施例中的附图，对本专利技术实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本专利技术一部分的实施例，而不是全部的实施例。基于本专利技术中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本专利技术保护的范围。
[0028]需要说明的是，本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“目标”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解
这样使用的数据在适当情况下可以互换，以便这里描述的本专利技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0029]实施例一
[0030]图1A为本专利技术实施例一提供了一种自动驾驶图像的分割方法的流程图，本实施例可适用于对自动驾驶图像中不同语义信息进行分割的情况，该方法可以由自动驾驶图像的分割装置来执行，该自动驾驶图像的分割装置可以采用硬件和/或软件的形式实现，典型的，该自动驾驶图像的分割装置可配置于电子设备中，例如，计算机设备、服务器或者车机设备等。如图1A所示，该方法包括：
[0031]S110、获取自动驾驶图像，并将所述自动驾驶图像输入至预训练的残差神经网络模型，并获取所述残差神经网络模型输出的所述自动驾驶图像对应的初始特征图。
[0032]在本实施例中，可以通过车辆上部署的视觉摄像头，在车辆行驶过本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种自动驾驶图像的分割方法，其特征在于，包括：获取自动驾驶图像，并将所述自动驾驶图像输入至预训练的残差神经网络模型，并获取所述残差神经网络模型输出的所述自动驾驶图像对应的初始特征图；将所述初始特征图输入至预训练的通道注意力网络模型，并获取所述通道注意力网络模型输出的所述初始特征图对应的特征向量；其中，所述通道注意力网络模型基于全局平均池化算法和全局最大池化算法建立；将所述初始特征图与所述特征向量进行相乘，以获取加权特征图，并根据所述加权特征图将所述自动驾驶图像分割为多个子图像。2.根据权利要求1所述的方法，其特征在于，所述残差神经网络模型包括预设数量的残差块，所述残差块包括第一卷积层和第二卷积层，所述第一卷积层和第二卷积层的卷积核尺寸为1
×
1。3.根据权利要求2所述的方法，其特征在于，将所述自动驾驶图像输入至预训练的残差神经网络模型，并获取所述残差神经网络模型输出的所述自动驾驶图像对应的初始特征图，包括：将当前图像特征输入至当前残差块的第一卷积层，以获取第一卷积特征，并通过预设激活函数对所述第一卷积特征进行非线性特征映射，以获取中间特征；将所述中间特征输入至所述当前残差块的第二卷积层，以获取第二卷积特征，并将所述第二卷积特征与所述当前图像特征进行相加，以获取目标特征；通过预设激活函数对所述目标特征进行非线性特征映射，以获取所述当前残差块输出的当前特征图。4.根据权利要求3所述的方法，其特征在于，将所述自动驾驶图像输入至预训练的残差神经网络模型，并获取所述残差神经网络模型输出的所述自动驾驶图像对应的初始特征图，包括：通过所述当前残差块根据公式y＝σ(F(x,A)+x)获取当前特征图y，其中，σ(
·
)表示预设激活函数，F(
·
)表示残差函数，x表示当前图像特征，A表示卷积层权重参数。5.根据权利要求1所述的方法，其特征在于，将所述初始特征图输入至预训练的通道注意力网络模型，并获取所述通道注意力网络模型输出的所述初始特征图对应的特征向量，包括：通过全局平均池化算法对所述初始特征图进行处理，以获取第一池化向量，并通过全局最大池化算法对所述初始特征图进行处理，以获取第二池...

【专利技术属性】
技术研发人员：邢春上，张松林，陈博，
申请(专利权)人：一汽南京科技开发有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人