一种基于注意力机制和关系网络的自动驾驶图像识别方法技术

技术编号:28463359 阅读:27 留言:0更新日期:2021-05-15 21:28
本发明专利技术提出了一种基于注意力机制和关系网络的自动驾驶图像识别方法,首先,使用卷积神经网络提取自动驾驶图像特征;接着,通过注意力机制计算注意力特征;然后,利用关系网络生成图像中对象之间的关系结果;最后通过损失函数训练网络,并用训练好的模型进行自动驾驶场景的关系判断。本发明专利技术运用关系网络识别自动驾驶图像,能显式表达图像中对象之间的关系,从而提高识别和推理的准确性;此外,引入了新的注意力机制,降低了模型在处理复杂自动驾驶场景时的计算复杂度,提高了模型有效性和学习效率。效率。效率。

【技术实现步骤摘要】
一种基于注意力机制和关系网络的自动驾驶图像识别方法


[0001]本专利技术属于人工智能、自动驾驶领域,具体涉及一种基于注意力机制和关系网络的自动驾驶图像识别方法。

技术介绍

[0002]深度学习是机器学习领域中的一个新的研究方向,被引入机器学习,使其更接近人工智能。最终目的是让机器能够像人类一样,具有分析学习能力,能够识别文字、声音和图像等数据。
[0003]卷积神经网络可以说是传统神经网络的改进,沿用了层级网络的结构,但在层的功能和形式上进行了改变。处理原始数据时,将输入进行卷积计算、非线性函数激活、池化操作、全连接操作等一系列的操作,将特征信息从原始数据中逐步提取出来。以上过程为“前馈运算”。在卷积网络的最后一层,输出目标函数,通过设计损失函数,计算真实值和预测值之间的误差,之后通过反向传播算法,将误差先前逐层反馈,更新参数,并再次向前反馈,多次重复之后,使网络模型达到收敛的效果,达到模型训练的目的。
[0004]目前基于人工神经网络的图像识别技术已经比较成熟,甚至可以将人眼不易识别的物体在图像中标注出来,可以认为在某些方面本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于注意力机制和关系网络的自动驾驶图像识别方法,其特征在于,包括以下步骤:(1)提取自动驾驶图像特征并进行预处理;(2)通过注意力机制计算自动驾驶图像注意力特征;(3)利用关系网络构造注意力向量关系对,计算生成关系结果B;(4)将步骤(3)生成的最终关系B与目标关系向量O计算欧氏距离作为损失函数值,最后再反馈回整个神经网络,反复进行训练,直到模型收敛;(5)用训练好的模型进行自动驾驶场景关系判断。2.根据权利要求1所述的基于注意力机制和关系网络的自动驾驶图像识别方法,其特征在于,所述步骤(1)包括以下步骤:(11)自动驾驶数据集由一系列图像组成,设任一图像为I∈R
W
×
H
×
C
,其中,W为像素宽度,H为像素高度,C为通道数;对于每一幅图像,标注出其中的对象,并定义对象之间的关系,然后将所有对象与当前自动驾驶车辆以及它们两两之间的关系向量作为训练目标O;(12)将图像I输入卷积神经网络,进行4次卷积操作,得到特征映射F,F∈R
c
×
d
×
d
,其中,c是通道特征维度,d为空间特征的宽度及高度,卷积核尺寸为5
×5×
24。3.根据权利要求1所述的基于注意力机制和关系网络的自动驾驶图像识别方法,其特征在于,所述步骤(2)包括以下步骤:(21)对于特征映射F,在通道维度上使用最大池化层和平均池化层,聚化特征F的空间信息,产生最大池化特征MP∈R
d
×
d
和平均池化特征AP∈R
d
×
d
;(22)对MP和AP同时进行单层卷积操作,卷积核尺寸为1
×
1,得到压缩特征矩阵N=Conv(MP,AP),N∈R
d
×
d
;(23)将压缩...

【专利技术属性】
技术研发人员:吴家皋惠志磊耿辰渠啸
申请(专利权)人:南京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1