【技术实现步骤摘要】
神经网络训练、目标对象的检测方法及装置
本公开涉及计算机
,具体而言,涉及一种神经网络训练、目标对象的检测方法、装置、计算机设备及存储介质。
技术介绍
目标检测是指识别图像中目标物体位置的技术,其广泛的应用在自动驾驶、人脸识别等领域。相关目标检测技术中,需要借助确定的卷积核对图像进行卷积,提取图像中的特征,然后根据提取的特征,对图像中的目标物体的位置进行识别。然而由于图像中不同目标物体在图像中的尺寸相差可能较大,这种方式在对图像进行卷积时,可能会受到目标物体尺寸大小的影响,如对于较小的目标物体,在对其进行卷积时可能会将该目标物体所在的背景区域一起卷积,进而导致提取的目标物体的特征不准确,从而影响目标物体的位置识别精度。
技术实现思路
本公开实施例至少提供一种神经网络训练、目标对象的检测方案。第一方面,本公开实施例提供了一种神经网络训练方法,包括:利用待训练的神经网络对样本图像对应的深度图像进行特征提取,得到至少一个深度特征图,所述样本图像中包括目标对象的标注结果;基于每个深度 ...
【技术保护点】
1.一种神经网络训练方法,其特征在于,包括:/n利用待训练的神经网络对样本图像对应的深度图像进行特征提取,得到至少一个深度特征图,所述样本图像中包括目标对象的标注结果;/n基于每个深度特征图,确定该深度特征图对应的卷积矩阵;/n利用所述神经网络根据各个深度特征图对应的卷积矩阵对所述样本图像进行特征提取,得到所述样本图像对应的样本特征图;/n根据所述样本图像对应的样本特征图确定所述样本特征图中的每一个特征点所对应的样本图像中的多个目标检测区域分别对应的目标对象的存在概率;/n基于所述样本图像的目标对象的标注结果、所述样本特征图中的每一个特征点所对应的样本图像中的多个目标检测区 ...
【技术特征摘要】
1.一种神经网络训练方法,其特征在于,包括:
利用待训练的神经网络对样本图像对应的深度图像进行特征提取,得到至少一个深度特征图,所述样本图像中包括目标对象的标注结果;
基于每个深度特征图,确定该深度特征图对应的卷积矩阵;
利用所述神经网络根据各个深度特征图对应的卷积矩阵对所述样本图像进行特征提取,得到所述样本图像对应的样本特征图;
根据所述样本图像对应的样本特征图确定所述样本特征图中的每一个特征点所对应的样本图像中的多个目标检测区域分别对应的目标对象的存在概率;
基于所述样本图像的目标对象的标注结果、所述样本特征图中的每一个特征点所对应的样本图像中的多个目标检测区域分别对应的目标对象的存在概率、以及所述样本特征图对应的特征向量,调整所述神经网络的网络参数。
2.根据权利要求1所述的方法,其特征在于,所述基于每个深度特征图,确定该深度特征图对应的卷积矩阵,包括:
针对预设的多个偏移矩阵集合中的每个偏移矩阵集合,将该深度特征图的特征矩阵分别与该偏移矩阵集合中的多个偏移矩阵相乘,得到该深度特征图对应的多个偏移特征矩阵;其中,所述偏移矩阵集合中的偏移矩阵用于对该深度特征图进行偏移处理,同一偏移矩阵集合中的不同偏移矩阵对应的偏移处理的方向不同,不同偏移矩阵集合对应的偏移处理的偏移量不同;
基于多个偏移矩阵集合中,每个偏移矩阵集合对应的所述多个偏移特征矩阵,确定该深度特征图对应的卷积矩阵。
3.根据权利要求2所述的方法,其特征在于,所述基于多个偏移矩阵集合中,每个偏移矩阵集合对应的所述多个偏移特征矩阵,确定该深度特征图对应的卷积矩阵,包括:
针对每个偏移矩阵集合对应的所述多个偏移特征矩阵中的一个偏移特征矩阵中的每个向量位置,确定所述多个偏移特征矩阵中在该向量位置处的特征向量的平均特征向量,将得到的平均特征向量作为该偏移矩阵集合对应的中间卷积矩阵在该向量位置处的特征向量;
将多个偏移矩阵集合分别对应的所述中间卷积矩阵进行加权相加,得到所述卷积矩阵。
4.根据权利要求1所述的方法,其特征在于,所述利用待训练的神经网络对样本图像对应的深度图像进行特征提取,得到至少一个深度特征图,包括:
利用所述神经网络对所述深度图像进行N级卷积运算,得到所述深度图像的第N个深度特征图;N为大于或等于1的正整数;
所述基于每个深度特征图,确定该深度特征图对应的卷积矩阵,包括:
基于所述第N个深度特征图,确定所述第N个深度特征图对应的卷积矩阵;
所述利用所述神经网络根据各个深度特征图对应的卷积矩阵对所述样本图像进行特征提取,得到所述样本图像对应的样本特征图,包括:
利用所述神经网络对所述样本图像进行卷积运算,得到所述样本图像对应的初始特征图;
基于所述第N个深度特征图对应的卷积矩阵,对所述样本图像对应的第N个样本特征图进行特征提取,得到所述样本图像对应的第N+1个样本特征图;其中,第N个样本特征图,为基于第N-1个深度特征图对应的卷积矩阵,对第N-1个样本特征图进行特征提取得到的,第1个样本特征图为所述初始特征图。
5.根据权利要求4所述的方法,其特征在于,所述基于所述第N个深度特征图对应的卷积矩阵,对所述样本图像对应的第N个样本特征图进行特征提取,得到所述样本图像对应的第N+1个样本特征图,包括:
将第N个样本特征图在不同通道上的通道值进行至少一轮调整,得到每一轮调整后的更新样本特征图;
将每一轮调整后的更新样本特征图与所述第N个样本特征图在同一通道上的通道值相加,得到目标更新样本特征图;
将所述目标更新样本特征图对应的特征矩阵、以及所述第N个深度特征图对应的卷积矩阵中对应向量位置上的取值相乘,得到所述样本图像对应的第N+1个样本特征图。
6.根据权利要求5所述的方法,其特征在于,所述将第N个样本特征图在不同通道上的通道值进行至少一轮调整,得到每一轮调整后的更新样本特征图,包括:
针对M-T大于或等于1的情况,确定所述第N个样本特征图在第M-T通道上调整后的通道值,为第M通道上调整前的通道值;M为小于P的任意正整数,P为第N个样本特征图的通道总数,T为预设通道偏移值;
针对M-T小于1的情况,确定第P-T+1通道上的通道值,为第M-T+1通道上调整前的通道值。
7.根据权利要求1所述的方法,其特征在于,所述基于所述样本图像的目标对象的标注结果、所述样本特征图中的每一个特征点所对应的样本图像中多个目标检测区域分别对应的目标对象的存在概率、以及所述样本特征图对应的特征向量,调整所述神经网络的网络参数,包括:
基于所述样本图像的目标对象的标注结果、和所述样本特征图中的每一个特征点所对应的样本图像中多个目标检测区域分别对应的目标对象的存在概率,确定该特征点所对应的样本图像中每个目标检测区域对应的目标对象的检测结果的第一损失值;所述目标对象的检测结果用于指示是否存在目标对象;
基于所述样本特征图对应的特征向量、确定所述样本特征图中的每一个特征点所对应的样本图像中多个目标检测区域对应的目标对象定位位置的第二损失值;所述目标对象定位位置用于指示每个目标检测区域相对目标对象位置的位置偏移量;
基于所述第一损失值和所述第二损失值,调整所述神经网络的网络参数。
8.根据权利要求7所述的方法,其特征在于,所述基于所述样本图像的目标对象的标注结果、和所述样本特征图中的每一个特征点所对应的样本图像中多个目标检测区域分别对应的目标对象的存在概率,确定该特征点所对应的样本图像中每个目标检测区域对应的目标对象的检测结果的第一损失值,包括:
基于所述每一个特征点所对应的样本图像中多个目标检测区域、以及所述样本图像的目标对象的标注结果对应的目标对象的标注区域和目标对象的类别,为每一个所述目标检测区域生成标签,所述标签用于表示所述目标检测区域所包含的目标对象的类别;
针对所述样本特征图中的每一个特征点对应的每一个目标检测区域,将该目标检测区域对应的至少一个预测的目标对象的存在概率中,概率值最大的预测的目标对象的存在概率所对应的目标对象的类别,确定为该目标检测区域对应的预测目标对象的类别;
基于生成的所述标签、以及所述预测目标对象的类别,确定所述第一损失值。
9.根据权利要求7所述的方法,其特征在于,所述基于所述样本特征图对应的特征向量、确定所述样本特征图中的每一个特征点所对应的样本图像中多个目标检测区域对应的目标对象定...
【专利技术属性】
技术研发人员:丁明宇,王哲,石建萍,
申请(专利权)人:北京市商汤科技开发有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。