用于图像检索的神经网络训练方法、装置及电子设备制造方法及图纸

技术编号：26531756 阅读：22 留言：0更新日期：2020-12-01 14:13

本申请公开了一种用于图像检索的神经网络训练方法、装置及电子设备。神经网络包括：一个特征提取器和多个学习器。方法包括：预先确定多个训练图像组，每个训练图像组包括三张图像，两张同类别，一张不同类别；针对每个训练图像组，给每个学习器配置随机权重：将训练图像组的三张图像输入至特征提取器中确定三张图像的特征；将每张图像的特征分别乘以每个学习器对应的随机权重，得到对应每个学习器的加权特征，每个学习器的三张图像对应相同的随机权重；将每张图像对应每个学习器的加权特征输入对应学习器，确定每张图像的多个特征向量；基于多个训练图像组中每张图像的多个特征向量调整神经网络的参数。削弱训练数据间的信息差异对网络的影响。

全部详细技术资料下载

【技术实现步骤摘要】
用于图像检索的神经网络训练方法、装置及电子设备
本申请涉及图像处理
，尤其涉及一种用于图像检索的神经网络训练方法、装置及电子设备。
技术介绍
随着互联网经济的发展，以图搜图的需求增多，实现以图搜图的图像检索技术也越来越重要。图像检索是根据待查询图像搜索数据库中与之相同类别的图像，其主要目的是更为准确地在数据库中召回同类别的图像。例如，在智能驾驶(包括无人驾驶和辅助驾驶)中，需要识别采集的图像对应的场景，以做出针对当前场景的决策。现有的图像检索技术主要是基于卷积神经网络的多分支(即学习器)网络模型，其通过不同的网络分支将图像中的不同属性的信息特征映射为嵌入特征向量，进而基于这些嵌入特征向量来描述一个图像在距离度量标准下的空间位置，再通过不同图像的空间位置来寻找相似的图像。上述多分支网络模型是通过对多个分支进行差异性模型训练而得到，模型训练的样本是以三张图像组成的三元组为最小单元，其中一张图像为待检索图像A，另外两张分别是与图像A属于同类别的图像P以及与A属于不同类别的图像N。参见图1，以多分支网络模型中包含三个分支(学习器)为例，现有的多分支网络模型的序列化训练方法的主要过程为：将三元组中的图像A分别输入三个卷积神经网络CNN中，三个CNN分别提取该张图像的特征；然后，将三个CNN提取的特征分别输入对应的学习器1、学习器2和学习器3，得到该张图像对应的三个特征向量；针对图像P和图像N执行相同操作，得到图像P和图像N各自对应的三个特征向量；之后，基于图像A和图像P相似(拉近距离)，而图像A和图像N不...

【技术保护点】
1.一种用于图像检索的神经网络训练方法，其特征在于，所述神经网络包括：一个特征提取器和多个学习器，所述多个学习器共享所述一个特征提取器提取的特征；预先确定多个训练图像组，每个所述训练图像组包括三张图像，其中两张同类别，一张不同类别；所述方法包括：/n针对每个所述训练图像组，给每个学习器配置随机权重：/n将所述训练图像组的三张图像输入至特征提取器中，确定所述三张图像的特征；/n针对每张图像，将该图像的特征分别乘以每个学习器对应的随机权重，得到该图像对应每个学习器的加权特征；针对每个学习器，所述训练图像组中的三张图像对应相同的随机权重；/n针对每张图像，将该图像对应每个学习器的加权特征输入至对应的学习器中，确定该图像的多个特征向量；/n基于多个训练图像组中每个训练图像组的每张图像的多个特征向量，调整所述神经网络的参数。/n

【技术特征摘要】
1.一种用于图像检索的神经网络训练方法，其特征在于，所述神经网络包括：一个特征提取器和多个学习器，所述多个学习器共享所述一个特征提取器提取的特征；预先确定多个训练图像组，每个所述训练图像组包括三张图像，其中两张同类别，一张不同类别；所述方法包括：
针对每个所述训练图像组，给每个学习器配置随机权重：
将所述训练图像组的三张图像输入至特征提取器中，确定所述三张图像的特征；
针对每张图像，将该图像的特征分别乘以每个学习器对应的随机权重，得到该图像对应每个学习器的加权特征；针对每个学习器，所述训练图像组中的三张图像对应相同的随机权重；
针对每张图像，将该图像对应每个学习器的加权特征输入至对应的学习器中，确定该图像的多个特征向量；
基于多个训练图像组中每个训练图像组的每张图像的多个特征向量，调整所述神经网络的参数。

2.根据权利要求1所述的方法，其特征在于，所述预先确定多个训练图像组，包括：
获取训练样本集，所述训练样本集中包括多个类别的图像，每个类别至少包括两张图像；
从所述训练样本集中确定多张参考图像A、每张参考图像A同类别的图像P和不同类别的图像N，得到多个训练图像组，每个所述训练图像组包括：参考图像A、同类别的图像P和不同类别的图像N。

3.根据权利要求1所述的方法，其特征在于，所述基于多个训练图像组中每个训练图像组的每张图像的多个特征向量，调整所述神经网络的参数，包括：
针对每个训练图像组中的每张图像，将该图像的多个特征向量，通过全连接层映射为一个嵌入特征向量；
针对每个训练图像组，基于三张图像对应的三个嵌入特征向量和三张图像的类别，计算所述训练图像组的损失函数值；
针对所述多个训练图像组，确定所述多个训练图像组的平均损失函数值；
基于所述平均损失函数值，调整所述神经网络的参数。

4.根据权利要求3所述的方法，其特征在于，所述基于所述平均损失函数值，调整所述神经网络的参数包括：
基于所述平均损失函数值，通过反向传播调整所述神经网络的参数。

5.一种用于图像检索的神经网络训练装置，其特征在于，所述神经网络包括：一个特征提取器和多个学习器，所述多个学习器共享所述一个特征提取器提取的特征；所述装置预先确定多个训练图像组，每个所述训练图像组包括三张图像...

【专利技术属性】
技术研发人员：任豪，李思洋，路红，
申请(专利权)人：驭势科技南京有限公司，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人