自适应样本合成的深度度量学习及装置制造方法及图纸

技术编号：21400278 阅读：48 留言：0更新日期：2019-06-19 07:20

本发明专利技术公开了一种自适应样本合成的深度度量学习方法及装置，其中，该方法包括以下步骤：从训练集中提取出图像的深度特征，并生成样本多元组；通过线性插值自适应调整样本难度；通过生成器生成保持难度的样本；根据保持难度的样本获取生成难样本在度量空间下的表示信息，同时训练整个网络，以获取图片在度量空间下的表示信息。该方法使用生成器，将原始的样本特征转化为对度量的训练有信息的特征，并控制生成样本的难度自适应地训练度量网络，进而可以整合多数深度度量学习模型中的自适应生成器模块，实现对深度度量学习方法性能的提高。

全部详细技术资料下载

【技术实现步骤摘要】
自适应样本合成的深度度量学习及装置
本专利技术涉及计算机视觉与机器学习
，特别涉及一种自适应样本合成的深度度量学习方法及装置。
技术介绍
度量学习在计算机视觉中具有重要的地位。图像中传递的语义信息一般通过特征向量来表达，但特征向量之间的距离通常不能很好地反映图像之间的真实语义距离，而大量任务如图像检索、人脸验证等都依赖于对图像相似性的度量。因此，如何学习出一个准确、鲁棒的距离度量是一个极为关键的问题。相关技术中的度量学习主要分为两类：线性及非线性度量的学习。传统的线性度量学习方法主要通过学习出一个马氏距离来衡量样本之间的度量，如LMNN(Largemarginnearestneighbor，大间隔最近邻居)、ITML(InformationTheoryMetricLearning，信息理论学习)；而非线性的度量学习方法则通过核方法或神经网络方法来对更高阶的关系进行建模。从另一方面，度量学习方法又可以分为非监督与监督两类。非监督的度量学习主要希望学习一个从高维到低维的映射，而使得在低维空间中尽可能地保留高维中样本之间的距离信息。而监督的度量学习则主要基于一个目标，即最大化类间距离以及最小化类内距离。不同的监督度量学习方法，基本上都是对该目标的不同刻画与建模。随着深度神经网络在图像识别上取得了巨大的成功，度量学习目前的主要研究方法也转向深度网络。大多数深度度量学习方法也被看作深度嵌入学习，它们利用深度神经网络构建从图像空间到嵌入空间的映射，使得该空间中的欧几里德距离能够反映图像数据的真实语义距离。深度度量学习的大致框架与主要步骤如下：1)设计深度网络模型...

【技术保护点】
1.一种自适应样本合成的深度度量学习方法，其特征在于，包括以下步骤：步骤S1，从训练集中提取出图像的深度特征，并生成样本多元组；步骤S2，通过线性插值自适应调整样本难度；步骤S3，通过生成器生成保持难度的样本；以及步骤S4，根据所述保持难度的样本获取生成难样本在度量空间下的表示信息，同时训练整个网络，以获取图片在度量空间下的表示信息。

【技术特征摘要】
1.一种自适应样本合成的深度度量学习方法，其特征在于，包括以下步骤：步骤S1，从训练集中提取出图像的深度特征，并生成样本多元组；步骤S2，通过线性插值自适应调整样本难度；步骤S3，通过生成器生成保持难度的样本；以及步骤S4，根据所述保持难度的样本获取生成难样本在度量空间下的表示信息，同时训练整个网络，以获取图片在度量空间下的表示信息。2.根据权利要求1所述的自适应样本合成的深度度量学习方法，其特征在于，所述步骤S1包括：将所述训练集分图像前传入深度卷积神经网络，并在通过特征提取网络的最后全连接层后，获取图像的1024维的深度特征，以及根据样本标签和度量使用的目标函数得到三元组或多元组。3.根据权利要求1所述的自适应样本合成的深度度量学习方法，其特征在于，所述步骤S2包括：在度量空间下，对负样本对通过改变距离调整所述样本难度，其中，根据度量模型性能得到所述目标样本难度；根据当前的损失函数值衡量度量模型的当前状态，并控制生成样本的所述距离。4.根据权利要求1所述的自适应样本合成的深度度量学习方法，其特征在于，所述生成器的整体损失函数为：其中，λ为平衡因子，y为样本特征，y'为未调整长度的合成特征，为调整长度后的合成特征，Y、Y'和分别为它们所对应的特征分布，l为样本对应的类别标签，c(y,y')为重构损失，Jsoft为Softmax损失函数。5.根据权利要求1所述的自适应样本合成的深度度量学习方法，其特征在于，所述步骤S4包括：将所述生成难样本通过度量网络获取在度量空间下的所述表示信息；将特征提取网络、度量网络与生成器网络连接，以得到训练后的整个网络；由样本图片通过所述特征提取网络与所述度量网络得到测试样本的在度量空间下的表示信息。6.一种自适...

【专利技术属性】
技术研发人员：鲁继文，周杰，郑文钊，
申请(专利权)人：清华大学，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人