域自适应学习方法技术

技术编号：14783376 阅读：177 留言：0更新日期：2017-03-10 04:28

本发明专利技术涉及面向计算机视觉领域的域自适应技术，为解决物体分类问题训练类别和测试类别的分布不同而引起的域偏移问题，本发明专利技术：域自适应学习方法，用表示包含n个样本的训练数据集，其中表示视觉特征空间，包含N个类别，利用表示来自M个类别的m个测试样本，并且训练类别和测试类别是不相交的，每一个类别利用嵌入在类别语义空间中的一个向量表征，为属性空间或者文本描述空间，p和q表示视觉空间和类别语义空间的维度，跨模态嵌入方法的基本原理是利用训练数据S学习一个转移矩阵将视觉样本从视觉空间χ转移到类别语义空间y中，在测试阶段，利用在训练阶段学习到的转移矩阵W*将测试样本x映射到类别语义空间。本发明专利技术主要应用于计算机视觉场合。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及面向计算机视觉领域的域自适应技术，具体讲,涉及域自适应学习方法。
技术介绍
传统的物体分类技术中测试样本所属的类别一定包含在训练阶段出现过的类别中，为了获得更好的分类性能，每一类别往往需要大量的训练样本。而在现实情况下，有些类别的样本很难获得。对于在训练阶段某些类别中训练样本较少或者缺失的场景，则训练模型无法获得测试类别的数据分布。利用训练类别学习到的模型去预测测试类别的样本容易产生域偏移问题。以零样本分类为例进行介绍。零样本分类是测试类别在训练阶段的样本缺失的场景，显然，传统的分类技术无法解决这一问题。为了实现这一目标，研究者们提出了一种所有类别共享的中间层语义特征空间将信息从训练类别中转移到测试类别中。除了视觉特征外，零样本分类还需要类别描述的语义特征，因此零样本分类可以利用跨模态嵌入的方法进行解决。当前利用跨模态嵌入方法解决零样本分类的基本框架是：在训练阶段，利用有标注样本的训练类别学习一个跨模态嵌入的模型，将训练样本从视觉空间转移到中间层的类别语义空间。在类别语义空间中，每一个类别(训练类别和测试类别)都对应着一个类别语义向量。在测试阶段，利用在训练阶段学习到的跨模态嵌入模型将测试样本嵌入到类别语义空间中，根据样本在类别语义空间中的嵌入向量与测试类别在类别语义空间中的类别语义向量之间的关系，利用最近邻分类器对测试样本进行分类。因为训练类别和测试类别是不相交的，因此不加调整地将训练阶段学习到的模型应用到测试类别中容易产生域偏移的问题。例如：“斑马”和“猪”都有“尾巴”这一属性，而在训练阶段只有“斑马”这一类别的样本，因此我们可以利用这...
域自适应学习方法

【技术保护点】
一种域自适应学习方法，其特征是，用表示包含n个样本的训练数据集，其中表示视觉特征空间，包含N个类别，利用表示来自M个类别的m个测试样本，并且训练类别和测试类别是不相交的，即：每一个类别利用嵌入在类别语义空间中的一个向量表征，为属性空间或者文本描述空间，p和q表示视觉空间和类别语义空间的维度，跨模态嵌入方法的基本原理是利用训练数据S学习一个转移矩阵将视觉样本从视觉空间转移到类别语义空间中，在测试阶段，利用在训练阶段学习到的转移矩阵W*将测试样本x映射到类别语义空间，然后利用公式1预测测试样本的类别：c*=argmaxcxTW*yc,---(1)]]>其中yc是第c个测试类对应的类别语义向量，利用公式1获得m个测试样本对应的预测类别，根据测试类别和类别语义向量之间的对应关系，得到测试样本集XU对应的预测类别语义矩阵矩阵的每一列向量表示测试样本的测试类别所对应的类别语义向量。

【技术特征摘要】
1.一种域自适应学习方法，其特征是，用表示包含n个样本的训练数据集，其中表示视觉特征空间，包含N个类别，利用表示来自M个类别的m个测试样本，并且训练类别和测试类别是不相交的，即：每一个类别利用嵌入在类别语义空间中的一个向量表征，为属性空间或者文本描述空间，p和q表示视觉空间和类别语义空间的维度，跨模态嵌入方法的基本原理是利用训练数据S学习一个转移矩阵将视觉样本从视觉空间转移到类别语义空间中，在测试阶段，利用在训练阶段学习到的转移矩阵W*将测试样本x映射到类别语义空间，然后利用公式1预测测试样本的类别：c*=argmaxcxTW*yc,---(1)]]>其中yc是第c个测试类对应的类别语义向量，利用公式1获得m个测试样本对应的预测类别，根据测试类别和类别语义向量之间的对应关系，得到测试样本集XU对应的预测类别语义矩阵矩阵的每一列向量表示测试样本的测试类别所对应的类别语义向量。2.如权利要求1所述的域自适应学习方法，其特征是，进一步地，利用测试样本自学习一个更适合测试样本的转移矩阵W，其目标函数为：argminW,VΣi=1m||WTxi-vi||F2+λ1||W-W*||F2+λ2Σi=1mΣj=1MAij||vi-yj||22,---(2)]]>其中λ1和λ2是权重系数，表示将测试样本xi映射到类别语义空间中的损失，vi表示测试样本xi在语义空间中的映射向量，表示利用测试样本学习得到的转移矩阵要与利用训练样本学习得到的转移矩阵相似；表示...

【专利技术属性】
技术研发人员：冀中，于云龙，
申请(专利权)人：天津大学，
类型：发明
国别省市：天津;12

全部详细技术资料下载我是这个专利的主人