当前位置: 首页 > 专利查询>暨南大学专利>正文

一种用于优化零样本学习的方法技术

技术编号:35817195 阅读:15 留言:0更新日期:2022-12-03 13:41
本发明专利技术公开了一种用于优化零样本学习的方法,具体涉及数据处理领域。本发明专利技术通过利用了视觉和语义特征共享的潜在概念,提出匹配它们潜在的视觉和语义表示,并引入了视觉和语义特征损失的重构以减少域移和信息损失,从而将重构正则化添加到相似的特征中,通过所提出的方法获得保留知识的共享概念;在数学上该问题被表述为其潜在公共子空间的相互正交投影的最小化问题,将该问题分解为两个子问题,利用基于巴兹莱

【技术实现步骤摘要】
一种用于优化零样本学习的方法


[0001]本专利技术涉及数据处理
,更具体地说,本专利技术涉及一种用于优化零样本学习的方法。

技术介绍

[0002]零样本学习(ZSL)旨在通过观察类和辅助语义信息来解决上述问题。ZSL的灵感来自于人类识别以前从未见过的视觉类别的能力。例如,考虑到一个孩子以前从未见过熊猫,但被告知熊猫是一种外表类似于白色和黑色方块的熊,这个孩子可能会正确地认出熊猫。这种现象可以归因于熊猫和熊之间的关系,这是通过给定的辅助信息建立的。由于其吸引人的性能,ZSL已被广泛研究并应用于许多计算机视觉案例,如场景理解。
[0003]迁移学习,也被称为领域适应,在过去的十年里得到了广泛的关注。在此期间,许多迁移学习方法得到了发展。零样本学习是迁移学习的一个子领域。由于视觉数据和语义数据的表示方式不同,ZSL被归类为异构迁移学习。更准确地说,它可以被视为具有不同标签空间的异构迁移学习。因此,有几种ZSL方法将零样本学习扩展到转换设置,其中采用不可见的数据来训练模型,知识可以从可见的类转移到不可见的类。例如,通过利用语义空间中的目标域类标签的投影来规范学习到的目标域。采用多种中间语义表示和未标记目标数据的多形结构来处理可转换的ZSL问题。CDL学习一个耦合字典来对齐零样本学习问题的视觉

语义结构。

技术实现思路

[0004]为了克服现有技术的上述缺陷,本专利技术的实施例提供一种用于优化零样本学习的方法。
[0005]为实现上述目的,本专利技术提供如下技术方案:一种用于优化零样本学习的方法,实现的具体步骤为:
[0006]S1.以学习底层的共享概念,对视觉数据和语义数据引入重构正则化,针对当前零样本学习的相关问题建立名为VSOP的新型ZSL方法,该方法从而匹配视觉数据和语义数据在公共子空间中的潜在表示;
[0007]S2.将VSOP表示为从视觉空间和语义空间到其潜在的公共子空间的相互正交投影的最小化问题;
[0008]S3.使用高斯

塞德尔方法将非平凡问题分解为两个子问题;
[0009]S4.采用具有巴林来

波温步长的曲线搜索方法来求解上述步骤S3中的两个子问题;
[0010]S5.在6个真实数据集上进行了全面的实验,验证该方法的有效性。
[0011]在一个优选的实施方式中,步骤S1具体包括:
[0012]S11:为了清晰起见,首先提供符号及其相应的描述;S={C
s,i
|i=1,

,N
S
}表示为看到类的集合,其中C
s,i
表示看到类,N
S
为看到类的数量;表示u={C
u,i
,i|i=1,

,N
u
}为不
可见类的集合,其中C
u,i
表示一个看不见的类,N
u
为看不见的类的数量;有S∩U=φ,属于可见类的标记训练数据用其中N为样本数,D
V
为X的特征维数;让y={y1,

y
N
}
T
∈R
N
为X对应的标签;表示Z={Z1,

Z
N
}作为可见类的原型集,也称为语义特征;
[0013]S12:Z的大小通常是其中D
A
是语义空间的维数,但总是可以根据训练数据的标,即y,将其重新缩放为类似地,将测试数据表示为其中N
ts
是X
ts
中的样本数量;相应的标签及其X
ts
原型用和其目的是利用从X、Z和y中提取的知识来学习X
ts
的模型;在零样本学习(ZSL)设置为y
ts,i
∈u;而在广义零样本学习(GZSL)设置为y
ts,i
∈S∪u。
[0014]在一个优选的实施方式中,步骤S2具体包括:
[0015]S21:子空间的视觉空间,引入了重建损失来捕获的视觉特征:
[0016][0017]S22:子空间的语义空间,提出通过学习另一个映射矩阵q来将语义特征投射到上述的子空间中;类似地,使用重建正则化来生成以下公式:
[0018]S23:为了利用视觉空间和语义空间之间的关系,在公共子空间中匹配视觉空间和语义特征的潜在表示,其目的是利用共享的概念来捕获潜在的视觉表示和语义表示之间的潜在关系;具体地说,在子空间中表示模型如下:
[0019]S24:通过结合上述三个理论来制定提出的VSOP:
[0020][0021]s.t.P
T
P=I,Q
T
Q=I;
[0022]S25:通过解决上述问题,可以获得测试的视觉和语义特征的新表示,分别用和表示测试的视觉和语义特征;在和所属的学习空间中做出预测;因此,使用1

最近邻(NN)分类器很容易得到如下:
[0023]在一个优选的实施方式中,步骤S3具体包括:
[0024]S31:P和Q的正交约束为:
[0025]P
T
P=I,Q
T
Q=I
[0026]S32:涉及到P和Q的正交约束,将上述问题重新表述为:
[0027][0028]s.t.P
T
P=I,Q
T
Q=I
[0029]上述问题是一个非凸优化问题,非平凡求解;然而这类问题可以通过高斯

塞德尔迭代方案来解决,也称为坐标下降法;因此,在本文中,采用高斯

塞德尔算法来解决该问题,并列出的主要步骤如下:
[0030]在修复P的同时更新Q;可以减少以解决以下问题
[0031][0032]s.t.Q
T
Q=I
[0033]得到Q和修正Q,通过通过解决以下问题来更新:
[0034][0035]s.t.P
T
P=I
[0036]S33:根据之前的理论,总结提出的VSOP:
[0037][0038]在一个优选的实施方式中,步骤S4具体包括:
[0039]S41:利用给出了两个引理并予以证明:
[0040]给定任意斜对称矩阵W,则矩阵是定义良好的和正交的,即
[0041]给定任意斜对称矩阵W,则为等式中的矩阵满足
[0042]S42:给定一个固定的步长τ,该方法可能不收敛;为了解决这个问题,在迭代k时,通过沿着曲线最小化来选择一个步长τ;然而,寻找一个全局最小化器在计算上是昂贵的;相反,可以寻求找到一个满足Armijo

Wolfe条件的τ:
[0043][0044]S43:上面寻找τ的行搜索方法非常简单,但它可能需要大量的计算,并且需要大量的迭代;为了解决这一问题,转向采用了巴尔齐莱

本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于优化零样本学习的方法,其特征在于,实现的具体步骤为:S1.以学习底层的共享概念,对视觉数据和语义数据引入重构正则化,针对当前零样本学习的相关问题建立名为VSOP的新型ZSL方法,该方法从而匹配视觉数据和语义数据在公共子空间中的潜在表示;S2.将VSOP表示为从视觉空间和语义空间到其潜在的公共子空间的相互正交投影的最小化问题;S3.使用高斯

塞德尔方法将非平凡问题分解为两个子问题;S4.采用具有巴林来

波温步长的曲线搜索方法来求解上述步骤S3中的两个子问题;S5.在6个真实数据集上进行了全面的实验,验证该方法的有效性。2.根据权利要求1所述的一种用于优化零样本学习的方法,其特征在于:步骤S1具体包括:S11:为了清晰起见,首先提供符号及其相应的描述;S={C
s,i
|i=1,

,N
S
}表示为看到类的集合,其中C
s,i
表示看到类,N
S
为看到类的数量;表示u={C
u,i
,i|i=1,

,N
u
}为不可见类的集合,其中C
u,i
表示一个看不见的类,N
u
为看不见的类的数量;有S∩U=φ,属于可见类的标记训练数据用其中N为样本数,D
V
为X的特征维数;让y={y1,

y
N
}
T
∈R
N
为X对应的标签;表示Z={Z1,

Z
N
}作为可见类的原型集,也称为语义特征;S12:Z的大小通常是其中D
A
是语义空间的维数,但总是可以根据训练数据的标,即y,将其重新缩放为类似地,将测试数据表示为其中N
ts
是X
ts
中的样本数量;相应的标签及其X
ts
原型用和其目的是利用从X、Z和y中提取的知识来学习X
ts
的模型;在零样本学习(ZSL)设置为y
ts,i
∈u;而在广义零样本学习(GZSL)设置为y
ts,i
∈S∪u。3.根据权利要求1所述的一种用于优化零样本学习的方法,其特征在于:步骤S2具体包括:S21:子空间的视觉空间,引入了重建损失来捕获的视觉特征:S22:子空间的语义空间,提出通过学习另一个映射矩阵q来将语义特征投射到上述的子空间中;类似地,使用重建正则化来生成以下公式:S23:为了利用视觉空间和语义空间之间的关系,在公共子空间中匹配视觉空间和语义特征的潜在表示,其目的是利用共享的概念来捕获潜在的视觉表示和语义表示之间的潜在关系;具体地说,在子空间中表示模型如下:S24:通过结合上述三个理论来制定提出的VSOP:
s.t.P
T
P=I,Q
T
Q=I;S...

【专利技术属性】
技术研发人员:吴汉瑞龙锦益张帆
申请(专利权)人:暨南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1