当前位置: 首页 > 专利查询>清华大学专利>正文

深度组合度量学习方法和装置制造方法及图纸

技术编号:28474906 阅读:70 留言:0更新日期:2021-05-15 21:43
本发明专利技术提出一种深度组合度量学习方法和装置,其中,方法包括:计算预设的多个子空间中每个子空间的目标权值;根据预设的多个初始组合器中的每个初始组合器的初始选择权值,确定与每个子空间对应的目标选择概率;根据目标选择概率对应的目标权值,加权计算生成与每个初始组合器对应的候选组合器;根据预设的约束函数对每个初始组合器对应的候选组合器约束,生成与每个初始组合器对应的目标组合器;通过与多个初始组合器对应的多个目标组合器,执行不同的深度识别子任务。由此,实现了能够在提高网络的泛化性能力的同时,不牺牲整体网络的判别能力,从而使网络兼具两方面的优势。从而使网络兼具两方面的优势。从而使网络兼具两方面的优势。

【技术实现步骤摘要】
深度组合度量学习方法和装置


[0001]本专利技术涉及计算机视觉与机器学习
,尤其涉及一种深度组合度量学习方法和装置。

技术介绍

[0002]深度度量学习旨在构建一个有效的嵌入空间来反映图像之间的语义距离。现存的许多方法聚焦于设计出多样的损失函数在嵌入空间中增大不同类之间的欧氏距离,同时缩小同类样本间的欧氏距离。例如,通常使用的三元组损失函数在同类样本和异类样本之间进行距离的排序并维持一定的间距以此提升鲁棒性。
[0003]集成学习将许多学习器的结果组合起来,得到最后的预测输出,这种方法在监督学习、强化学习以及非监督学习中证明了其有效性。集成学习是基于不同学习器的组合效果往往比单个最佳学习器的结果更具有泛化性能的考虑。最近的方法将集成学习融入深度度量学习中来提高泛化性能,具体的实施包括分割网络的最后一层来得到不同的学习器、利用不同层中的特征以及采用不同的注意力模块等。这些方法设计出不同的子任务来训练网络中的不同学习器,以此来获得图片中的不同特征。
[0004]基于集成学习策略的深度度量学习通过驱使不同子空间具有不同的特征来提高网络的泛化性能。然而,这种方法存在一个很大的问题,如果让嵌入空间获得更多类内差异特征不可避免地会降低整体网络的判别能力,从而使得最终的度量对噪声信息更加敏感。

技术实现思路

[0005]本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。
[0006]为此,本专利技术的第一个目的在于提出一种深度组合度量学习方法,以实现能够在提高网络的泛化性能力的同时,尽量不牺牲整体网络的判别能力,从而使网络兼具两方面的优势。
[0007]本专利技术的第二个目的在于提出一种深度组合度量学习装置。
[0008]本专利技术的第三个目的在于提出一种计算机设备。
[0009]本专利技术的第四个目的在于提出一种非临时性计算机可读存储介质。
[0010]为达上述目的,本专利技术第一方面实施例提出了一种深度组合度量学习方法,包括:计算预设的多个子空间中每个子空间的目标权值;根据预设的多个初始组合器中的每个所述初始组合器的初始选择权值,确定与所述每个子空间对应的目标选择概率;根据所述目标选择概率对应的目标权值,加权计算生成与每个所述初始组合器对应的候选组合器;根据预设的约束函数对每个所述初始组合器对应的候选组合器约束,生成与每个所述初始组合器对应的目标组合器;通过与所述多个初始组合器对应的多个所述目标组合器,执行不同的深度识别子任务。
[0011]为达上述目的,本专利技术第二方面实施例提出了一种深度组合度量学习装置,包括:计算模块,用于计算预设的多个子空间中每个子空间的目标权值;确定模块,用于根据预设
的多个初始组合器中的每个所述初始组合器的初始选择权值,确定与所述每个子空间对应的目标选择概率;第一生成模块,用于根据所述目标选择概率对应的目标权值,加权计算生成与每个所述初始组合器对应的候选组合器;第二生成模块,用于根据预设的约束函数对每个所述初始组合器对应的候选组合器约束,生成与每个所述初始组合器对应的目标组合器;识别模块,用于通过与所述多个初始组合器对应的多个所述目标组合器,执行不同的深度识别子任务。
[0012]为达上述目的,本专利技术第三方面实施例提出了一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如上述第一方面实施例所述的深度组合度量学习方法。
[0013]为了实现上述目的,本专利技术第四方面实施例提出了一种非临时性计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述第一方面实施例所述的深度组合度量学习方法。
[0014]为了实现上述目的,本专利技术第五方面实施例提出了一种计算机程序产品,当所述计算机程序产品中的指令处理器执行时,实现如上述第一方面实施例所述的深度组合度量学习方法。
[0015]本专利技术的实施例,至少具有如下的技术效果:
[0016]解决现有的以集成学习为基础的深度度量学习技术中,在提高网络泛化能力的同时,往往会降低网络的判别能力的问题。本专利技术的实施例中,通过同时以一种自增强的方式,同时训练一系列的组合器并对子空间的组合设置不同的辅助限制,从而在提高网络泛化性的同时减少对其判别性的影响。
[0017]本专利技术附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。
附图说明
[0018]本专利技术上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
[0019]图1为本专利技术实施例所提供的一种深度组合度量学习方法的流程示意图;
[0020]图2为本专利技术实施例所提供的另一种深度组合度量学习方法的流程示意图;
[0021]图3为本专利技术实施例所提供的一种组合器运行逻辑的流程示意图;以及
[0022]图4为本专利技术实施例所提供的另一种深度组合度量学习装置的结构示意图。
具体实施方式
[0023]下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本专利技术,而不能理解为对本专利技术的限制。
[0024]下面参考附图描述本专利技术实施例的深度组合度量学习方法和装置。
[0025]目前的以集成学习为基础的深度度量学习方法大多直接在子空间上做不同的子任务,这样虽然能提高网络的泛化性,但却降低了整体的判别性能。为了解决这个问题,本专利技术用了一系列不同的组合部分来对每个子空间进行不同的自适应的加权,对于各个组合
成分进行相同或不同任务的损失函数限制,同时通过自增强的训练方式加强不同组合部分之间的差异性。最后,我们将网络的子空间进行连接后,利用度量学习损失函数进行训练,从而进一步提高整体网络的判别性能。
[0026]具体而言,图1为本专利技术实施例所提供的一种深度组合度量学习方法的流程示意图。如图1所示,该深度组合度量学习方法包括以下步骤:
[0027]步骤101,计算预设的多个子空间中每个子空间的目标权值。
[0028]其中,多个子空间可以理解为卷积神经网络中的池化层,每个子控件可以理解为一个池化层。
[0029]本实施例中,通过softmax激活函数和tanh激活函数对每个所述子空间计算出两个权重值,softmax激活函数为下面的公式(1):
[0030][0031]其中,为所述两个权值中的一个权值,K为组合器的编号,w为神经元系数参数,b为神经元偏置参数,m为组合器编号,y为激活函数的输入;
[0032]所述tanh激活函数为下面的公式(2):
[0033][0034]其中,为所述两个权值中的另一个权值
[0035]进一步的,计算每个所述子空间对应的所述两个权重值的乘积,获取所述每个子空间的目标权值,即如下面的公式本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种深度组合度量学习方法,其特征在于,包括以下步骤:计算预设的多个子空间中每个子空间的目标权值;根据预设的多个初始组合器中的每个所述初始组合器的初始选择权值,确定与所述每个子空间对应的目标选择概率;根据所述目标选择概率对应的目标权值,加权计算生成与每个所述初始组合器对应的候选组合器;根据预设的约束函数对每个所述初始组合器对应的候选组合器约束,生成与每个所述初始组合器对应的目标组合器;通过与所述多个初始组合器对应的多个所述目标组合器,执行不同的深度识别子任务。2.如权利要求1所述的方法,其特征在于,所述计算预设的多个子空间中每个子空间的目标权值,包括:通过softmax激活函数和tanh激活函数对每个所述子空间计算出两个权重值;计算每个所述子空间对应的所述两个权重值的乘积,获取所述每个子空间的目标权值。3.如权利要求2所述的方法,其特征在于,所述softmax激活函数为:其中,为所述两个权值中的一个权值,K为组合器的编号,w为神经元系数参数,b为神经元偏置参数,m为组合器编号,y为激活函数的输入;所述tanh激活函数为:其中,为所述两个权值中的另一个权值。4.如权利要求1所述的方法,其特征在于,还包括:根据损失函数增大组合器之间的差异,其中,所述损失函数为:其中,J
reinf
(c
m
;ψ
m
)为相应的损失函数,为每个组合器对于子空间的选择概率向量权值,ψ
m
为全连接网络中可学习的参数集合。5.如权利要求1所述的方法,其特征在于,所述根据所述目标选择概率对应的目标权值,加权计算生成与每个所述初始组合器对应的候选组合器,包括:获取每个所述初始组合器对应的所有子空间中每个子空间的目标选择概率和对应的目标权值;计算所述每个子空间的目标选择概率和对应的目标权值的乘积值;对所述每个所述初始组合器对应的所有子空间的所有乘积值加权求和,每个所述初始组合器对应的候选组合器。6.如权利要求1所述的方法,其特征在于,所述根据预设的约束函数对每个所述初始组
合器对应的候选组合器约束,生成与每个所述初始组合器对应的目标组合器,包括:根据margin损失函数以及距离采样策略对每个所述初始组合器对应的候选组合...

【专利技术属性】
技术研发人员:周杰鲁继文郑文钊汪诚琨
申请(专利权)人:清华大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1