当前位置: 首页 > 专利查询>重庆大学专利>正文

基于数据分布的分层加权抗噪深度度量学习方法技术

技术编号:33292263 阅读:66 留言:0更新日期:2022-05-01 00:13
本发明专利技术涉及互联网大数据技术领域,具体涉及基于数据分布的分层加权抗噪深度度量学习方法,包括:将随机合成的噪声样本加载到训练数据集中;基于数据间的距离关系刻画数据分布,随着训练进程推进数据分布的记录更新;基于数据分布的分布矩阵,去除每个训练batch中的噪声样本;基于数据分布自适应指导采样策略的学习并完成采样;最小化模型的损失函数以更新模型参数,并同步更新数据分布。本发明专利技术的深度度量学习方法能够提高模型的训练准确性和训练鲁棒性,从而能够保证模型的训练效果。从而能够保证模型的训练效果。从而能够保证模型的训练效果。

【技术实现步骤摘要】
基于数据分布的分层加权抗噪深度度量学习方法


[0001]本专利技术涉及互联网大数据
,具体涉及基于数据分布的分层加权抗噪深度度量学习方法。

技术介绍

[0002]度量学习方法是学习一种特征映射方法,通过这种特征映射方法将数据集中的样本映射到一个特征表示空间,使得相似的样本距离得很近,不相似的样本距离得很远,从而达到正负样本分离的结果。度量学习在视觉分析中起着非常重要的作用,其目的在于学习一个可以衡量图像对之间相似度的距离度量,以提高接下来分类或者聚类任务的正确率。度量学习可以广泛地应用于多种视觉应用中,如人脸识别,行人再识别,目标跟踪,物体识别和血缘关系验证等。
[0003]随着深度学习的发展,深度度量学习方法在计算机视觉领域应用十分广泛。例如,公开号为CN108304864A的中国专利公开了《一种深度对抗度量学习方法及装置》方法包括:从训练集中提取出图像的深度特征并生成三元组;根据三元组中的负样本通过生成器将三元组中的负样本转化为对度量训练有信息的难样本;获取难样本在度量空间下的表示,并同时训练整个网络,以得到图片在度量空间下的本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.基于数据分布的分层加权抗噪深度度量学习方法,其特征在于,包括以下步骤:S1:将随机合成的噪声样本加载到训练数据集中;S2:基于数据间的距离关系刻画数据分布,随着训练进程推进数据分布的记录更新;S3:基于数据分布的分布矩阵,去除每个训练batch中的噪声样本;S4:基于数据分布自适应指导采样策略的学习并完成采样;S5:最小化模型的损失函数以更新模型参数,并同步更新数据分布。2.如权利要求1所述的基于数据分布的分层加权抗噪深度度量学习方法,其特征在于:步骤S1中,具体包括如下步骤:S101:从预训练的神经网络中获取提取特征,通过提取特征将训练数据集中随机选择的真实类别的图像聚类为大量的小簇;S102:将每个小簇中的样本合并到一个随机选择的真实类别中,以完成噪声样本加载。3.如权利要求2所述的基于数据分布的分层加权抗噪深度度量学习方法,其特征在于:提取特征是从ImageNet上预训练得到的GoogleNet的L2归一化特征;小簇的数量为对应真实类别中图像数的二分之一。4.如权利要求2所述的基于数据分布的分层加权抗噪深度度量学习方法,其特征在于:步骤S2中,具体包括如下步骤:S201:初始化记录不同类间距离的均值和方差的距离均值矩阵M和距离方差矩阵V;其中,C表示训练数据集中样本的类别数量;S202:针对每个训练batch,利用类别标签下标从距离均值矩阵M和距离方差矩阵V中抽取该训练batch中出现的类别,生成记录训练batch中样本间距离的均值和方差变化值的训练均值矩阵和训练方差矩阵其中,B表示训练batch中的类别数量;S203:根据训练进程中数据真实的距离关系,记录当前训练轮次t下训练均值矩阵和训练方差矩阵的时序更新情况,并对应更新训练轮次t下的距离均值矩阵M
t
和距离方差矩阵V
t
。5.如权利要求4所述的基于数据分布的分层加权抗噪深度度量学习方法,其特征在于:通过如下公式更新距离均值矩阵M
t
:其中,式中:和分别表示t和t

1轮次下的训练均值矩阵变化值;D
mean
表示真实计算出来的不同类间样本距离值的均值,即训练均值矩阵真实值;β1用于衡量训练均值矩阵的变化值和真实值之间的比例关系;γ1用于衡量训练均值矩阵的变化值与原始值之间的比例关系,每次训练后,γ1进行0.9倍的衰减;通过如下公式更新距离方差矩阵V
t
:其中,
式中:和分别表示t和t

1轮次下的训练方差矩阵变化值;D
std
表示真实计算出来的不同类间样本距离值的方差,即训练方差矩阵真实值;β2用于衡量训练方差矩阵的变化值和真实值之间的比例关系;γ2用于衡量训练方差矩阵的变化值与原始值之间的比例关系,γ2比γ1小,每次训练后,γ2进行0.9倍的衰减。6.如权利要求4所述的基于数据分布的分层加权抗噪深度度量学习方法,其特征在于:步骤S3中,每次更新信息前,判断选择的样本x
i
与该类...

【专利技术属性】
技术研发人员:冯永朱依侬王永恒
申请(专利权)人:重庆大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1