【技术实现步骤摘要】
一种基于双通道学习的长尾分布图像数据识别方法
本专利技术涉及机器学习中的不平衡分类、小样本学习、长尾分布图像数据识别的
,尤其是指一种基于双通道学习的长尾分布图像数据识别方法。
技术介绍
长尾分布图像数据识别通常采用不平衡学习相关的技术,这类技术主要分为数据层面和算法层面。数据层面的技术主要包括下采样多数类样本、上采样少数类样本或结合两者的混合采样方法。然而,重采样后的数据不能反映真实的数据分布特征,比如下采样方法会丢弃绝大部分样本,从而损失数据集中许多有价值的信息,上采样方法会导致过拟合问题,同时会带来极大的算力消耗。算法层面的技术主要通过代价敏感方法来重新调整各个类别的权重,这类方法一定程度上缓和了长尾分布图像数据识别问题,但并没有综合考虑到大量尾部类别仅有极少数样本的情况,导致尾部类别的识别准确率仍然较低。此外,可行的解决思路还有从头部类别丰富数据中学习知识往尾部类别进行迁移、设计适合长尾分布图像数据识别的损失函数以及构建更加合理的长尾分布图像数据识别模型。现实生活中的数据常常以长尾分布的形式呈现,然而当 ...
【技术保护点】
1.一种基于双通道学习的长尾分布图像数据识别方法,其特征在于,包括以下步骤:/n1)构建由不平衡学习通道采样器、不平衡学习通道网络、小样本学习通道采样器、小样本学习通道网络和双通道学习总损失函数组成的双通道学习模型;将长尾分布图像数据集划分为训练集、验证集和测试集;利用不平衡学习通道采样器从训练集采样图像数据和标签数据,将数据输入不平衡学习通道网络,计算不平衡学习通道损失;利用小样本学习通道采样器从训练集采样图像数据和标签数据,将数据输入小样本学习通道网络,计算小样本学习通道损失;而后将不平衡学习通道损失和小样本学习通道损失进行加权求和,得到双通道学习总损失;/n2)利用双 ...
【技术特征摘要】
1.一种基于双通道学习的长尾分布图像数据识别方法,其特征在于,包括以下步骤:
1)构建由不平衡学习通道采样器、不平衡学习通道网络、小样本学习通道采样器、小样本学习通道网络和双通道学习总损失函数组成的双通道学习模型;将长尾分布图像数据集划分为训练集、验证集和测试集;利用不平衡学习通道采样器从训练集采样图像数据和标签数据,将数据输入不平衡学习通道网络,计算不平衡学习通道损失;利用小样本学习通道采样器从训练集采样图像数据和标签数据,将数据输入小样本学习通道网络,计算小样本学习通道损失;而后将不平衡学习通道损失和小样本学习通道损失进行加权求和,得到双通道学习总损失;
2)利用双通道学习总损失,反向传播更新双通道学习模型中的所有参数,即训练双通道学习模型,并保存最优的双通道学习模型参数,得到最优的双通道学习模型;
3)输入测试集的图像数据到最优的双通道学习模型,获取图像的预测标签,即预测结果。
2.根据权利要求1所述的一种基于双通道学习的长尾分布图像数据识别方法,其特征在于:在步骤1)中,所述不平衡学习通道采样器的情况如下:
不平衡学习通道的输入数据采样自一个均匀采样器,在每个训练回合T,训练集中的每个样本以相等的概率被采样且最多被采样一次;定义B为每个批次采样的样本数,采样的输入数据表示为{(x1imb,y1imb),...,(xiimb,yiimb),...,(xBimb,yBimb)},其中,上标imb用于标识不平衡学习通道,(xiimb,yiimb)表示第i个样本的图像数据和标签数据,1≤i≤B;
所述不平衡学习通道网络的情况如下:
不平衡学习通道网络是基于不平衡分类算法,将不平衡分类算法的网络模型移植过来,其包括特征提取器fφ、分类器和不平衡损失函数Limb三个部分,所述特征提取器fφ用于提取输入数据(xiimb,yiimb)的特征表示然后将特征表示输入给分类器得到预测标签最后结合定义好的不平衡损失函数Limb计算相应批次样本的不平衡学习通道损失
所述小样本学习通道采样器的情况如下:
小样本学习通道的输入数据采样自一个元采样器,在每个训练回合T,元采样器首先在训练集的所有类别中随机采样N个类别,然后在这N个类别中的每个类别随机采样KS个样本和KQ个样本分别作为小样本学习通道的支撑集和查询集其中,上标sup和上标qry分别用于标识支撑集和查询集;表示支撑集的第i个样本的图像数据和标签数据,1≤i≤N×KS;表示查询集的第i个样本的图像数据和标签数据,1≤i≤N×KQ;每个批次的数据由支撑集S和查询集Q组成;
所述小样本学习通道网络的情况如下:
小样本学习通道网络是基于小样本学习算法,将小样本学习算法的网络模型移植过来,其包括特征提取器fφ...
【专利技术属性】
技术研发人员:陈琼,林恩禄,朱戈仁,
申请(专利权)人:华南理工大学,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。