【技术实现步骤摘要】
基于流形学习和梯度提升模型的图片偏多标签分类方法
本专利技术涉及标签分类中的偏多标签问题,尤其是涉及了一种基于流形学习和梯度提升的两阶段偏多标签学习方法。
技术介绍
在图片多标签分类问题中,一个图片能够同时关联多个标签。传统图片多标签分类问题中的一个常见假设是训练数据集中的每个图片都被精确标记,即是有监督的。不幸的是,在许多真实的图片多标签分类问题中,无噪声的标签是很难获得的。相比之下,获取一组候选标签是非常容易的。这类问题被定义为图片的偏多标签学习问题(PartialMulti-LabelLearning,PML)。PML的基本假设是图片的正确标签被隐藏在了候选标签集中,并且它对学习器是不可见的。最具直觉性的PML方法是将所有候选标签视为有效标签。然后,PML问题可以通过任何现成的多标签学习算法来解决,例如:二值相关算法(BinaryRelevance,BR),分类器链,CPLST等等。但是,这样的策略忽略了候选标签集中的噪声标签,这可能导致标签相关性提取不充分,反过来又影响了预测性能。为了解决这个问题,研 ...
【技术保护点】
1.一种基于流形学习和梯度提升模型的图片偏多标签分类方法,其特征在于:方法包括:/n第一阶段,包括步骤1和步骤2:/n步骤1:/n首先从训练数据集
【技术特征摘要】
1.一种基于流形学习和梯度提升模型的图片偏多标签分类方法,其特征在于:方法包括:
第一阶段,包括步骤1和步骤2:
步骤1:
首先从训练数据集中构建一个加权图其中,V代表图片特征向量的集合,V={xi|1≤i≤n},xi表示第i个图片的特征向量,i表示图片的序数,n表示训练数据集中图片的总数;E代表每两个图片之间的连接关系的集合,E={(xi,xj)|i≠j,xj∈kNN(xi)},kNN(xi)表示到第i个图片的特征向量xi距离最近的前k个图片的特征向量的集合,(xi,xj)表示第j个图片和第i个图片具有连接关系;W为非负权重矩阵,W=[wij]n×n,其中wij表示第j个图片对第i个图片的权重;
对每个图片的特征向量xi,被其他图片的特征向量线性重建∑j≠iwijxj,获得线性重建误差:
其中,β是正则化项的权衡参数,||·||2表示二范数;
利用约束最小二乘规划方法来最小化线性重建误差ε(W)建立以下第一最小化模型:
其中,wj是W的第j列向量,Gj表示wj对应的n行n列的格莱姆矩阵,其中Gj的第a行第b列元素为(xj-xa)′(xj-xb),本发明使用v′表示某向量v的转置;
通过求解以上第一最小化模型获得非负权重矩阵W。
步骤2:根据加权图建立以下第二最小化模型,并求解获得重构标签矩阵作为置信度矩阵,再求解以上第二最小化模型获得重构标签矩阵U:
其中,U是重构标签矩阵,U=[u1,u2,…,un]=[udi]l×n,d表示标签的序数,l表示标签的总数,u1,u2,...,un分别表示重构标签矩阵的第1列、第2列、…、第n列,udi表示重构标签矩阵的第d行第i列的元素,yd表示第d个标签,Yi表示第i个图片中多个实物物体对应的标签集合,δ1和δ2分别表示下限阈值和上限阈值;
第二阶段,包括步骤3和步骤4:
步骤3:首先根据重构标签矩阵U将训练数据集转换构造为重构数据集再由重构数据集中训练一个二值相关模型f0;
然后用训练好的二值相关模型f0对于图片的特征向量矩阵X进行预测处理得到...
【专利技术属性】
技术研发人员:陈刚,强宇周,王皓波,谌晨,陈珂,胡天磊,寿黎但,伍赛,
申请(专利权)人:浙江大学,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。