低秩约束的在线自监督学习的场景分类方法技术

技术编号:10040210 阅读:159 留言:0更新日期:2014-05-14 10:48
本发明专利技术涉及低秩约束的在线自监督学习的场景分类方法,包括以下步骤:对离线的图像数据进行训练并进行特征提取;进行小批训练来获得一个最初的度量学习者;依次输入在线数据图像并提取图像特征;判断图像特征有无标签;如果有标签,则更新度量学习者;如果无标签,则测量图像特征与每个训练样本之间的相似度,利用生成的双向线性图来传播它的标签;判断样本的特征向量相似度得分;如果得分高则更新度量学习者;否则输入在线数据图像。本发明专利技术能够逐渐地实现自我更新并且合并从标记样本和未标记样本获得的有用信息;用统一的在线自我更新模型的框架用来处理在线场景分类,能够实现场景的在线自动分类,保证了分类的准确性,提高了工作效率。

【技术实现步骤摘要】

本专利技术涉及一种场景自动分类方法,具体地说是通过低秩约束的在线自监督学习的场景分类方法
技术介绍
当今社会,机器学习技术在许多有着视觉认知能力的实际系统中扮演着一个核心的角色。传统上,机器学习模型是由标记训练数据离线训练的,在整个在线程序中都是固定不变的,例如我们例子中场景分类的机器视觉系统。不幸的是,对于实际的在线视觉系统,模型的性能可能会随着时间推移恶化并且新数据可能会与初始化训练数据大相径庭。为了处理这些问题,模型必须在批处理模式下由已有数据和新数据再离线训练一次,这样做将会很耗时间。更严重的是,如果数据集的体积过大,批训练模型将很难处理每次迭代中的所有数据。为了克服这个缺点,一次学习一个或者一组例子的在线模型将提供一个有效的方法替代离线再训练,这是通过增量更新分类器知识的新来数据并且建立一个适应不断变化数据的决定边界。通过提供矩阵形式的模型专注于自适应相似度学习者,例如度量学习、协同滤波和多任务学习。在线度量学习模型目的是学习一个半正定矩阵W∈Rd×d,因此对于所有的p1,p2,p3∈Rd有成立;如果p1,p2很相似而p1,p3刚好相反,为了分类应p1,p2该来自同一类而p3则是来自另一类。从本质上讲,监督在线度量学习者也是以最大边界区分特征点的。如果所有d维数据在一个小维的子空间中,如果数据是可区分的秩小于r的度量矩阵就能够区分任意的两个样本。从理想上说,许多秩大于r的度量矩阵能够区分没有任何噪音的数据。然而,在实际中数据总会包含噪音,于是高秩度量矩阵会引起过拟合并会因此使度量矩阵容易受噪音和干扰影响。
技术实现思路
针对现有技术的不足,本专利技术提供一种结合在线度量学习和半监督标签传播的分类方法,所采用的技术方案是:低秩约束的在线自监督学习的场景分类方法,包括以下步骤:对离线图像数据进行训练并进行特征提取;进行小批训练来获得一个最初的度量学习者W0;依次输入在线数据图像qi并提取图像特征;判断图像特征有无标签;如果有标签,则更新度量学习者Wi,返回依次输入在线数据图像qi步骤;如果无标签,则测量该图像与已测的每个有标签训练样本之间的相似度,利用相似度生成的双向线性图来传播它的标签;然后判断该图像特征向量与样本的特征向量相似度Sw得分;如果得分在设定值范围内,则将该图像q插入到队列Q中,当队列Q满时更新Q,然后转至更新度量学习者步骤,同时将Q插入到P类中并清零,此时度量学习者为最终的度量学习者,P类为最终的类。所述度量学习者为低秩矩阵。所述最初的度量学习者为单位矩阵W0=Id×d,d为矩阵的维数,I为单位矩阵。所述更新度量学习者包括以下步骤:从在线图像数据的指数集合T中均匀采样得到一个随机指数t;将t代入度量学习者迭代公式Wi+1=proxαiγP,Ω(Wi-αi∂lw(Wi,t)),]]>其中∂l(W,t)=(pt‾-p^t)ptT,l(W,t)>0[0,(pt‾-p^t)ptT],l(W,t)=00,otherwise,]]>其中Wi=I∈Rd×d,γ为一预设的值,αi为步长,P(W)=||W||*,Ω={W|W≥0本文档来自技高网
...
低秩约束的在线自监督学习的场景分类方法

【技术保护点】
低秩约束的在线自监督学习的场景分类方法,其特征在于包括以下步骤:对离线图像数据进行训练并进行特征提取;进行小批训练来获得一个最初的度量学习者W0;依次输入在线数据图像qi并提取图像特征;判断图像特征有无标签;如果有标签,则更新度量学习者Wi,返回依次输入在线数据图像qi步骤;如果无标签,则测量该图像与已测的每个有标签训练样本之间的相似度,利用相似度生成的双向线性图来传播它的标签;然后判断该图像特征向量与样本的特征向量相似度Sw得分;如果得分在设定值范围内,则将该图像q插入到队列Q中,当队列Q满时更新Q,然后转至更新度量学习者步骤,同时将Q插入到P类中并清零,此时度量学习者为最终的度量学习者,P类为最终的类。

【技术特征摘要】
1.低秩约束的在线自监督学习的场景分类方法,其特征在于包括以下步骤:
对离线图像数据进行训练并进行特征提取;进行小批训练来获得一个最初
的度量学习者W0;
依次输入在线数据图像qi并提取图像特征;判断图像特征有无标签;
如果有标签,则更新度量学习者Wi,返回依次输入在线数据图像qi步骤;
如果无标签,则测量该图像与已测的每个有标签训练样本之间的相似度,
利用相似度生成的双向线性图来传播它的标签;然后判断该图像特征向量与样
本的特征向量相似度Sw得分;
如果得分在设定值范围内,则将该图像q插入到队列Q中,当队列Q满时
更新Q,然后转至更新度量学习者步骤,同时将Q插入到P类中并清零,此时
度量学习者为最终的度量学习者,P类为最终的类。
2.根据权利要求1所述的低秩约束的在线自监督学习的场景分类方法,其特征
在于:所述度量学习者为低秩矩阵。

【专利技术属性】
技术研发人员:丛杨宋红玉唐延东
申请(专利权)人:中国科学院沈阳自动化研究所
类型:发明
国别省市:辽宁;21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1