当前位置: 首页 > 专利查询>苏州大学专利>正文

一种基于鲁棒学习模型的图像分类方法与图像分类系统技术方案

技术编号:12872578 阅读:73 留言:0更新日期:2016-02-17 10:25
本发明专利技术公开了一种基于鲁棒学习模型的图像分类方法与图像分类系统,包括:对训练集进行初始化,得到初始类别标签矩阵,训练集中的训练样本包括已知其类别并标定有与其类别对应的类别标签的样本及未知其类别且未标定类别标签的样本;基于近邻定义及重构权的构造方法对训练样本进行处理,根据样本间的相似性,构造重构系数矩阵,并进行对称化、归一化处理;利用重构系数矩阵及初始类别标签矩阵确定无标定样本的软标签,采用迭代的方式对训练样本的软标签进行l2,1范数正则化,得到投影矩阵及软标签矩阵;利用投影矩阵对待测样本进行映射,得到其软标签;待测样本为未知其类别且未标定类别的样本。提高了分类准确性。

【技术实现步骤摘要】

本专利技术涉及模式识别和数据挖掘
,更具体地说,涉及一种鲁棒学习模型 与图像分类系统。
技术介绍
随着计算机技术和智能化的不断发展,图像分类技术已经发展成为数据挖掘、机 器学习等领域最重要的研究课题之一。图像分类技术所属的分类技术主要用来判断未知类 别的数据的类别,在医疗数据分析、文本、网页及信用卡评级等领域都有重大意义,因此,将 精确的分类技术投入使用能够带来巨大的社会与经济效益。多项研究证明监督型学习方法 的性能明显优于无监督型学习方法,但在现实世界中,用于监督型学习方法的监督数据往 往难以获得,且通过人工标定的方式获得监督数据的类别信息将耗费大量的时间和人力, 从而使其实用性大大降低。从而,基于相似图构造的半监督学习因其实用性与分类精确性 已然发展成为实用且普遍的分类工具之一,半监督型学习主要通过对大量数据中每一个类 别中少量数据的类别进行标定,再将其通过相似图传播给未知类别的数据,进而预测出未 知类别的数据的类别。 近年来,半监督学习中基于标签传播理论的标签传播法因其简单、有效、快速的优 点,成为半监督学习的典型代表之一。标签传播法通过对样本之间的相似性进行学习,将监 督到的有标签样本(即已知其类别的样本)的类别信息传播给无标签样本(即未知其类别 的样本),进而估计出无标签样本的类别信息。目前大多标签传播法都采用软标签作为无标 签样本的分类结果,然而专利技术人发现,在采用软标签作为无标签样本的分类结果的标签传 播法中,有标签样本对应的原始空间往往含有混合信号,而这些混合信号会对无标签样本 的分类造成不良影响,进而导致无标签样本的分类结果并不准确。 综上所述,现有技术中存在由于原始空间的混合信号的影响导致无标签样本的分 类结果准确性较低的问题。
技术实现思路
本专利技术的目的是提供一种鲁棒学习模型与图像分类系统,以解决现有技术中存在 的由于原始空间的混合信号的影响导致无标签样本的分类结果准确性较低的问题。 为了实现上述目的,本专利技术提供如下技术方案: -种鲁棒学习模型,包括: 对预先获取的训练集进行初始化,得到初始类别标签矩阵,其中,所述训练集包括 预设量的训练样本,所述训练样本包括已知其类别并标定有与其类别对应的类别标签的样 本及未知其类别且未标定有类别标签的样本; 基于近邻定义及重构权的构造方法对所述训练样本进行处理,得到与所述训练样 本对应的相似度量矩阵,对所述相似度量矩阵进行预设处理,得到重构系数矩阵; 基于所述重构系数矩阵及所述初始类别标签矩阵,通过有效平衡流形平滑项与标 签拟合项确定未标定类别标签的训练样本的软标签,采用迭代的方式对所述训练样本的软 标签进行12>1范数正则化,得到投影矩阵及与所述训练样本的软标签对应的软标签矩阵; 利用所述投影矩阵对待测样本进行映射,得到所述待测样本的软标签;其中,所述 待测样本为未知其类别且未标定类别标签的样本。 优选的,所述基于近邻定义及重构权的构造方法对所述训练样本进行处理,得到 与所述训练样本对应的相似度量矩阵,包括: 利用K近邻算法对每个所述训练样本进行处理,得到每个训练样本的K个最近邻 样本,K为正整数; 采用LLE-重构权的构造方法利用所述训练样本及每个所述训练样本的K个最近 邻样本获取与所述训练样本对应的相似度量矩阵。 优选的,所述对所述相似度量矩阵进行预设处理,得到重构系数矩阵,包括: 对所述相似度量矩阵进行归一化处理及对称化处理,得到所述重构系数矩阵。 优选的,利用所述投影矩阵对待测样本进行映射,得到所述待测样本的软标签,包 括: 获取待测样本x_; 利用Ρτχ_将所述待测样本X_嵌入到投影矩阵P中,得到预测向量; 确定所述预测向量中最大概率的元素对应的软标签即为所述待测样本x_的软标 签。 优选的,所述对预先获取的训练集进行初始化,得到初始类别标签矩阵,包括: 获取初始化矩阵,用¥。= 表示,所述训练集用 表示,其中,表示η乘以1+u的矩阵空间,\为标定有类别标签的样本,Χ^= ,η、1及u均为正整 数; 确定所述初始化矩阵中的任一yi为一列向量,任一列向量对应所述训练集中的第 i个训练样本Xi,i= 1,2, · · ·,1+u; 对于任一标定有类别标签的训练样本\,如果该训练样本X]属于第i类别,则确定 yi、j= 1,如果该训练样本L不属于第i类别,则确定yi、j= 〇 ;对于任一未标定有类别标签 的训练样本确定yi、j= 〇,获得初始类别标签矩阵Y,其中,j= 1,2,...,1+u。 优选的,所述基于近邻定义及重构权的构造方法对所述训练样本进行处理,得到 与所述训练样本对应的相似度量矩阵,包括: 利用下列公式获取所述相似度量矩阵: 其中,Ν(χ,?表示训练样本\的K个最近邻样本,q与K相对应,< 为当前训练样 本\的重构系数向量,表征其近邻\£胃(馬)在重构训练样本\时的贡献程度,#表示对应 的相似性重构系数矩阵。 优选的,所述采用迭代的方式对所述训练样本的软标签进行12>1范数正则化,得到 投影矩阵及与所述训练样本的软标签对应的软标签矩阵,包括: 利用下列公式获取投影矩阵及软标签矩阵: subj0,eTft=1fori= 1, 2, . . . , 1+u 其中,F表示软标签矩阵,P表示投影矩阵,W表示重构系数矩阵,D表示对角矩阵, 且D"=Σ乂,,F=r,f1表示#的第i行向量,乂>_#表示回归残余项,所述回归残余项 用来衡量XTP与软标签FT的差异程度;μdα,β,γ为对应的权衡参数; 或者,利用下列公式获取投影矩阵及软标签矩阵: subjF多 0,eTF=eT 其中,Ω=I-WT_W+WTW,I为单位矩阵,其只有对角元素非零且均为1 ;U表示一个 对角矩阵,其第i个对角元素为μi,对于标定有标签的训练样本,μi设置为+ 0,对于未标 定有类别标签的训练样本,μi设置为〇。 一种图像分类系统,包括: 预处理模块,用于对预先获取的训练集进行初始化,得到初始类别标签矩阵,其 中,所述训练集包括预设量的训练样本,所述训练样本包括已知其类别并标定有与其类别 对应的类别标签的样本及未知其类别且未标定有类别标签的样本;以及用于基于近邻定 义及重构权的构造方法对所述训练样本进行处理,得到与所述训练样本对应的相似度量矩 阵,对所述相似度量矩阵进行预设处理,得到重构系数矩阵; 训练模块,用于基于所述重构系数矩阵及所述初始类别标签矩阵,通过有效平衡 流形平滑项与标签拟合项确定未标定类别标签的训练样本的软标签,采用迭代的方式对所 述训练样本的软标签进行1 2>1范数正则化,得到投影矩阵及与所述训练样本的软标签对应 的软标签矩阵; 预测模块,用于利用所述投影矩阵对待测样本进行映射,得到所述待测样本的软 标签;其中,所述待测样本为未标定类别标签的样本。 优选的,所述预处理模块包括:K近邻单元,用于利用K近邻算法对每个所述训练样本进行处理,得到每个训练样 本的Κ个最近邻样本,Κ为正整数;LLE-重构权单元,用于采用LLE-重构权的构造方法利用每个所述训练样本的Κ个 最近邻样本获取与所述训练样本对应的相似度量矩阵。 优选的,所述预处理模块包括: 预设处理单元,用于对所述相似度量矩阵进行归一化本文档来自技高网
...

【技术保护点】
一种鲁棒学习模型,其特征在于,包括:对预先获取的训练集进行初始化,得到初始类别标签矩阵,其中,所述训练集包括预设量的训练样本,所述训练样本包括已知其类别并标定有与其类别对应的类别标签的样本及未知其类别且未标定有类别标签的样本;基于近邻定义及重构权的构造方法对所述训练样本进行处理,得到与所述训练样本对应的相似度量矩阵,对所述相似度量矩阵进行预设处理,得到重构系数矩阵;基于所述重构系数矩阵及所述初始类别标签矩阵,通过有效平衡流形平滑项与标签拟合项确定未标定类别标签的训练样本的软标签,采用迭代的方式对所述训练样本的软标签进行l2,1范数正则化,得到投影矩阵及与所述训练样本的软标签对应的软标签矩阵;利用所述投影矩阵对待测样本进行映射,得到所述待测样本的软标签;其中,所述待测样本为未知其类别且未标定类别标签的样本。

【技术特征摘要】

【专利技术属性】
技术研发人员:张召江威明李凡长张莉
申请(专利权)人:苏州大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1