一种半监督的特征变换方法和装置制造方法及图纸

技术编号:9694703 阅读:80 留言:0更新日期:2014-02-21 01:02
本发明专利技术实施例提供一种半监督的特征变换方法和装置,其中,所述方法包括:根据预定的标签数据集中的各个标签数据的标签向量和特征向量,确定每一个标签数据与其他标签数据的关系Wll;根据预定的非标签数据集中的各个非标签数据的特征向量,确定每一个非标签数据与其他非标签数据的关系Wuu;根据所述预定的标签数据集中的各个标签数据的标签向量和特征向量,以及所述预定的非标签数据集中的各个非标签数据的特征向量,确定每一个标签数据与每一个非标签数据的关系Wlu;根据所述Wll、Wuu以及Wlu;确定特征变换矩阵,根据该特征变换矩阵进行半监督的特征变换。通过本发明专利技术实施例的方法和装置,提高了特征变换的效率,得到了更有效的特征变换结果。

【技术实现步骤摘要】
一种半监督的特征变换方法和装置
本专利技术涉及特征变换,尤其涉及一种半监督的特征变换方法和装置。
技术介绍
特征变换是数据分类的关键技术。在数据分类任务中,数据,如图像或文本,通常都是在环绕欧氏空间的子流形上采样得到的,它们的原始特征不适合于在欧氏空间上分析。此外,数据原始特征经常具有较高维度,分类方法将会遇到维数灾(参考文献1)。因此为了得到较好的数据分类结果,一般都需要预先进行特征变换。然而,大多数特征变换方法需要大量的标签数据,而获取如此多的标签数据费时费力;相比之下,非标签数据更容易获得,利用这些非标签数据以得到更好的特征变换技术显得越来越为重要。基于子空间的半监督局部保持投影方法(Subspacesemi-supervisedlocalitypreservingprojection,SSLPP)是最近提出的一种半监督局部保持特征变换方法(参考文献2)。它首先在所有数据上找到一个子空间,然后在子空间上利用标签数据的原始特征和标签信息构建一个标签相邻无向图,并利用所有数据的原始特征和标签数据的标签信息构建一个完全相邻无向图,最后最小化标签相邻无向图和完全相邻无向图的拉普拉斯项以求得投影变换矩阵。然而,专利技术人在实现本专利技术的过程中发现,上述方法并没有充分考虑标签数据与非标签数据之间的相互关系,而且它也不适用于多标签数据。参考文献1.R.BellmanandR.Kalaba.Onadaptivecontrolprocesses,IRETransactionsonAutomaticControl,vol.4,1959.参考文献2.W.Y.Yang,S.W.Zhang,andW.Liang.Agraphbasedsubspacesemi-supervisedlearningframeworkfordimensionalityreduction,664-677,2008.应该注意,上面对技术背景的介绍只是为了方便对本专利技术的技术方案进行清楚、完整的说明,并方便本领域技术人员的理解而阐述的。不能仅仅因为这些方案在本专利技术的
技术介绍
部分进行了阐述而认为上述技术方案为本领域技术人员所公知。
技术实现思路
本专利技术实施例的主要目的在于提供一种半监督的特征变换方法,以提高特征变换的效率,得到更有效的特征变换结果。本专利技术实施例的上述目的是通过如下技术方案实现的:根据本专利技术实施例的第一方面,提供了一种半监督的特征变换方法,其中,所述方法包括:第一确定步骤,其根据预定的标签数据集中的各个标签数据的标签向量和特征向量,确定每一个标签数据与其他标签数据的关系Wll;第二确定步骤,其根据预定的非标签数据集中的各个非标签数据的特征向量,确定每一个非标签数据与其他非标签数据的关系Wuu;第三确定步骤,其根据所述预定的标签数据集中的各个标签数据的标签向量和特征向量,以及所述预定的非标签数据集中的各个非标签数据的特征向量,确定每一个标签数据与每一个非标签数据的关系Wlu;特征变换步骤,其根据所述Wll、Wuu以及Wlu,确定特征变换矩阵,根据该特征变换矩阵进行半监督的特征变换。根据本专利技术实施例的第二方面,提供了一种特征变换装置,其中,所述特征变换装置包括:第一确定单元,其根据预定的标签数据集中的各个标签数据的标签向量和特征向量,确定每一个标签数据与其他标签数据的关系Wll;第二确定单元,其根据预定的非标签数据集中的各个非标签数据的特征向量,确定每一个非标签数据与其他非标签数据的关系Wuu;第三确定单元,其根据所述预定的标签数据集中的各个标签数据的标签向量和特征向量,以及所述预定的非标签数据集中的各个非标签数据的特征向量,确定每一个标签数据与每一个非标签数据的关系Wlu;特征变换单元,其根据所述Wll、Wuu以及Wlu,确定特征变换矩阵,根据该特征变换矩阵进行半监督的特征变换。根据本专利技术实施例的第三方面,提供了一种分类器,其中,所述分类器包括前述的特征变换装置。通过本专利技术实施例的方法和装置,在特征变换过程中,能保持标签数据中的判别信息,非标签数据中隐含的内在几何结构以及标签数据和非标签数据之间的相互作用,同时考虑了多标签数据中存在的标签关联,由此提高了特征变换的效率,得到了更有效的特征变换结果。参照后文的说明和附图,详细公开了本专利技术的特定实施方式,指明了本专利技术的原理可以被采用的方式。应该理解,本专利技术的实施方式在范围上并不因而受到限制。在所附权利要求的精神和条款的范围内,本专利技术的实施方式包括许多改变、修改和等同。针对一种实施方式描述和/或示出的特征可以以相同或类似的方式在一个或更多个其它实施方式中使用,与其它实施方式中的特征相组合,或替代其它实施方式中的特征。应该强调,术语“包括/包含”在本文使用时指特征、整件、步骤或组件的存在,但并不排除一个或更多个其它特征、整件、步骤或组件的存在或附加。附图说明参照以下的附图可以更好地理解本专利技术的很多方面。附图中的部件不是成比例绘制的,而只是为了示出本专利技术的原理。为了便于示出和描述本专利技术的一些部分,附图中对应部分可能被放大或缩小。在本专利技术的一个附图或一种实施方式中描述的元素和特征可以与一个或更多个其它附图或实施方式中示出的元素和特征相结合。此外,在附图中,类似的标号表示几个附图中对应的部件,并可用于指示多于一种实施方式中使用的对应部件。在附图中:图1是本专利技术实施例的特征变换方法的流程图;图2是图1的方法中确定标签数据和标签数据之间的关系的方法流程图;图3是图1的方法中确定非标签数据和非标签数据之间的关系的方法流程图;图4是图1的方法中确定标签数据和非标签数据之间的关系的方法流程图;图5是图1的方法中确定特征变换矩阵的方法流程图;图6是本专利技术实施例的特征变换装置的组成示意图;图7是图6中第一确定单元的组成示意图;图8是图6中第二确定单元的组成示意图;图9是图6中第三确定单元的组成示意图;图10是图6中特征变换单元的组成示意图。具体实施方式参照附图,通过下面的说明书,本专利技术实施例的前述以及其它特征将变得明显。这些实施方式只是示例性的,不是对本专利技术的限制。为了使本领域的技术人员能够容易地理解本专利技术的原理和实施方式,本专利技术实施例以半监督的局部保持投影特征变换方法为例进行说明,但可以理解,本专利技术实施例并不限于上述局部保持投影特征变换,涉及半监督的特征变换方法均包含于本专利技术的保护范围。下面参照附图对本专利技术的优选实施方式进行说明。实施例1本专利技术实施例提供了一种半监督的特征变换方法。图1是该方法的流程图,请参照图1,该方法包括:第一确定步骤101,其根据预定的标签数据集中的各个标签数据的标签向量和特征向量,确定每一个标签数据与其他标签数据的关系Wll;第二确定步骤102,其根据预定的非标签数据集中的各个非标签数据的特征向量,确定每一个非标签数据与其他非标签数据的关系Wuu;第三确定步骤103,其根据所述预定的标签数据集中的各个标签数据的标签向量和特征向量,以及所述预定的非标签数据集中的各个非标签数据的特征向量,确定每一个标签数据与每一个非标签数据的关系Wlu;特征变换步骤104,其根据所述Wll、Wuu以及Wlu,确定特征变换矩阵,根据该特征变换矩阵进行半监督的特征变换。在本实施例中,给定标签数据集L={(x1,y1)本文档来自技高网
...
一种半监督的特征变换方法和装置

【技术保护点】
一种半监督的特征变换方法,其中,所述方法包括:第一确定步骤,其根据预定的标签数据集中的各个标签数据的标签向量和特征向量,确定每一个标签数据与其他标签数据的关系Wll;第二确定步骤,其根据预定的非标签数据集中的各个非标签数据的特征向量,确定每一个非标签数据与其他非标签数据的关系Wuu;第三确定步骤,其根据所述预定的标签数据集中的各个标签数据的标签向量和特征向量,以及所述预定的非标签数据集中的各个非标签数据的特征向量,确定每一个标签数据与每一个非标签数据的关系Wlu;特征变换步骤,其根据所述Wll、Wuu以及Wlu,确定特征变换矩阵,根据该特征变换矩阵进行半监督的特征变换。

【技术特征摘要】
1.一种半监督的特征变换方法,其中,所述方法包括:第一确定步骤,其根据预定的标签数据集中的各个标签数据的标签向量和特征向量,确定每一个标签数据与其他标签数据的关系Wll;第二确定步骤,其根据预定的非标签数据集中的各个非标签数据的特征向量,确定每一个非标签数据与其他非标签数据的关系Wuu;第三确定步骤,其根据所述预定的标签数据集中的各个标签数据的标签向量和特征向量,以及所述预定的非标签数据集中的各个非标签数据的特征向量,确定每一个标签数据与每一个非标签数据的关系Wlu;特征变换步骤,其根据所述Wll、Wuu以及Wlu,确定特征变换矩阵,根据该特征变换矩阵进行半监督的特征变换,其中,所述特征变换步骤包括:基于局部保持投影方法,利用所述Wll形成初始目标函数;在所述初始目标函数上加入所述Wuu和所述Wlu所形成的正则项,形成目标函数;根据以上目标函数确定特征变换矩阵,根据该特征变换矩阵进行半监督的特征变换,其中,所述目标函数为:其中,a为所需求的最后变换投影向量;α为一个线性组合参数,0≤α≤1;β为大于1的系数;Xl为所有标签数据的原始特征向量组合成的特征矩阵;Xu为所有非标签数据的原始特征向量组合成的特征矩阵;Dll=diag(sum(Wll));Luu=Duu-Wuu,其中,Duu=diag(sum(Wuu));Dl=diag(sum(Wlu));2.根据权利要求1所述的方法,其中,所述第一确定步骤包括:确定每一个标签数据的相关标签数据;从所述每一个标签数据的相关标签数据中选择第一预定数量的相关标签数据作为当前标签数据的最相关的标签数据;根据所述每一个标签数据及其最相关的标签数据,确定所述每一个标签数据与其他标签数据的关系Wll。3.根据权利要求2所述的方法,其中,确定每一个标签数据的相关标签数据的步骤包括:根据标签数据的标签向量,或者根据标签数据的标签向量和先验标签关联矩阵,计算当前标签数据和各个其他标签数据之间的标签相似度;如果所述标签相似度大于预定门限,则确定所述其他标签数据是该当前标签数据的相关标签数据。4.根据权利要求2所述的方法,其中,从所述每一个标签数据的相关标签数据中选择第一预定数量的相关标签数据作为当前标签数据的最相关的标签数据的步骤包括:根据该当前标签数据的相关标签数据与该当前标签数据的距离,对该当前...

【专利技术属性】
技术研发人员:刘曦刘汝杰
申请(专利权)人:富士通株式会社
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1