【技术实现步骤摘要】
一种基于样本选择的域自适应降维方法
本专利技术涉及面向机器学习领域的域自适应技术,具体是一种基于样本选择的域自适应降维学习方法。
技术介绍
在解决标准的机器学习和模式识别的任务时,需要大量的已标记样本进行建模。但是,采集有标签的数据样本在很多情况下需要耗费大量的人力物力。域自适应学习,可以将数据跨域关联起来:在域自适应学习中存在源域和目标域,利用来自源域的标记样本学习目标域中未标记的样本。换句话说,域自适应学习在域间传递知识,使得在目标域中也能解决学习任务。另外,传统的降维方法都有一个共同的前提假设——所有的样本来自于同一特征空间或具有相同的分布。域自适应学习解决了数据样本具有不同分布的问题:源域和目标域具有不同却相关的分布。域自适应学习的目的就是缩小源域与目标域之间的差异。从目标域数据是否含有标签来看,域自适应学习分为两种,一种为无监督的域自适应学习,即目标域数据无标签。一种为半监督的域自适应学习,即有部分的目标域数据有标签。本专利技术针对无监督的域自适应学习方法。域自适应的研究现状中,可以分为两大方法:样本层面的方法和特征层面的方法。样本层面的方法分为两类:基 ...
【技术保护点】
1.一种基于样本选择的域自适应降维方法,其特征在于:A.令
【技术特征摘要】
1.一种基于样本选择的域自适应降维方法,其特征在于:A.令和分别表示源域和目标域数据样本,其中Ns表示源域样本个数,Nt表示目标域样本个数,D为高维空间的维度;Xs和Xt具有不同且相关的数据分布;学习投影矩阵W,把源域和目标域数据共同映射到一个低维的潜在子空间,通过匹配降维后源域和目标域之间的类条件概率分布和边缘概率分布差异,得到源域和目标域数据在低维子空间中相应的数据表示和其中d(d<<D)为低维空间的维度;用最大均值差异(MaximumMeanDiscrepancy简称MMD)测量域间的分布差异,源域和目标域间的边缘概率分布差异记为MMDu(Ys,Yt);为目标域数据添加伪标签,源域和目标域间类条件概率分布差异为MMDc(Ys,Yt),最小化源...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。