一种基于样本选择的域自适应降维方法技术

技术编号：21834002 阅读：51 留言：0更新日期：2019-08-10 18:30

本发明专利技术涉及机器学习中域自适应相关问题，提出了一种基于样本选择的域自适应降维算法。为了减少源域和目标域之间的数据分布差异，学习一个降维矩阵，把源域和目标域数据投影到一个低维子空间中。首先在源域和目标域样本中寻找一个子集，该子集中的样本是对衡量域间数据分布差异比较重要的样本，把这些样本叫做地标样本，利用地标样本匹配域间差异。在对投影矩阵进行优化时，本发明专利技术把投影矩阵看做是格雷斯曼流形上的点，把在欧式空间中的约束优化问题转化为格雷斯曼流形上的无约束优化问题，利用格雷斯曼流形上的共轭梯度法求解投影矩阵。交替优化投影矩阵和地标样本直至达到最大迭代次数，使域间差异达到最小。

A Domain Adaptive Dimension Reduction Method Based on Sample Selection

全部详细技术资料下载

【技术实现步骤摘要】
一种基于样本选择的域自适应降维方法
本专利技术涉及面向机器学习领域的域自适应技术，具体是一种基于样本选择的域自适应降维学习方法。
技术介绍
在解决标准的机器学习和模式识别的任务时，需要大量的已标记样本进行建模。但是，采集有标签的数据样本在很多情况下需要耗费大量的人力物力。域自适应学习，可以将数据跨域关联起来：在域自适应学习中存在源域和目标域，利用来自源域的标记样本学习目标域中未标记的样本。换句话说，域自适应学习在域间传递知识，使得在目标域中也能解决学习任务。另外，传统的降维方法都有一个共同的前提假设——所有的样本来自于同一特征空间或具有相同的分布。域自适应学习解决了数据样本具有不同分布的问题：源域和目标域具有不同却相关的分布。域自适应学习的目的就是缩小源域与目标域之间的差异。从目标域数据是否含有标签来看，域自适应学习分为两种，一种为无监督的域自适应学习，即目标域数据无标签。一种为半监督的域自适应学习，即有部分的目标域数据有标签。本专利技术针对无监督的域自适应学习方法。域自适应的研究现状中，可以分为两大方法：样本层面的方法和特征层面的方法。样本层面的方法分为两类：基...

【技术保护点】
1.一种基于样本选择的域自适应降维方法，其特征在于：A.令

【技术特征摘要】
1.一种基于样本选择的域自适应降维方法，其特征在于：A.令和分别表示源域和目标域数据样本，其中Ns表示源域样本个数，Nt表示目标域样本个数，D为高维空间的维度；Xs和Xt具有不同且相关的数据分布；学习投影矩阵W，把源域和目标域数据共同映射到一个低维的潜在子空间，通过匹配降维后源域和目标域之间的类条件概率分布和边缘概率分布差异，得到源域和目标域数据在低维子空间中相应的数据表示和其中d(d＜＜D)为低维空间的维度；用最大均值差异(MaximumMeanDiscrepancy简称MMD)测量域间的分布差异，源域和目标域间的边缘概率分布差异记为MMDu(Ys,Yt)；为目标域数据添加伪标签，源域和目标域间类条件概率分布差异为MMDc(Ys,Yt)，最小化源...

【专利技术属性】
技术研发人员：马争鸣，光毓，刘希，
申请(专利权)人：中山大学，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人