The depth of transfer learning method of the invention is to provide a large data cross domain analysis, according to the joint distribution of difference and classification error rate, determine the depth of loss function value of the network, the distribution difference between the joint probability distribution between all tasks related to the joint probability distribution layer between all tasks related to joint distribution difference as the source domain and the corresponding the features and the label and the target domain in the corresponding feature and label; and based on the value of loss function, the parameter update depth of the network, so that the depth of the network adapter to the target domain; learning in depth on the migration process network, part of the joint distribution as a function of depth of network loss difference the values of the parameters, by updating the depth of the network, while ensuring the accuracy of the source domain to achieve the source domain and the target domain of the joint distribution, i.e. The migration ability of all task related layers is improved, which will bring better effect to the learning of the migration of the depth network in different fields.
【技术实现步骤摘要】
一种大数据跨领域分析的深度迁移学习方法
本专利技术涉及计算机数据分析
,更具体地,涉及一种大数据跨领域分析的深度迁移学习方法。
技术介绍
机器学习在大量标记的数据上进行监督式训练可以获得很好的性能和效果,然而大型的标记数据集在数量和应用领域方面均有限,且手动标记足量的训练数据往往需要高昂的代价。因此当面对标记数据稀缺的目标任务时,如何利用与目标域相关但服从不同概率分布的源域中已有的标记数据,来构建一个有效的学习器,就具有很强的现实需求。在源域数据和目标域数据之间存在分布偏移时学习判别式模型的范式称为迁移学习。迁移学习试图构建能够在服从不同概率分布的领域间泛化的学习器,使得在目标域缺少标记数据的情况下仍然可以结合源域的标记数据进行学习以完成对目标域数据的处理,在计算机视觉和自然语言处理等领域有着广泛的应用。数据满足独立同分布是统计数据分析的基础,而在迁移学习问题中,源域数据与目标域数据的特征分布存在偏差,在实际应用中,数据特征和标签的联合概率分布也将会在领域间显著偏移,这使迁移学习问题更加具有挑战性;迁移学习的主要技术难点在于如何学习到在领域间迁移能力较好的特征与结构,降低领域间的概率分布差异。利用深度神经网络学习的抽象特征具有较好的可迁移性,能够泛化到新任务上以提升迁移学习的效果。但对于深度网络的上层,其迁移能力会随着领域间差异的扩大而显著下降,而深度网络的上层往往是用于拟合样本特性的任务相关层,任务相关层的迁移能力的下降,会影响深度网络在不同领域间迁移学习的效果。
技术实现思路
为了克服上述问题或者至少部分地解决上述问题,本专利技术提供一种大数据跨领域 ...
【技术保护点】
一种大数据跨领域分析的深度迁移学习方法,其特征在于,包括:确定第一联合概率分布与第二联合概率分布之间的联合分布差异,所述第一联合概率分布为源域的样本在深度网络的所有任务相关层中的特征以及标签之间的联合概率分布,所述第二联合概率分布为目标域的样本在所述深度网络的所有任务相关层中的特征以及标签之间的联合概率分布,所述任务相关层为所述深度网络的上层;确定对所述源域的样本的分类错误率;根据所述联合分布差异和所述分类错误率,确定所述深度网络的损失函数的值;基于所述损失函数的值,更新所述深度网络的参数,以使所述深度网络适配所述目标域。
【技术特征摘要】
1.一种大数据跨领域分析的深度迁移学习方法,其特征在于,包括:确定第一联合概率分布与第二联合概率分布之间的联合分布差异,所述第一联合概率分布为源域的样本在深度网络的所有任务相关层中的特征以及标签之间的联合概率分布,所述第二联合概率分布为目标域的样本在所述深度网络的所有任务相关层中的特征以及标签之间的联合概率分布,所述任务相关层为所述深度网络的上层;确定对所述源域的样本的分类错误率;根据所述联合分布差异和所述分类错误率,确定所述深度网络的损失函数的值;基于所述损失函数的值,更新所述深度网络的参数,以使所述深度网络适配所述目标域。2.根据权利要求1所述的方法,其特征在于,所述确定第一联合概率分布与第二联合概率分布之间的联合分布差异,包括:确定所述第一联合概率分布,确定所述第二联合概率分布;通过计算所述第一联合概率分布和所述第二联合概率分布在可再生核希尔伯特空间中的核嵌入之间的欧式距离的平方,获取所述联合分布差异;其中,联合概率分布在可再生核希尔伯特空间中的核嵌入的表达式如下:其中,x表示样本在任务相关层中的特征,φ(x)表示样本在任务相关层中的特征在可再生核希尔伯特空间的映射函数,ΩX表示样本在任务相关层中的特征的定义域,y表示标签,ψ(y)表示标签在可再生核希尔伯特空间的映射函数,ΩY表示标签的定义域,P(x,y)表示样本在任务相关层中的特征以及标签之间的联合概率分布。3.根据权利要求2所述的方法,其特征在于,所述确定第一联合概率分布,包括:将所述源域的样本输入到所述深度网络作正向传播,获取所述源域的样本在所述深度网络的每一任务相关层中的特征;将所述源域的样本在所述深...
【专利技术属性】
技术研发人员:龙明盛,王建民,树扬,黄向东,
申请(专利权)人:清华大学,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。