一种基于深度稀疏自编码机的迁移学习方法技术

技术编号:17467981 阅读:54 留言:0更新日期:2018-03-15 05:20
本发明专利技术公开了一种基于深度稀疏自编码机的迁移学习方法,包括:(1)数据集向量化的前期预处理。(2)模型设计和实现。(3)应用Stacked RICA算法得到的提取特征做半监督学习。(4)特征提取完后,用logistic回归分析模型(LR)在训练集上训练分类器。(5)用训练集上的分类器在测试集上做分类预测。(6)完成在测试集上的分类,得到最终的迁移学习结果。本发明专利技术提高了特征提取的效果,提升了迁移学习的精度,具有较高的鲁棒性和实用性。

【技术实现步骤摘要】
一种基于深度稀疏自编码机的迁移学习方法
本专利技术涉及特征提取和迁移学习方法领域,具体是一种基于深度稀疏自编码机的迁移学习方法。
技术介绍
传统的机器学习已经在很多领域取得了显著的成果。然而很多机器学习算法是基于“训练集和测试集是同源、独立同分布”的假设,当数据集分布改变的时候,大多数机器学习需要重新抓取数据,这就需要重新收集大量训练数据。在真实世界的应用中,环境是经常改变的,重新收集数据、为学习系统每次遇到的新情景重新训练模型,成本非常高昂且是不现实的。我们希望学习系统可以用很少的重训练数据和重训练时间,自动的适应环境的变化。在这种情况下,从前一种情景下获取并可以应用到新场景中的迁移知识,会帮助我们提速学习过程,减少收集新训练数据的成本,达到迁移学习的目标。迁移学习强调了跨域,跨任务和跨分布的知识转移,这些知识是相似但不是相同的。举例来说,学习认识苹果可能会帮助学习梨子,或者说学习弹奏电子琴可能会帮助学习钢琴。迁移学习的研究,实质上是出于人们总是把原有的知识应用到更快的解决新的问题上去。近年来,深度学习(DeepLearning)应用在图像、文本、音频等领域中提取特征取得了很多进步本文档来自技高网...
一种基于深度稀疏自编码机的迁移学习方法

【技术保护点】
一种基于深度稀疏自编码机的迁移学习方法,其特征在于:依次包括以下步骤:(1)、对图像数据库中的所有图像进行白化预处理,过程如下:(1.1)、将输入数据集表示为{x

【技术特征摘要】
1.一种基于深度稀疏自编码机的迁移学习方法,其特征在于:依次包括以下步骤:(1)、对图像数据库中的所有图像进行白化预处理,过程如下:(1.1)、将输入数据集表示为{x(1),x(2),...,x(n)},计算出x的协方差矩阵再计算出协方差矩阵的特征向量,按列组成矩阵U如下公式所示:矩阵U中,u1是主特征向量,其对应最大的特征值,u2是次特征向量,以此类推,并记λ1,λ2,...,λn为矩阵U中各向量相应的特征值;(1.2)、用计算出的矩阵U表示输入数据如下公式所示:其中下标rot指的是rotation,表示这是由原数据经过旋转处理后所得到的结果,为了使每个输入特征具有单位方差,使用作为缩放因子来缩放每个特征xrot,i,其中从而得到PCA白化后的数据表示如下公式所示:(1.3)、设R是任意正交矩阵,即满足RRT=RTR=I,那么RxPCAwhite仍然具有单位协方差,为了对于所有可能的R进行白化处理后的输入数据尽可能的接近原始输入数据,令R=U,得到公式(1):xZCAwhite=UxPCAwhite(1),xZCAwhite即ZCA白化后得到的原始输入数据的处理数据;(2)、构建深度稀疏自编码机模型提取图像高层次抽象特征,过程如下:(2.1)、构建稀疏自编码机模型,包括以下步骤:(2.1.1)、稀疏自编码机模型使用ReconstructionIndependentComponentAnalysis算法即RICA算法,用公式(1)获得的xZCAwhite为RICA算法的输入数据,并代入代价函数式(2):代价函数式(2)中,x为输入数据即xZCAwhite,W为加权矩阵;(2.1.2)、对代价函数式(2)求关于x的偏导,其中对代价函数式(2)的第一项求偏导时,采用作为偏导函数,得到的偏导函数如式(3)所示:(2.1.3)、利用L-FBGS算法,迭代计算加权矩阵W,得到训练完成的稀疏自编码模型。(2.2)、构建深度稀疏自编码机模型:将步骤(2.1)得到的加权矩阵W代入代价函数式(2)中,得到的输出记为是单层RICA模型训练完成后得到的输出数据,将作为输入数据,重复步骤(2.1...

【专利技术属性】
技术研发人员:胡学钢张玉红朱毅李培培周鹏
申请(专利权)人:合肥工业大学
类型:发明
国别省市:安徽,34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1