基于多源领域实例迁移的情感分类方法技术

技术编号：9991076 阅读：119 留言：0更新日期：2014-05-02 04:40

本发明专利技术涉及一种基于多源领域实例迁移的情感分类方法，针对TrAdaBoost算法在迁移学习中可能出现的迁移效率降低的现象，引入多源学习，通过尝试从不同的源领域中迁移样本或是结合多个源领域的特点，使得迁移学习更加稳定且有效，给目标样本分配较多的初始权重，来缓解权重不匹配的问题，并且在每一步对数据进行重新采样来改善引用不平衡的现象；针对TrAdaBoost算法中出现的源领域权重过早收敛现象，加入了动态因子，改善权重熵由源样本向目标样本转移的问题。本发明专利技术可以使得与目标领域相关性不大的源领域样本的权重不至于收敛过快，共同帮助学习目标任务，达到对所有源领域知识的充分利用。

全部详细技术资料下载

【技术实现步骤摘要】
【专利摘要】本专利技术涉及一种，针对TrAdaBoost算法在迁移学习中可能出现的迁移效率降低的现象，引入多源学习，通过尝试从不同的源领域中迁移样本或是结合多个源领域的特点，使得迁移学习更加稳定且有效，给目标样本分配较多的初始权重，来缓解权重不匹配的问题，并且在每一步对数据进行重新采样来改善引用不平衡的现象；针对TrAdaBoost算法中出现的源领域权重过早收敛现象，加入了动态因子，改善权重熵由源样本向目标样本转移的问题。本专利技术可以使得与目标领域相关性不大的源领域样本的权重不至于收敛过快，共同帮助学习目标任务，达到对所有源领域知识的充分利用。【专利说明】
本专利技术涉及一种。
技术介绍
迁移学习根据不同任务间的相似性，将源领域数据向目标领域迁移，实现对已有知识的利用，使传统的从零开始学习变成可积累的学习，并且提高了学习效率，其最大的特点就是利用相关领域的知识来帮助完成目标领域的学习任务。源领域和目标领域中相关知识的表达方式有很多，可分为样本实例、特征映射、模型参数和关联规则，针对不同的知识表达方式选择恰当的迁移学习方法是保障目标领域学习的前提。对于知识表达为样本实例的研究，重在对源领域中的数据进行加权选择，然后将胜出部分数据用于目标任务的学习过程中。其基本思想是，尽管辅助训练样本和源领域中的训练样本会有些不同，但是辅助训练样本中应该还是会存在一部分比较适合用来训练一个有效的分类模型的样本。假设源领域中存在一部分实例是可以被重新利用的，这些实例可以帮助目标任务的学习。通常，重新利用这一部分实例的方法是对实例权重进行重新加权，权重大的实例对新任务的...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员：张倩，李海港，张勇，
申请(专利权)人：中国矿业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人