【技术实现步骤摘要】
一种基于情感极性增强语义的跨领域情感分析方法本专利技术属于文本分析领域,涉及一种跨领域情感分析方法,更为具体地是涉及一种情感文本共享词的选择以及基于共享词的情感语义增强方法。
技术介绍
情感文本指的是带有主观情感倾向的文本。对文本的情感倾向进行分析,是舆情监控、口碑分析、话题监控等应用的重要技术基础。跨领域情感分析,研究的是在情感带有主题相关性和领域相关性、以及目标领域样本稀疏的条件下,如何充分利用相关源领域样本进行分析的技术问题。解决跨领域情感文本分析的关键是缩小源领域和目标领域之间的差异,将源领域的知识迁移到目标领域中,帮助目标领域建立预测模型,并尽可能地提高预测的性能。目前跨领域情感分析主要的技术方案可以分为三类,基于词典的方法,基于传统的机器学习方法以及基于深度学习的方法。基于词典的方法缺点是受词典的影响。基于传统的机器学习方法,不仅要求事先从情感文本中提取文本特征,而且这个分析的过程依赖经验和特定任务,例如谭松波等“一种跨领域的文本情感分类器的训练方法和分类方法”(2014年03月12日公布,授权公告号为CN101714135B的中国专利技术专利)。基于传统的 ...
【技术保护点】
一种基于情感极性增强语义的跨领域情感分析方法,该方法的特征在于包括:S1、提取源领域和目标领域中的情感文本的词项集合
【技术特征摘要】
1.一种基于情感极性增强语义的跨领域情感分析方法,该方法的特征在于包括:S1、提取源领域和目标领域中的情感文本的词项集合WS和WT,并转化成词向量表VS和VT;S2、在WS∩WT中对词频大于预设阀值的词项,计算词项的情感极性值,计算领域间词项的语义一致性因子,通过情感极性值筛选典型的正面情感词和负面情感词,再基于词项的语义一致性因子进一步筛选并获得共享词;S3、基于共享词的情感极性增强语义;S4、基于卷积神经网络自动提取文本的情感特征,并完成目标领域情感文本分类。2.根据权利要求1所述的一种基于情感极性增强语义的跨领域情感分析方法,其特征在于所述的词向量是通过现有的神经网络模型Word2Vec训练得出。3.根据权利要求1所述的一种基于情感极性增强语义的跨领域情感分析方法,其特征在于步骤S2中所述的每一个词项的情感...
【专利技术属性】
技术研发人员:姬晨,李维华,王翔,郭延哺,段云浩,
申请(专利权)人:云南大学,
类型:发明
国别省市:云南,53
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。