跨领域跨类别的新闻评论情绪预测方法技术

技术编号：10802671 阅读：71 留言：0更新日期：2014-12-24 10:07

本发明专利技术提出了一种跨领域跨类别的新闻评论情绪预测方法。本发明专利技术公开的方法，是在目标领域只有少量的标注数据而在另一相关但不相同的源领域拥有大量的标注数据条件下，通过模拟源领域和目标领域情绪类别集合间关系，实现不同领域间的知识迁移，构建跨领域跨类别的新闻评论情绪预测模型，从而解决目标领域新闻评论的情绪预测问题。在源领域与目标领域为不同情绪类别集合情境下，本发明专利技术的方法显著地优于其他跨领域跨类别在线新闻评论的情绪预测的替代方法，并且极大降低人工标注工作的高昂代价和训练更多分类模型所耗费的精力。本发明专利技术可用于用户情感分析和舆情监督。

全部详细技术资料下载

【技术实现步骤摘要】
【专利摘要】本专利技术提出了一种。本专利技术公开的方法，是在目标领域只有少量的标注数据而在另一相关但不相同的源领域拥有大量的标注数据条件下，通过模拟源领域和目标领域情绪类别集合间关系，实现不同领域间的知识迁移，构建跨领域跨类别的新闻评论情绪预测模型，从而解决目标领域新闻评论的情绪预测问题。在源领域与目标领域为不同情绪类别集合情境下，本专利技术的方法显著地优于其他跨领域跨类别在线新闻评论的情绪预测的替代方法，并且极大降低人工标注工作的高昂代价和训练更多分类模型所耗费的精力。本专利技术可用于用户情感分析和舆情监督。【专利说明】
本专利技术属于web信息检索与挖掘领域，具体涉及异构新闻内容，评论内容，用户情感等多种信息源，对在线新闻评论情绪进行预测的方法。
技术介绍
近年来，随着信息检索、机器学习、自然语言处理领域的快速发展，文本挖掘和情感分析问题引起了研究者的广泛关注。基于监督学习的情感分类方法纷纷涌现，成为了情感分析中的研究热点。如何建立一个在多领域通用的新闻评论情感预测方法，利用一个领域的知识帮助其他领域分类模型的学习，是一个亟待解决的问题。以下将多类情绪划分的情绪分类问题称为"情绪分类（emotion classification) "，区别于二类情感极性划分的"情感倾向性分类"。情感分析需要在当前领域充足的训练数据集建立分类器，但是这往往需要大量的人工标注工作，这种标注工作劳动强度大，十分耗时且代价高昂。因此，为了降低人工标注工作的高昂代价和训练更多分类模型所耗费的精力，构建跨领域的情感分类方法，用某一...

【技术保护点】
跨领域跨类别的新闻评论情绪预测方法，包括如下步骤：第1、对跨领域新闻评论情绪预测问题进行形式化描述定义1：源领域(source domain)和目标领域(target domain)分别为DS和DT；定义2：源领域和目标领域的情绪类别标签集合分别为ES和ET：ES={eS1,eS2,···,eSKS}---(1.1)]]>ET={eT1,eT2,···,eTKT}---(1.2)]]>其中，代表源领域DS的新闻评论中可能表达的用户情绪类别标签，代表DT的新闻评论中可能表达的用户情绪类别标签，ET构成了该目标领域新闻评论情绪分类问题的输出空间；定义3：源领域DS中的新闻评论文档集合CS，其新闻评论的数量充足；目标领域DT中的新闻评论文档集合CT，其新闻评论的数量相对较小：CS={cS(1),cS(2),···,cS(M)}---(1.3)]]>CT={cT(1),cT(2),·&Center...

【技术特征摘要】

【专利技术属性】
技术研发人员：张莹，赵雪，乜鹏，俞力，袁晓洁，
申请(专利权)人：南开大学，
类型：发明
国别省市：天津;12

全部详细技术资料下载我是这个专利的主人