一种面向多用户微博的情感引发原因标注方法及系统技术方案

技术编号:20159969 阅读:72 留言:0更新日期:2019-01-19 00:12
本发明专利技术涉及一种面向多用户微博的情感引发原因标注方法及系统,包括如下步骤:自动获取微博数据,构建中文微博语料库;根据微博情感引发原因的表示形式,设计一套完整的微博情感引发原因标注方法;设计一套基于图像界面的标注系统,用以加快微博情感引发原因的标注;利用所述标注系统对所述语料库中语料进行人工标注,得到标注语料库。本发明专利技术能够从包含多用户的中文微博中标注出该微博所含情感的原因。

【技术实现步骤摘要】
一种面向多用户微博的情感引发原因标注方法及系统
本专利技术涉及自然语言处理领域,特别是涉及一种面向多用户微博的情感引发原因标注方法及系统。
技术介绍
情感是人类共同经历中最基本的一项,而且大多数人类活动是由情感所驱动或导致的。因此,情感分析在诸如意见分析和心理分析等各类实际应用中具有很大的价值。在自然语言处理领域,有两种主要的情感分析:倾向性分析和情感分析。因为倾向性分析中的极性驱动方法经常被批评为过于笼统而不能满足一些现实生活中的应用,例如制定决策,所以研究人员已经开始探索更细腻的情感感受,例如快乐与悲伤。目前已经有很多情感分析的研究,但大部分研究都仅在于对情感的分类,例如快乐、悲伤、害怕和生气。事实上,情感分析是一个很复杂的概念。除了情感的分类这种表面层次的信息之外,情感分析往往涉及很多深层信息,如情绪原因,情绪的结果。随着社交媒体的发展,人们越来越多的依赖社交媒体进行情感的表达与交流,最普遍的是微博、产品评论这种短文本的交流。为了更好对文本的情感进行分析,故提出了情感引发原因标注方法。中文微博可以有两种用户结构:单用户和多用户。单用户微博(以用户为中心)和多用户同一微博(以原微本文档来自技高网...

【技术保护点】
1.一种面向多用户微博的情感引发原因标注方法及系统,包括如下步骤:自动获取微博数据,构建中文微博语料库;设计一套完整的微博情感引发原因标注方法;根据所述微博情感引发原因表示形式,设计一套基于图像界面的标注系统,用以加快微博情感引发原因的标注;利用所述标注系统对所述语料库中语料进行人工标注,得到标注语料库。

【技术特征摘要】
1.一种面向多用户微博的情感引发原因标注方法及系统,包括如下步骤:自动获取微博数据,构建中文微博语料库;设计一套完整的微博情感引发原因标注方法;根据所述微博情感引发原因表示形式,设计一套基于图像界面的标注系统,用以加快微博情感引发原因的标注;利用所述标注系统对所述语料库中语料进行人工标注,得到标注语料库。2.根据权利要求1所述的一种面向多用户微博的情感引发原因标注方法及系统,其特征在于,自动获取微博数据,构建中文微博语料库,具体包括:自动从新浪微博网站中收集微博内容;对每一条微博,提取其中的用户名称信息、原微博内容、转发微博内容等信息;采用统一的格式保存到数据库中,得到一个中文微博语料库。3.根据权利要求1所述的一种面向多用户微博的情感引发原因标注方法及系统,其特征在于,设计一套完整的微博情感引发原因标注方法,具体包括:针对微博文本的多用户现象,设计一个完整的微博情感引发原因表示形式。该表示形式包括四个要素:情绪关键词、情感类型、情感发出者、情感引发原因;为最大程度地减少标注者的主观因素,设计一套规范的...

【专利技术属性】
技术研发人员:陈瑛程曦瑶侯文俊
申请(专利权)人:中国农业大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1