【技术实现步骤摘要】
一种微博热点话题的用户群体情感倾向迁移动态分析方法
本专利技术涉及一种微博热点话题的用户群体情感倾向迁移的动态分析方法,属于数据信息挖掘于分析。
技术介绍
互联网的普及,网络社区的兴起,让人们越来越喜欢在网络社区分享自己的生活、对热点事件的态度与观点。当事件出现在网络上并吸引人们广泛的关注评论后会升级为热点事件,成为热点事件后则更容易吸引人们的关注。当微博用户群体关注到事件,他们会不断的从各个方面不断了解到事件的全貌,在这个了解事件全貌的过程中用户会发表大量的微博文本表达自己对该事件的态度,其中不乏有对公众情绪倾向有较高影响的话题或微博“大V”、名人博客等的加入,从而可能引起整个事件的情感倾向的迁移。找到这些事件,从个人角度讲,可及时维护自身名声利益;从商业角度讲,并根据产品销售后网络群体情绪动态变化的情况及时完善产品和进行口碑维护;从社会角度讲,对网络舆论进行合理引导,营造和谐网络环境。现有的大多数对微博文本处理方法中,基本都是以个人或群体情感分析为主要研究对象,通过关键词识别、词汇关联、统计方法和概念级技术对微博 ...
【技术保护点】
1.一种微博热点话题的用户群体情感倾向迁移动态分析方法,其特征在于,所述的一种微博热点话题的用户群体情感倾向迁移动态分析方法,包括如下步骤:/n(1)采集指定话题下的微博文本并对文本数据进行预处理,包括过滤停用词、分词操作;/n(2)对上诉采集的话题内的微博文本与微博话题的相关性分析,选取与话题相关的文本;/n(3)对部分微博文本进行情感极性标注,利用分类特征对标注微博文本集进行训练并优化,生成SVM情感分类器,对未标注微博文本情感极值进行预测;/n(4)根据步骤(3)中利用SPSS软件得到先前分析的用户群体情感变化曲线图;根据变化曲线图找到图中异常点;/n(5)针对步骤( ...
【技术特征摘要】
1.一种微博热点话题的用户群体情感倾向迁移动态分析方法,其特征在于,所述的一种微博热点话题的用户群体情感倾向迁移动态分析方法,包括如下步骤:
(1)采集指定话题下的微博文本并对文本数据进行预处理,包括过滤停用词、分词操作;
(2)对上诉采集的话题内的微博文本与微博话题的相关性分析,选取与话题相关的文本;
(3)对部分微博文本进行情感极性标注,利用分类特征对标注微博文本集进行训练并优化,生成SVM情感分类器,对未标注微博文本情感极值进行预测;
(4)根据步骤(3)中利用SPSS软件得到先前分析的用户群体情感变化曲线图;根据变化曲线图找到图中异常点;
(5)针对步骤(4)得到的异常点,在其附近按时间对微博文本进行切片分析处理;
(6)如若在步骤(4)中没有发现异常点,则对话题进行热度判断,判断该话题是否已无热度;
(7)动态分析包括以下几步:
1)根据异常点切片处理结果找出引起变化的事件和时间;
2)时间切片的动态分析;
3)时间段的动态获取;
(8)获取新的2小时微博文本后,重复上述步骤;
(9)根据情感趋势折线图,预测未来短时间内情感的可能变化趋势。
2.根据权利要求1所述的一种微博热点话题的用户群体情感倾向迁移动态分析方法,其特征在于:步骤2对微博文本与话题相关性分析主要是利用TF-IDF-SIM法计算微博文本与特定话题的相似程度;对微博文本进行分词之后,统计每个词在微博文本中出现的频率TF和逆文档频率IDF,根据TF-IDF的值来选取靠前的词作为文本关键词,SIM是计算关键词与当前话题词的相似度值。
3.根据权利要求1所述的一种微博热点话题的用户群体情感倾向迁移动态分析方法,其特征在于:步骤(3...
【专利技术属性】
技术研发人员:朱广丽,张梦瑶,朱奥强,徐新燕,张标,张顺香,
申请(专利权)人:安徽理工大学,
类型:发明
国别省市:安徽;34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。