【技术实现步骤摘要】
一种基于朴素贝叶斯的用户对能源价格调整情感分析方法
:
[0001]本专利技术涉及能源舆情分析领域,尤其涉及使用朴素贝叶斯方法对能源价格领域的舆情分析方法。
技术介绍
:
[0002]随着互联网的蓬勃发展,网络平台每日产生海量的个人言论,其中包含人们的各种情感倾向。这些大量的评论中含有用户的主观情感,其中蕴藏着丰富的现实意义和巨大的商业价值,而文本情感分析技术可以用来挖掘这些价值。
[0003]文本情感分析是自然语言领域的一个重要研究方向,涉及语言学、统计学、心理学、人工智能等领域的理论和方法。情感分析的主要目的就是挖掘用户对产品、新闻、热点事件等评论信息所持有的观点和态度。情感分析技术主要分为情感词典和机器学习。情感词典虽然简单但是无法适应互联网内容的快速变化,基于词典的文本情感分析技术由于构建的词典往往只针对某个领域,对于跨领域情感分析的效果不够好,而且词典中的情感词可能不够丰富,影响判断的准确率。
[0004]在能源舆情领域,进行用户对能源价格调整的情感分析,可以及时的了解事件的动态,对错误、失实的舆论进行 ...
【技术保护点】
【技术特征摘要】
1.一种基于朴素贝叶斯的用户对能源价格调整情感分析方法,其特征在于:包括步骤:S1:样本评论数据收集阶段,使用网络爬虫收集能源价格相关新闻的评论数据;S2:样本评论数据预处理阶段,使用人工标签、分词、去停用词操作手段,结合情感词典,对样本评论文本进行预处理,根据样本评论文本构建词表,并对样本评论文本进行向量化操作;S3:样本评论文本分析阶段,使用朴素贝叶斯的机器学习方法,进行用户对能源价格调整的情感分析。2.根据权利要求1所述的一种基于朴素贝叶斯的用户对能源价格调整情感分析方法,其特征在于:包括步骤:S4:样本评论网民对待文章总体情感趋势分析阶段,使用样本评论总体情感趋势计算公式,进行用户对能源价格调整的情感分析。3.根据权利要求1所述的一种基于朴素贝叶斯的用户对能源价格调整情感分析方法,其特征在于:所述样本评论数据收集阶段具体步骤:S11:使用Scrapy搭建网络爬虫,爬取能源价格新闻相关评论数据;S12:将爬取的评论数据汇总建立样本评论数据库。4.根据权利要求3所述的一种基于朴素贝叶斯的用户对能源价格调整情感分析方法,其特征在于:所述爬取的能源价格新闻相关评论数据为点赞数、评论文本。5.根据权利要求1所述的一种基于朴素贝叶斯的用户对能源价格调整情感分析方法,其特征在于:所述样本评论数据预处理阶段具体步骤:S21:采用人工标注的方式标签样本评论数据库,按照情感类型对样本评论数据库中的评论文本进行标签分类;S22:针对样本评论数据库中已经标签分类的评论文本,使用中文分词技术对标签分类后的评论文本进行分词操作和对标签分类后的评论文本进行去停用词操作;S23:标签分类后的评论文本经分词和去停用词操作后,形成情感类型完整的数据集;所述情感类型完整的数据集包括积极的正面性、消极的负面性、单纯叙述的中性三种情感类型的数据集;S24:将建立的情感类型完整的数据集与现有的情感词典进行比对,建立正中负性情感词库;S25:将情感类型完整的数据集进行划分,划分为训练集和测试集;S26:获取训练集中所有不重复的词语构成列表,构建词表;S27:对训练集的每个样本根据词表构建训练集词向量,对测试集的每个样本根据词表构建测试集词向量。6.根...
【专利技术属性】
技术研发人员:沈俊,陈星莺,徐少山,徐田园,高新强,李振兴,王浩,李珂,
申请(专利权)人:中国科学院理化技术研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。