舆情评论信息的情感分析方法、装置及存储介质制造方法及图纸

技术编号:20221781 阅读:48 留言:0更新日期:2019-01-28 20:17
本发明专利技术提供一种舆情评论信息的情感分析方法,包括:采集与舆情事件相关的舆情文章,并获取关于该舆情文章的多条初始评论信息;对每条初始评论信息进行分词得到每条初始评论信息对应的词汇集合,从所述多条初始评论信息中过滤掉预设类型的初始评论信息,得到关于该舆情事件的目标评论信息;将所述目标评论信息对应的词汇集合分别与多个预设关键词库进行匹配,根据匹配结果将所述目标评论信息划分至多个集合;及,确定目标评论信息对应的情感类别,并为其标注相应标签。本发明专利技术还提出一种电子装置及存储介质。利用本发明专利技术对舆情事件的评论信息进行情感分析,便于用户及时了解评论信息情感状态,有助于用户针对舆情事件进行相应决策。

【技术实现步骤摘要】
舆情评论信息的情感分析方法、装置及存储介质
本专利技术涉及计算机
,尤其涉及一种舆情评论信息的情感分析方法、电子装置及计算机可读存储介质。
技术介绍
网络舆情是指在网络上流行的对社会事件不同看法的网络舆论,是社会舆论的一种表现形式。主要是以网络为载体,以事件为核心,公众对该事件的情感、态度、意见、观点的表达、传播与互动,以及后续影响力的集合。通过网络传播公众对现实生活中某些热点、焦点问题所持的有较强影响力、倾向性的言论和观点。网络舆情的表现方式多种多样,例如:新闻评论、论坛帖子、微博博文、微信文章等。而针对网络舆情各网民发布的评论信息可以充分表达其对舆情事件的观点态度。近年来,网络舆情对生活秩序和社会稳定的影响与日俱增,一些重大的网络舆情事件使人们开始认识到网络对社会监督起到的巨大作用。同时,网络舆情突发事件如果处理不当,极有可能诱发民众的不良情绪,引发群众的违规和过激行为,进而对社会稳定构成威胁。因此,对于网络舆情状态的监测就变得较为重要,需要对网络舆情的情感倾向,尤其是网友观点,进行分析。目前舆情系统主要舆情文章进行分析,鲜有对舆情文章的评论信息进行分析,故网民针对舆情事件本文档来自技高网...

【技术保护点】
1.一种舆情评论信息的情感分析方法,应用于电子装置,其特征在于,该方法包括:S1、利用网络爬虫从预设的数据渠道采集与舆情事件相关的舆情文章,并获取关于该舆情文章的多条初始评论信息;S2、对每条初始评论信息进行分词得到每条初始评论信息对应的词汇集合,根据预设的筛选规则从所述多条初始评论信息中过滤掉预设类型的初始评论信息,得到关于该舆情事件的目标评论信息;S3、将所述目标评论信息对应的词汇集合分别与多个预设关键词库进行匹配,根据匹配结果将所述目标评论信息划分至多个集合;及S4、根据所述多个集合与情感类别的映射关系,分别确定每个集合中目标评论信息对应的情感类别,并为所述目标评论信息标注相应标签。

【技术特征摘要】
1.一种舆情评论信息的情感分析方法,应用于电子装置,其特征在于,该方法包括:S1、利用网络爬虫从预设的数据渠道采集与舆情事件相关的舆情文章,并获取关于该舆情文章的多条初始评论信息;S2、对每条初始评论信息进行分词得到每条初始评论信息对应的词汇集合,根据预设的筛选规则从所述多条初始评论信息中过滤掉预设类型的初始评论信息,得到关于该舆情事件的目标评论信息;S3、将所述目标评论信息对应的词汇集合分别与多个预设关键词库进行匹配,根据匹配结果将所述目标评论信息划分至多个集合;及S4、根据所述多个集合与情感类别的映射关系,分别确定每个集合中目标评论信息对应的情感类别,并为所述目标评论信息标注相应标签。2.如权利要求1所述的舆情评论信息的情感分析方法,其特征在于,所述“根据预设的筛选规则从所述多条初始评论信息中过滤掉预设类型的初始评论信息,得到关于该舆情事件的目标评论信息”的步骤包括:分别统计每条初始评论信息的字数,过滤掉字数低于字数阈值的初始评论信息,得到第一评论信息集;统计所述第一评论信息集中每条初始评论信息的重复次数,过滤掉重复次数高于重复次数阈值的评论信息,得到第二评论信息集;及分别将所述第二评论信息集中的每条初始评论信息对应的词汇集合与预设词库进行匹配,并计算所述第二评论信息集中每条初始评论信息对应的匹配率,删除第二评论信息集中匹配率高于匹配率阈值的初始评论信息,得到关于该舆情事件的目标评论信息。3.如权利要求1所述的舆情评论信息的情感分析方法,其特征在于,所述步骤S3包括:将所述目标评论信息对应的词汇集合中的词汇分别与预设的第一关键词库、第二关键词库进行匹配;当所述目标评论信息的词汇集合中存在与所述第一关键词库匹配的词汇时,将所述目标评论划分至第一集合;当所述目标评论信息的词汇集合中存在与所述第二关键词库匹配的词汇时,将所述目标评论划分至第二集合;当所述目标评论的词汇集合中同时存在与所述第一关键词库、第二关键词库匹配的词汇时,将所述目标评论划分至第三集合;或当所述目标评论信息的词汇集合中既不存在与所述第一关键词库匹配的词汇、又不存在与所述第二关键词库匹配的词汇时,将所述目标评论划分至第四集合。4.如权利要求3所述的舆情评论信息的情感分析方法,其特征在于,所述“为所述目标评论信息标注相应标签”的步骤包括:确定所述第一集合中的目标评论信息为正面评论信息,为所述第一集合中的目标评论信息标记“正面”标签;确定所述第二集合中的目标评论信息为负面评论信息,为所述第二集合中的目标评论信息标记“负面”标签;确定所述第三集合中的目标评论信息为敏感评论信息,为所述第三集合中的目标评论信息标记“敏感”标签;及确定所述第四集合中的目标评论信息为中性评论信息,为所述第四集合中的目标评论信息标记“中立”标签。5.如权利要求4所述的舆情评论信息的情感分析方法,其特征在于,该方法还包括:接收对所述目标评论信息所属情感类别的修改信息,并更新该目标评论信息对应的情感类别。6.如权利要求1-5所述的舆情评论信息的情感分析方法,其特征在于,所述步骤S3和步骤S4可以替换为...

【专利技术属性】
技术研发人员:张兆轶盛瑞生高巍华苑利慧陆柏含李温键
申请(专利权)人:中国平安保险集团股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1