【技术实现步骤摘要】
网络舆情分析方法、装置及存储介质
本专利技术涉及计算机
,尤其涉及一种网络舆情分析方法、电子装置及计算机可读存储介质。
技术介绍
网络舆情是指在网络上流行的对社会事件不同看法的网络舆论,是社会舆论的一种表现形式。近年来,网络舆情对生活秩序和社会稳定的影响与日俱增,一些重大的网络舆情事件使人们开始认识到网络对社会监督起到的巨大作用。同时,网络舆情突发事件如果处理不当,极有可能诱发民众的不良情绪,引发群众的违规和过激行为,进而对社会稳定构成威胁。因此,对于网络舆情状态的监测就变得尤为重要。目前舆情系统大多是通过舆情分析师筛选舆情,然后对系统进行跟踪,从而对事件在影响力上对其舆情状态有一个大致的判断,但是这种方案存在监测媒体源不够全面的缺陷,且无法直观地了解到网络舆情的舆情状态,进而导致无法及时准确地进行预警。
技术实现思路
本专利技术提供一种网络舆情分析方法、电子装置及计算机可读存储介质,其主要目的在于提高对舆情的监控预警能力。为实现上述目的,本专利技术提供一种网络舆情分析方法,该方法包括:通过网络爬虫从预设的数据渠道采集与第一预设关键词相关的舆情文章,对所述舆情文章进行分词处理,得到每篇舆情文章对应的词汇集合;分别将每篇舆情文章对应的词汇集合与多个第二预设关键词进行匹配,根据匹配结果为每篇舆情文章标注与第二预设关键词对应的第一标签;根据预设分析规则,计算所述舆情文章的情感得分,判断所述舆情文章的情感倾向,并为所述舆情文章标注第二标签;根据所述第一标签,统计每个第一标签对应的舆情文章的总数,根据所述第二标签,统计每个第一标签对应负面舆情文章的数量;及分别计算 ...
【技术保护点】
1.一种网络舆情分析方法,应用于电子装置,其特征在于,该方法包括:通过网络爬虫从预设的数据渠道采集与第一预设关键词相关的舆情文章,对所述舆情文章进行分词处理,得到每篇舆情文章对应的词汇集合;分别将每篇舆情文章对应的词汇集合与多个第二预设关键词进行匹配,根据匹配结果为每篇舆情文章标注与第二预设关键词对应的第一标签;根据预设分析规则,计算所述舆情文章的情感得分,判断所述舆情文章的情感倾向,并为所述舆情文章标注第二标签;根据所述第一标签,统计每个第一标签对应的舆情文章的总数,根据所述第二标签,统计每个第一标签对应负面舆情文章的数量;及分别计算每个第一标签对应的负面舆情影响力及总舆情影响力,并计算每个第一标签的舆情健康度。
【技术特征摘要】
1.一种网络舆情分析方法,应用于电子装置,其特征在于,该方法包括:通过网络爬虫从预设的数据渠道采集与第一预设关键词相关的舆情文章,对所述舆情文章进行分词处理,得到每篇舆情文章对应的词汇集合;分别将每篇舆情文章对应的词汇集合与多个第二预设关键词进行匹配,根据匹配结果为每篇舆情文章标注与第二预设关键词对应的第一标签;根据预设分析规则,计算所述舆情文章的情感得分,判断所述舆情文章的情感倾向,并为所述舆情文章标注第二标签;根据所述第一标签,统计每个第一标签对应的舆情文章的总数,根据所述第二标签,统计每个第一标签对应负面舆情文章的数量;及分别计算每个第一标签对应的负面舆情影响力及总舆情影响力,并计算每个第一标签的舆情健康度。2.如权利要求1所述的网络舆情分析方法,其特征在于,所述“根据预设分析规则,计算所述舆情文章的情感得分,判断所述舆情文章的情感倾向”的步骤包括:采用聚类算法对所述舆情文章进行聚类分析,生成多个观点主题,根据观点主题包含的舆情文章的词向量计算观点主题的词向量;及将观点主题的词向量输入到预先训练好的情感评分模型中,输出观点主题的情感得分;及根据情感得分确定观点主题对应的舆情文章所属的情感倾向。3.如权利要求2所述的网络舆情分析方法,其特征在于,所述“分别计算每个第一标签对应的负面舆情影响力及总舆情影响力”的步骤包括:分别获取所述多个第一标签对应的每篇舆情文章的发布媒体信息,根据发布媒体信息确定每个第一标签对应的每篇舆情文章对应的媒体权重指数及媒体级别指数;根据每个第一标签对应的负面舆情文章的媒体权重指数及媒体级别指数,计算每个第一标签对应的负面舆情文章的负面舆情影响力;及根据每个第一标签对应的舆情文章的媒体权重指数及媒体级别指数,计算每个第一标签对应的舆情文章的总舆情影响力。4.如权利要求3所述的网络舆情分析方法,其特征在于,所述负面舆情影响力的计算公式为为:其中,INp表示第一标签p对应的M1p篇负面舆情文章的负面舆情影响力,αi表示第一标签p对应的不同负面舆情文章i的媒体权重指数,βi表示第一标签p对应的不同负面舆情文章i的的媒体级别指数;所述总舆情影响力的计算公式为:其中,ITp表示第一标签p对应的M2p篇舆情文章的总舆情影响力,αi表示第一标签p对应的不同舆情文章i的媒体权重指数,βi表示第一标签p对应的不同舆情文章i的的媒体级别指数;及所述舆情健康度的计算公式为:H=(1-INp/ITp)*10其中,INp表示第一标签p对应的M1p篇负面舆情文章的负面舆情影响力,ITp表示第一标签p对应的M2p篇舆情文章的总舆情影响力。5.如权利要求1至4中任意一项所述的网络舆情分析方法...
【专利技术属性】
技术研发人员:李温键,盛瑞生,高巍华,张兆轶,苑利慧,陆柏含,
申请(专利权)人:中国平安保险集团股份有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。