一种舆情监测方法、终端及存储介质技术

技术编号:21090102 阅读:45 留言:0更新日期:2019-05-11 10:09
本发明专利技术涉及数据处理领域,尤其涉及一种舆情监测方法、终端及存储介质。本发明专利技术通过预设时间间隔采集舆情信息,并将每一时间点采集的舆情信息与预设的预警知识库进行匹配,从而可清晰获知不同时间点舆情的要点信息,进而可根据一时间段内不同时间点对应的要点信息快速得出舆情的发展趋势,实现了监测舆情的发展过程。

A Public Opinion Monitoring Method, Terminal and Storage Media

【技术实现步骤摘要】
一种舆情监测方法、终端及存储介质
本专利技术涉及数据处理领域,尤其涉及一种舆情监测方法、终端及存储介质。
技术介绍
现有基于互联网数据建立的企业舆情监测系统,一般通过语义分析的方法,从互联网的贴文信息中提取出敏感词,再通过LDA(LatentDirichletAllocation)主题模型等方法建立热点事件。针对热点事件进行情感分析,查看网民对事件是持正面观点,还是负面观点。如果多数网民所持的为负面观点,则进行预警。这种预警系统主要依靠的是网民的观点情绪。还有一种常见的网络舆情监测系统,通过参考负面消息发布网站的权威性,被转发的次数等进行预警。也就是说,如果在权威网站上存在企业的负面消息,或者有关企业负面消息的网文被大量转载,则进行预警。以上两种方法,尽管预警了企业的经营风险,但对舆情事件的发展描述不够充分,无法详细获知舆情的发展过程,不利于分析人员进行详细分析。
技术实现思路
本专利技术所要解决的技术问题是:如何监测舆情的发展过程。为了解决上述技术问题,本专利技术采用的技术方案为:本专利技术提供一种舆情监测方法,包括:S1、预设时间间隔获取两条以上舆情信息,并记录采集所述舆情信息的时间点;一所述时间点对应一所述舆情信息;S2、分词两条以上所述舆情信息,得到两个以上舆情信息分词集合;S3、分别匹配两个以上所述舆情信息分词集合与预设的预警知识库,得到两个以上匹配结果;所述预警知识库存储两个以上关键词;S4、输出每一所述时间点对应的所述匹配结果。进一步地,还包括:S5、获取一舆情信息分词集合;S6、获取所述一舆情信息分词集合中出现次数大于预设阈值的分词,得到高频分词集合;S7、重复执行所述S5至所述S6,直至所有所述舆情信息分词集合被遍历。进一步地,所述S3之前,还包括:根据采集所述舆情信息的时间点排列所述舆情信息分词集合;删除一舆情信息分词集合中与前一舆情信息分词集合重复的分词。进一步地,所述S2之前,还包括:删除两条以上所述舆情信息中无意义的字符。进一步地,所述S3具体为:S31、为所述预警知识库中的每一关键词设置一词组积分值;S32、获取一舆情信息分词集合;S33、若所述一舆情信息分词集合中存在所述预警知识库存储的关键词时,计算与所述一舆情信息分词集合对应的预警积分;获取所述一舆情信息分词集合对应的时间点,得到当前时间点;计算当前时间点对应的预警积分与所述当前时间点之前的每一时间点对应的预警积分的和,得到所述匹配结果;计算所述预警积分的公式为:其中,Y为所述预警积分,Nj为所述一舆情信息分词集合,Nji为所述一舆情信息分词集合中排序第i个的词组,Sji为排序第i个的词组在所述预警知识库中对应的词组积分值,αji为排序第i个的词组的衰减系数;S34、重复执行S32至S33,直至所有舆情信息分词集合被遍历。本专利技术还提供一种计算机可读存储介质,其上存储有程序,所述程序在被计算机执行时执行上述舆情监测方法。本专利技术另提供一种舆情监测终端,包括一个或多个处理器及存储器,所述存储器存储有程序,并且被配置成由所述一个或多个处理器执行以下步骤:S1、预设时间间隔获取两条以上舆情信息,并记录采集所述舆情信息的时间点;一所述时间点对应一所述舆情信息;S2、分词两条以上所述舆情信息,得到两个以上舆情信息分词集合;S3、分别匹配两个以上所述舆情信息分词集合与预设的预警知识库,得到两个以上匹配结果;所述预警知识库存储两个以上关键词;S4、输出每一所述时间点对应的所述匹配结果。进一步地,还包括:S5、获取一舆情信息分词集合;S6、获取所述一舆情信息分词集合中出现次数大于预设阈值的分词,得到高频分词集合;S7、重复执行所述S5至所述S6,直至所有所述舆情信息分词集合被遍历。进一步地,所述S3之前,还包括:根据采集所述舆情信息的时间点排列所述舆情信息分词集合;删除一舆情信息分词集合中与前一舆情信息分词集合重复的分词。进一步地,所述S2之前,还包括:删除两条以上所述舆情信息中无意义的字符。进一步地,所述S3具体为:S31、为所述预警知识库中的每一关键词设置一词组积分值;S32、获取一舆情信息分词集合;S33、若所述一舆情信息分词集合中存在所述预警知识库存储的关键词时,计算与所述一舆情信息分词集合对应的预警积分;获取所述一舆情信息分词集合对应的时间点,得到当前时间点;计算当前时间点对应的预警积分与所述当前时间点之前的每一时间点对应的预警积分的和,得到所述匹配结果;计算所述预警积分的公式为:其中,Y为所述预警积分,Nj为所述一舆情信息分词集合,Nji为所述一舆情信息分词集合中排序第i个的词组,Sji为排序第i个的词组在所述预警知识库中对应的词组积分值,αji为排序第i个的词组的衰减系数;S34、重复执行S32至S33,直至所有舆情信息分词集合被遍历。本专利技术的有益效果在于:本专利技术通过预设时间间隔采集舆情信息,并将每一时间点采集的舆情信息与预设的预警知识库进行匹配,从而可清晰获知不同时间点舆情的要点信息,进而可根据一时间段内不同时间点对应的要点信息快速得出舆情的发展趋势,实现了监测舆情的发展过程。附图说明图1为本专利技术提供的一种舆情监测方法的具体实施方式的流程框图;图2为本专利技术提供的一种舆情监测终端的具体实施方式的结构框图;标号说明:1、处理器;2、存储器。具体实施方式为详细说明本专利技术的
技术实现思路
、所实现目的及效果,以下结合实施方式并配合附图予以说明。请参照图1以及图2,如图1所示,本专利技术提供一种舆情监测方法,包括:S1、预设时间间隔获取两条以上舆情信息,并记录采集所述舆情信息的时间点;一所述时间点对应一所述舆情信息;S2、分词两条以上所述舆情信息,得到两个以上舆情信息分词集合;S3、分别匹配两个以上所述舆情信息分词集合与预设的预警知识库,得到两个以上匹配结果;所述预警知识库存储两个以上关键词;S4、输出每一所述时间点对应的所述匹配结果。进一步地,还包括:S5、获取一舆情信息分词集合;S6、获取所述一舆情信息分词集合中出现次数大于预设阈值的分词,得到高频分词集合;S7、重复执行所述S5至所述S6,直至所有所述舆情信息分词集合被遍历。由上述描述可知,获取出现次数大于预设阈值的分词,有利于分析人员直观地看到某一时间点舆情的要点信息。进一步地,所述S3之前,还包括:根据采集所述舆情信息的时间点排列所述舆情信息分词集合;删除一舆情信息分词集合中与前一舆情信息分词集合重复的分词。由上述描述可知,删除之前时间点已出现过的分词,有利于分析人员清晰直观地看出舆情的发展变化和趋势。进一步地,所述S2之前,还包括:删除两条以上所述舆情信息中无意义的字符。由上述描述可知,可提高舆情发展情况分析的效率和准确度。进一步地,所述S3具体为:S31、为所述预警知识库中的每一关键词设置一词组积分值;S32、获取一舆情信息分词集合;S33、若所述一舆情信息分词集合中存在所述预警知识库存储的关键词时,计算与所述一舆情信息分词集合对应的预警积分;获取所述一舆情信息分词集合对应的时间点,得到当前时间点;计算当前时间点对应的预警积分与所述当前时间点之前的每一时间点对应的预警积分的和,得到所述匹配结果;计算所述预警积分的公式为:其中,Y为所述预警积分,Nj为所述一舆情信息分词集合,Nji为所述一本文档来自技高网
...

【技术保护点】
1.一种舆情监测方法,其特征在于,包括:S1、预设时间间隔获取两条以上舆情信息,并记录采集所述舆情信息的时间点;一所述时间点对应一所述舆情信息;S2、分词两条以上所述舆情信息,得到两个以上舆情信息分词集合;S3、分别匹配两个以上所述舆情信息分词集合与预设的预警知识库,得到两个以上匹配结果;所述预警知识库存储两个以上关键词;S4、输出每一所述时间点对应的所述匹配结果。

【技术特征摘要】
1.一种舆情监测方法,其特征在于,包括:S1、预设时间间隔获取两条以上舆情信息,并记录采集所述舆情信息的时间点;一所述时间点对应一所述舆情信息;S2、分词两条以上所述舆情信息,得到两个以上舆情信息分词集合;S3、分别匹配两个以上所述舆情信息分词集合与预设的预警知识库,得到两个以上匹配结果;所述预警知识库存储两个以上关键词;S4、输出每一所述时间点对应的所述匹配结果。2.根据权利要求1所述的舆情监测方法,其特征在于,还包括:S5、获取一舆情信息分词集合;S6、获取所述一舆情信息分词集合中出现次数大于预设阈值的分词,得到高频分词集合;S7、重复执行所述S5至所述S6,直至所有所述舆情信息分词集合被遍历。3.根据权利要求1所述的舆情监测方法,其特征在于,所述S3之前,还包括:根据采集所述舆情信息的时间点排列所述舆情信息分词集合;删除一舆情信息分词集合中与前一舆情信息分词集合重复的分词。4.根据权利要求1所述的舆情监测方法,其特征在于,所述S2之前,还包括:删除两条以上所述舆情信息中无意义的字符。5.根据权利要求1所述的舆情监测方法,其特征在于,所述S3具体为:S31、为所述预警知识库中的每一关键词设置一词组积分值;S32、获取一舆情信息分词集合;S33、若所述一舆情信息分词集合中存在所述预警知识库存储的关键词时,计算与所述一舆情信息分词集合对应的预警积分;获取所述一舆情信息分词集合对应的时间点,得到当前时间点;计算当前时间点对应的预警积分与所述当前时间点之前的每一时间点对应的预警积分的和,得到所述匹配结果;计算所述预警积分的公式为:其中,Y为所述预警积分,Nj为所述一舆情信息分词集合,Nji为所述一舆情信息分词集合中排序第i个的词组,Sji为排序第i个的词组在所述预警知识库中对应的词组积分值,αji为排序第i个的词组的衰减系数;S34、重复执行S32至S33,直至所有舆情信息分词集合被遍历。6.一种计算机可读存储介质,其上存储有程序,所述程序在被计算机执行时执行如权利要求1-5中任一项所述的...

【专利技术属性】
技术研发人员:陈捷栾江霞左军王仁斌
申请(专利权)人:厦门市美亚柏科信息股份有限公司
类型:发明
国别省市:福建,35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1