一种基于数据库同步的舆情分析系统优化方法技术方案

技术编号:10311521 阅读:184 留言:0更新日期:2014-08-13 14:31
本发明专利技术公开了一种基于数据库同步的舆情分析系统优化方法,在数据库同步环节对数据进行筛选,通过控制进入舆情分析系统的数据,进行舆情分析系统优化;在采集信息导入舆情分析系统时,在数据同步模块中加入舆情包含词库、舆情排除词库信息,把数据库模块中的信息分词后,先后比对这两个词库中的词汇,若这条信息的词汇里有舆情包含词库词汇且没有舆情排除词库的词汇,则这条信息是舆情信息导入到舆情分析系统里,这样减小了舆情分析系统数据量的压力,提升了分析灵敏度和分析结果的准确性。

【技术实现步骤摘要】

本专利技术涉及舆情分析系统,具体地说是一种基于数据库同步的舆情分析系统优化方法
技术介绍
舆情系统一般包括舆情采集系统、舆情分析系统、舆情展示系统。舆情采集系统会把用户关注的某些门户网站或某类题材,如新闻、论坛不加过滤得都抓取到系统中。通过数据同步模块,把采集到的数据导入到舆情分析系统里。再经过分析系统处理,把采集到的数据进行分类、聚类操作,形成专题、关注点,并通过舆情展示系统直观得展现给用户。因此如果在数据同步时,把不经过滤的采集信息全部导入分析系统里,会导致导入很多非舆情的信息。这部分信息不但加大了舆情分析系统的分析数据量压力,而且杂乱无章的采集信息降低了专题、关注点等方面分析结果的准确性;同时,舆情展示系统会显示出很多用户并不关心内容,影响用户体验。
技术实现思路
针对目前技术存在的不足之处,本专利技术提出了一种基于数据库同步的舆情分析系统优化方法。 本专利技术所述一种基于数据库同步的舆情分析系统优化方法,解决上述技术问题采用的技术方案如下:所述基于数据库同步的舆情分析系统优化方法,适用于舆情系统的优化,在数据库同步环节对数据进行筛选,通过控制进入舆情分析系统的数据,进行舆情分析系统优化;所述舆情分析系统优化方法提出了一种优化舆情分析系统,所述优化舆情分析系统的体系结构包括:数据库模块、数据同步模块和舆情分析系统;其中, 所述数据库模块是存储舆情信息的模块,所述数据库模块为舆情采集系统的一部分,是最终存储采集信息的模块; 所述数据同步模块是数据库模块和舆情分析系统的桥梁,通过该数据同步模块把舆情信息传送到舆情分析系统里;所述数据同步模块中包括分词库、舆情包含词库、舆情排除词库,所述舆情包含词库里是一些典型舆情词汇,所述舆情排除词库里是一些典型的非舆情词汇; 所述舆情分析系统提供舆情分析功能; 所述舆情分析系统优化方法,在采集信息导入舆情分析系统时,加入了信息筛选过滤操作,只往舆情分析系统中导入筛选出的舆情信息;即在数据库同步时,在数据同步模块中加入舆情包含词库、舆情排除词库信息,对采集信息进行词汇对比过滤,通过在这两种不同的词库之间过滤信息的逻辑关系,把数据库模块中的信息筛选过滤出来,只把通过筛选的舆情信息导入到舆情分析系统里,进行舆情分析,这样减小了舆情分析系统的压力,并提升了舆情分析的效率和准确性。 本专利技术所述一种基于数据库同步的舆情分析系统优化方法具有的有益效果: 本专利技术所述基于数据库同步的舆情分析系统优化方法,在数据库同步时添加舆情词库信息,将采集信息导入舆情分析系统时,加入了信息筛选过滤操作,只导入舆情信息进入舆情分析系统,减小了舆情分析系统数据量的压力,提升了分析灵敏度和分析结果的准确性。 附图说明 附图1为原有的数据同步模块和舆情分析系统连接的示意图; 附图2为基于数据库同步的舆情分析系统优化方法的实施流程图。 具体实施方式 为使本专利技术的目的、技术方案和优点更加清楚明白,下文中将结合附图对本专利技术的一种基于数据库同步的舆情分析系统优化方法进行详细说明。 本专利技术所述基于数据库同步的舆情分析系统优化方法,适用于舆情系统的优化,在数据库同步环节对数据进行筛选,通过控制进入舆情分析系统的数据,提升了舆情分析效率和准确性;所述舆情分析系统优化方法提出了一种优化舆情分析系统,所述优化舆情分析系统的体系结构包括:数据库模块、数据同步模块和舆情分析系统;其中, 所述数据库模块是存储舆情信息的模块,所述数据库模块为舆情采集系统的一部分,是最终存储采集信息的模块; 所述数据同步模块是数据库模块和舆情分析系统的桥梁,通过该数据同步模块把舆情信息传送到舆情分析系统里;所述数据同步模块中包括分词库、舆情包含词库、舆情排除词库,所述舆情包含词库里是一些典型舆情词汇,所述舆情排除词库里是一些典型的非舆情词汇; 所述舆情分析系统提供舆情分析功能; 所述舆情分析系统优化方法,在采集信息导入舆情分析系统时,加入了信息筛选过滤操作,只往舆情分析系统中导入筛选出的舆情信息;即在数据库同步时,在数据同步模块中加入舆情包含词库、舆情排除词库信息,对采集信息进行词汇对比过滤,通过在这两种不同的词库之间过滤信息的逻辑关系,把数据库模块中的信息筛选过滤出来,只把通过筛选的舆情信息导入到舆情分析系统里,进行舆情分析,这样减小了舆情分析系统的压力,并提升了舆情分析的效率和准确性。 实施例: 下面通过一个实施例对本专利技术所述基于数据库同步的舆情分析系统优化方法的优点和设计内容,进行详细说明: 本实施所述基于数据库同步的舆情分析系统优化方法中,所提出的优化舆情分析系统的体系结构包括:数据库模块、数据同步模块和舆情分析系统;其中,所述数据库模块是舆情采集系统的一部分,是最终存储采集储舆信息的模块;所述数据同步模块是数据库模块和舆情分析系统的桥梁,通过该数据同步模块把舆情信息传送到舆情分析系统里;所述数据同步模块中加入舆情包含词库、舆情排除词库,所述舆情包含词库里是一些典型舆情词汇,所述舆情排除词库里是一些典型的非舆情词汇;所述舆情分析系统提供舆情分析功能; 本实施例所述优化舆情分析系统,在数据库同步操作时,在数据同步模块中加入舆情包含词库、舆情排除词库信息,通过两层舆情词库比对的方式把数据库模块中的信息筛选过滤;具体操作是把数据库模块中的信息分词后,先后比对舆情包含词库、舆情排除词库中的词汇,判断这条信息的词汇是否匹配舆情包含词库且不匹配舆情排除词库,若这条信息的词汇里有舆情包含词库词汇且没有舆情排除词库的词汇,则这条信息就是舆情信息,只把通过筛选的舆情信息导入到舆情分析系统里,这样通过舆情词库的过滤筛选,把筛选后的信息传送到舆情分析系统里;进行舆情分析,减小了舆情分析系统的压力,并提升了舆情分析的效率和准确性。 附图2为本专利技术所述基于数据库同步的舆情分析系统优化方法的实施流程图,如附图2所示,该舆情分析系统优化方法的具体实施流程如下: (1) 首先在数据库同步时,从数据库模块里获取一条待处理的信息; (2) 通过分词库对待处理信息进行分词处理; (3)判断这条信息分成的词汇里是否和舆情包含词库有相同的词; (4)若有,则这条信息暂时符合舆情信息标准,进入第5步操作;若没有,则这条消息不是舆情信息,消息丢弃,进行第1步操作; (5)判断该条信息分成的词汇里是否和舆情排除词库有相同的词; (6)若没有,则这条信息是舆情信息,把这条信息存入舆情分析系统;若有,则这条消息不是舆情信息,消息丢弃,进行第1步操作。 附图1本文档来自技高网...

【技术保护点】
一种基于数据库同步的舆情分析系统优化方法,其特征在于, 在数据库同步环节对数据进行筛选,通过控制进入舆情分析系统的数据,进行舆情分析系统优化;所述舆情分析系统优化方法提出了一种优化舆情分析系统,所述优化舆情分析系统的体系结构包括:数据库模块、数据同步模块和舆情分析系统;其中,所述数据库模块是存储舆情信息的模块,所述数据库模块为舆情采集系统的一部分,是最终存储采集信息的模块;所述数据同步模块是数据库模块和舆情分析系统的桥梁,通过该数据同步模块把舆情信息传送到舆情分析系统里;所述数据同步模块中包括分词库、舆情包含词库、舆情排除词库,所述舆情包含词库里包括典型舆情词汇,所述舆情排除词库里包括典型的非舆情词汇;所述舆情分析系统提供舆情分析功能;所述舆情分析系统优化方法,在采集信息导入舆情分析系统时,加入了信息筛选过滤操作,只往舆情分析系统中导入舆情信息;即在数据库同步时,在数据同步模块中添加舆情包含词库、舆情排除词库信息,对采集信息进行词汇对比过滤,通过在这两种不同的词库之间过滤信息的逻辑关系,把数据库模块中的信息筛选过滤出来,只把通过筛选的信息导入到舆情分析系统里,进行舆情分析。

【技术特征摘要】
1.一种基于数据库同步的舆情分析系统优化方法,其特征在于, 在数据库同步环节对数据进行筛选,通过控制进入舆情分析系统的数据,进行舆情分析系统优化;所述舆情分析系统优化方法提出了一种优化舆情分析系统,所述优化舆情分析系统的体系结构包括:数据库模块、数据同步模块和舆情分析系统;其中,
所述数据库模块是存储舆情信息的模块,所述数据库模块为舆情采集系统的一部分,是最终存储采集信息的模块;
所述数据同步模块是数据库模块和舆情分析系统的桥梁,通过该数据同步模块把舆情信息传送到舆情分析系统里;所述数据同步模块中包括分词库、舆情包含词库、舆情排除词库,所述舆情包含词库里包括典型舆情词汇,所述舆情排除词库里包括典型的非舆情词汇;
所述舆情分析系统提供舆情分析功能;
所述舆情分析系统优化方法,在采集信息导入舆情分析系统时,加入了信息筛选过滤操作,只往舆情分析系统中导入舆情信息;即在数据库同步时,在数据同步模块中添加舆情包含词库、舆情排除词库信息,对采集信息进行词汇对比过滤,通过在这两种不同的词库之间过滤信息的逻辑关系,把数据库模块中的信息筛选过滤出来,只把通过筛选的信息导入到舆情分析系统里,进行舆情分析。
2.根据权利要求1所述的一种基于数据库同步的...

【专利技术属性】
技术研发人员:程瑶刘粉粉陈大雅
申请(专利权)人:浪潮电子信息产业股份有限公司
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1