【技术实现步骤摘要】
本专利技术涉及舆情分析系统,具体地说是一种基于数据库同步的舆情分析系统优化方法。
技术介绍
舆情系统一般包括舆情采集系统、舆情分析系统、舆情展示系统。舆情采集系统会把用户关注的某些门户网站或某类题材,如新闻、论坛不加过滤得都抓取到系统中。通过数据同步模块,把采集到的数据导入到舆情分析系统里。再经过分析系统处理,把采集到的数据进行分类、聚类操作,形成专题、关注点,并通过舆情展示系统直观得展现给用户。因此如果在数据同步时,把不经过滤的采集信息全部导入分析系统里,会导致导入很多非舆情的信息。这部分信息不但加大了舆情分析系统的分析数据量压力,而且杂乱无章的采集信息降低了专题、关注点等方面分析结果的准确性;同时,舆情展示系统会显示出很多用户并不关心内容,影响用户体验。
技术实现思路
针对目前技术存在的不足之处,本专利技术提出了一种基于数据库同步的舆情分析系统优化方法。 本专利技术所述一种基于数据库同步的舆情分析系统优化方法,解决上述技术问题采用的技术方案如下:所述基于数据库同步的舆情分析系统优化方法,适用于舆情系统的优化,在数据库同步环节对数据进行筛选,通过控制进入舆情分析系统的数据,进行舆情分析系统优化;所述舆情分析系统优化方法提出了一种优化舆情分析系统,所述优化舆情分析系统的体系结构包括:数据库模块、数据同步模块和舆情分析系统;其中, 所述数据库模块是存储舆情信息的模块,所述数据库模块为舆情采集系统的一部分,是 ...
【技术保护点】
一种基于数据库同步的舆情分析系统优化方法,其特征在于, 在数据库同步环节对数据进行筛选,通过控制进入舆情分析系统的数据,进行舆情分析系统优化;所述舆情分析系统优化方法提出了一种优化舆情分析系统,所述优化舆情分析系统的体系结构包括:数据库模块、数据同步模块和舆情分析系统;其中,所述数据库模块是存储舆情信息的模块,所述数据库模块为舆情采集系统的一部分,是最终存储采集信息的模块;所述数据同步模块是数据库模块和舆情分析系统的桥梁,通过该数据同步模块把舆情信息传送到舆情分析系统里;所述数据同步模块中包括分词库、舆情包含词库、舆情排除词库,所述舆情包含词库里包括典型舆情词汇,所述舆情排除词库里包括典型的非舆情词汇;所述舆情分析系统提供舆情分析功能;所述舆情分析系统优化方法,在采集信息导入舆情分析系统时,加入了信息筛选过滤操作,只往舆情分析系统中导入舆情信息;即在数据库同步时,在数据同步模块中添加舆情包含词库、舆情排除词库信息,对采集信息进行词汇对比过滤,通过在这两种不同的词库之间过滤信息的逻辑关系,把数据库模块中的信息筛选过滤出来,只把通过筛选的信息导入到舆情分析系统里,进行舆情分析。
【技术特征摘要】
1.一种基于数据库同步的舆情分析系统优化方法,其特征在于, 在数据库同步环节对数据进行筛选,通过控制进入舆情分析系统的数据,进行舆情分析系统优化;所述舆情分析系统优化方法提出了一种优化舆情分析系统,所述优化舆情分析系统的体系结构包括:数据库模块、数据同步模块和舆情分析系统;其中,
所述数据库模块是存储舆情信息的模块,所述数据库模块为舆情采集系统的一部分,是最终存储采集信息的模块;
所述数据同步模块是数据库模块和舆情分析系统的桥梁,通过该数据同步模块把舆情信息传送到舆情分析系统里;所述数据同步模块中包括分词库、舆情包含词库、舆情排除词库,所述舆情包含词库里包括典型舆情词汇,所述舆情排除词库里包括典型的非舆情词汇;
所述舆情分析系统提供舆情分析功能;
所述舆情分析系统优化方法,在采集信息导入舆情分析系统时,加入了信息筛选过滤操作,只往舆情分析系统中导入舆情信息;即在数据库同步时,在数据同步模块中添加舆情包含词库、舆情排除词库信息,对采集信息进行词汇对比过滤,通过在这两种不同的词库之间过滤信息的逻辑关系,把数据库模块中的信息筛选过滤出来,只把通过筛选的信息导入到舆情分析系统里,进行舆情分析。
2.根据权利要求1所述的一种基于数据库同步的...
【专利技术属性】
技术研发人员:程瑶,刘粉粉,陈大雅,
申请(专利权)人:浪潮电子信息产业股份有限公司,
类型:发明
国别省市:山东;37
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。