应用于政务领域的舆情监测系统及方法技术方案

技术编号:39061570 阅读:30 留言:0更新日期:2023-10-12 19:54
本发明专利技术公开了应用于政务领域的舆情监测系统及方法,属于政务系统技术领域,要解决的技术问题为如何高效全面的实现舆情监测。包括:数据抓取模块,用于通过调度器调度抓取进程,通过抓取进程解析网页的DOM元素,得到元素信息;数据清洗模块,用于对元素信息进行数据过滤,并设置情感标签,得到预处理后数据,预处理后数据为带有情感标签的过滤后数据;数据输出模块,用于将预处理后数据存储至数据仓库,对预处理后数据进行增量发布,并在数据仓库中配置实时索引服务,实时索引服务提供索引API,用户通过索引API访问实时索引服务,实时索引服务用于基于指定的搜索条件返回检索结果。服务用于基于指定的搜索条件返回检索结果。服务用于基于指定的搜索条件返回检索结果。

【技术实现步骤摘要】
应用于政务领域的舆情监测系统及方法


[0001]本专利技术涉及政务系统
,具体地说是应用于政务领域的舆情监测系统及方法。

技术介绍

[0002]互联网的快速发展为政务单位和公众之间交流搭建起一座沟通的桥梁,这使得政务可以更好向工作传达政策法规,有利于政务工作的顺畅进行。虽然互联网在政府与公众沟通上发挥着巨大的作用,但负面舆情信息也是难以避免的。只有及时聆听公众的声音,并及时处理,才能防止负面舆情信息的无线扩大,避免给政府公信力和形象造成损害,所以一般通过网络舆情检测软件的采集功能对网络进行定时的搜索,利用网络舆情检测系统对监测采集到的公众舆论和媒介报道进行分类汇总,形成事件的舆情分析报告,为政务部门负面舆情信息处置提供重要的决策依据。
[0003]如何高效全面的实现舆情监测,是需要解决的技术问题。

技术实现思路

[0004]本专利技术的技术任务是针对以上不足,提供应用于政务领域的舆情监测系统及方法,来解决如何高效全面的实现舆情监测的技术问题。
[0005]第一方面,本专利技术一种应用于政务领域的舆情监测系统本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种应用于政务领域的舆情监测系统,其特征在于,包括:数据抓取模块,所述数据抓取模块用于通过调度器调度抓取进程,通过抓取进程解析网页的DOM元素,得到元素信息;数据清洗模块,所述数据清洗模块用于对元素信息进行数据过滤,并设置情感标签,得到预处理后数据,预处理后数据为带有情感标签的过滤后数据;数据输出模块,所述数据输出模块用于将预处理后数据存储至数据仓库,对预处理后数据进行增量发布,并在数据仓库中配置实时索引服务,所述实时索引服务提供索引API,用户通过索引API访问实时索引服务,所述实时索引服务用于基于指定的搜索条件返回检索结果,其中搜索条件包括返回条目、时间窗口、产品线、数据源、情感、标签和关键字。2.根据权利要求1所述的应用于政务领域的舆情监测系统,其特征在于,对于所有待抓取的页面,所述数据抓取模块用于基于页面的链接地址形成链接列表;调度器用于将一个IP地址下的抓取进程分配至链接列表,对于链接列表中每个页面,抓取进程通过预配置的正则表达式从页面中解析的DOM元素,得到元素信息并返回调度器;如果抓取进程在预定时间内未返回或者返回失败,调度器重新分配一个新的IP地址的抓取进程继续进行数据抓取,直至返回元素信息,如果预定次数后均未返回元素信息,通过人工干预的方式对抓取失败的页面进行数据抓取。3.根据权利要求2所述的应用于政务领域的舆情监测系统,其特征在于,对于更新的网页,配置新的正则表达式,抓取进程通过新的正则表达式从更新的页面中解析的DOM元素,得到元素信息并返回调度器。4.根据权利要求2所述的应用于政务领域的舆情监测系统,其特征在于,1

3任一项所述的应用于政务领域的舆情监测系统,其特征在于,所述数据清洗模块用于执行如下对元素信息进行数据过滤:对与营销文案相关的元素信息进行过滤;对过滤后的元素信息进行相关性过滤...

【专利技术属性】
技术研发人员:张凯陈兆亮宁方刚迟钰沛刘燕
申请(专利权)人:浪潮软件股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1