一种舆情监测系统技术方案

技术编号:19745364 阅读:34 留言:0更新日期:2018-12-12 04:45
本发明专利技术涉及互联网信息处理技术领域,公安了一种舆情监测系统,包括数据采集子系统:负责对信息源头采集;舆情信息数据仓库:按照系统制定的数据规范支持外围系统数据接入;舆情研判分析子系统:侧重业务需求根据各项指标综合计算舆情热点、负面信息、专题分析等;引导指挥子系统:融合舆情管控业务流程;引导考核子系统:针对任务完成情况、导控情况、信息报送及在线等进行多角度考核,对网评员工作量和工作效果提供科学评估依据;本发明专利技术能够全面、准确、及时的获取网络信息,深层次的对互联网舆情信息进行分析和挖掘,通过统一的综合指挥系统实现舆情的及时上传和导控任务的集中下达,确保以互联网舆情监测小组为核心的整体监测成效。

【技术实现步骤摘要】
一种舆情监测系统
本专利技术涉及互联网信息处理
,具体涉及一种舆情监测系统。
技术介绍
目前随着互联网技术和应用的普及和发展,新闻、论坛、博客、微博客、视频网站等舆情产生速度、传播渠道等均呈现出爆炸式快速增长的态势,据初步统计,2009年以来,互联网网上具有负面影响的舆情数量同比增长了近2倍以上。网络舆情监测导控工作几乎完全是通过人工的方式开展的,手工发现关注网站的局部性、时间上的滞后性与信息发布的随意性、随时性之间的矛盾日益严重。
技术实现思路
基于以上技术问题,本专利技术提供了一种舆情监测系统,从而解决了现有舆情监测导控工作几乎完全是通过人工的方式开展的,手工发现关注网站的局部性、时间上的滞后性与信息发布的随意性、随时性之间的矛盾日益严重的技术问题。本专利技术采用的技术方案如下:一种舆情监测系统,包括数据采集子系统:负责对信息源头采集;舆情信息数据仓库:按照系统制定的数据规范支持外围系统数据接入;舆情研判分析子系统:侧重业务需求根据各项指标综合计算舆情热点、负面信息、专题分析等;引导指挥子系统:融合舆情管控业务流程;引导考核子系统:针对任务完成情况、导控情况、信息报送及在线等进本文档来自技高网...

【技术保护点】
1.一种舆情监测系统,其特征在于:包括数据采集子系统:负责对信息源头采集;舆情信息数据仓库:按照系统制定的数据规范支持外围系统数据接入;舆情研判分析子系统:侧重业务需求根据各项指标综合计算舆情热点、负面信息、专题分析;引导指挥子系统:融合舆情管控业务流程;引导考核子系统:针对任务完成情况、导控情况、信息报送及在线进行多角度考核,对网评员工作量和工作效果提供科学评估依据;舆情信息数据仓库为分布式架构,通过集群方式扩展项目的规模,舆情信息数据仓库分为分布式储存与全文索引、关系数据库,同时对外提供API访问接口;舆情信息数据仓库中数据入库经过数据的加工处理包括自动摘要、实体抽取、内容分类操作为后续研...

【技术特征摘要】
1.一种舆情监测系统,其特征在于:包括数据采集子系统:负责对信息源头采集;舆情信息数据仓库:按照系统制定的数据规范支持外围系统数据接入;舆情研判分析子系统:侧重业务需求根据各项指标综合计算舆情热点、负面信息、专题分析;引导指挥子系统:融合舆情管控业务流程;引导考核子系统:针对任务完成情况、导控情况、信息报送及在线进行多角度考核,对网评员工作量和工作效果提供科学评估依据;舆情信息数据仓库为分布式架构,通过集群方式扩展项目的规模,舆情信息数据仓库分为分布式储存与全文索引、关系数据库,同时对外提供API访问接口;舆情信息数据仓库中数据入库经过数据的加工处理包括自动摘要、实体抽取、内容分类操作为后续研判提供标准数据;舆情研判分析子系统基于多层关键字不同权重的数据推送算法实现海量数据中自动推送用户真正关心的舆情线索;引导指挥子系统,将筛选后的舆情信息逐级上报及领导审核;可通过系统下发导控任务且短信提醒功能,确保导控任务通知及时、到位。2.根据权利要求1的舆情监测系统,其特征在于:数据采集子系统配置有URL,实现从新闻、论坛中采集数据。数据采集子系统包括通用采集配置,支持大部分新闻、论坛的采集,只需要配置URL即可实现采集。3.根据权利要求2的舆情监测系统,其特征在于:采集性能包括指定调度和随机调度两个模式。4.根据权利要求1的舆情监测系统,其特征在于:自动摘要是将文本视为句子的线性序列,将句子视为词的线性序列,包括以下步骤:(1)原始文本处理;(2)词语权重计算;(3)句子权重计算;(4)文摘句提取;(5)文摘句输出;原始文本处理:按照计算机能够识别的形式输入文本信息,词语权重计算:对原始文本信息中的“关键词”进行词频统计,句子权重计算:根据句子中词频信息计算句子权重,其标准为:句子权重与句中所含"关键词"的数量成正比;文本信息中包含提示词,则提高句子权重;文本信息中特殊位置上的句子权重增加;若句子中包含废弃指示词则句子权重减小;句子长度与句子权重成反比,文摘句提取:对原文中所有句子按权值高低降序排列,权值最高的若干句子被确定为文摘句,文摘句输出:将所有文摘句按照它们在原文中的出现顺序输出。5.根据权利要求1的舆情监测系统,其特征在于:自动聚类是基于相似性算法的自动聚类技术,根据文本内容的相似度,将内容聚合成不同的类别,同时对每一个聚得的类别,给出精确的类别主题词,包括最热话题、最新话题、敏感话题,主要包括以下几个步聚:(1)特征提取;(2)建立聚类相似矩阵,因为相似度是定义一个聚类的基础;(3)用算法进行聚类。6.根据权利要求1的舆情监测系统,其特征在于:舆情信息数据仓库包括自动分类;自动分...

【专利技术属性】
技术研发人员:卢云峰张少月陈展鹏
申请(专利权)人:郑州中博奥信息技术有限公司
类型:发明
国别省市:河南,41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1