一种具有电力行业特征的网络舆情分析与辅助决策系统技术方案

技术编号:20567121 阅读:22 留言:0更新日期:2019-03-14 09:41
本发明专利技术公开了一种具有电力行业特征的网络舆情分析与辅助决策系统,包括用于采集电力行业相关网站和论坛上的舆情信息的信息采集模块、用于存储采集的舆情信息的数据库服务器、用于对采集到的舆情信息进行分析的舆情分析服务器、用于存储高风险关键词的存储设备和舆情应用模块;数据库服务器分别与信息采集模块和舆情分析服务器相连,舆情分析服务器分别与舆情应用模块和存储设备相连。本发明专利技术能够解决采集信息的广度问题,解决舆情分析方面按主题分类,确定舆论发布者信息的难度问题,确保舆情的准确性和及时性,实时对舆情信息进行采集、分析和研判,保证了数据挖掘的深度和广度。

【技术实现步骤摘要】
一种具有电力行业特征的网络舆情分析与辅助决策系统
本专利技术涉及最佳优先搜索技术应用于过滤无关网页的研究领域,特别涉及一种具有电力行业特征的网络舆情分析与辅助决策系统。
技术介绍
随着国家电网朝着“三集五大”的战略要求开始转型,国网公司将逐步走向集约化、标准化、规模化。“三集五大”是公司发展的深刻总结和高度指导,是公司走向国际化一流企业的必由之路。然而,任何一项变革都不是一蹴而就的,都将经历探索、总结、提高这些阶段,在“三集五大”发展战略的实施过程中,必然涉及到机构调整、职能调整、规范调整、业务流程调整等全方位的改革,电力企业作为国家命脉息息相关的企业,其大的变动,必将引起社会方方面面的舆论反应,尤其是在变革中遇到困难、瓶颈的时候,各种怀疑、否定将纷至而来,因此及时监测、汇集、研判网上舆情,是正确引导舆论的重要前提。只有做好舆情工作才能为“三集五大”重大发展战略顺利开展保驾护航。目前市面上一些网络舆情分析软件,对广泛的互联网上的舆论具有搜索和分析功能,但是都是片面的,并未深入的去针对行业进行研究。国外对自然语言处理方面的研究起步比较早,相继有一些相关学者和专家都在自然语言处理中的语法、句法及语义分析方面提出了一系列较为有效的理论和方法。当前比较重要的会议和论坛有:文本检索会议、情报检索专业组会议、话题检测与跟踪会议等。其中基于关键词统计分析方法的技术相对比较成熟,但是在有效性方面还有很大的提升空间。来自美国的一个研究项目:话题检测与跟踪(TopicDetectionandTracking,TDT),提出要开发一种能在没有人工干预的情况下自动判断新闻数据流主题的需求。研究者开始此需求进行初步研究,并取得了一些初步成果,包括建立了一个针对TDT研究的预研语料库,研究的内容包括寻找内在主题一致的文本片断,也就是给出一段连续的数据流(文本或语音),让系统判断两个事件之间的分界,并且能自动判断新事件的出现以及旧事件的再现。在DARPA支持下,美国国家标准技术研究所(NIST)每年都要举办话题检测与跟踪国际会议,并进行相应的系统评测。目前国内舆情研究的主体主要是政府研究部门、高校科研单位、新闻媒体舆情服务机构、软件服务公司和调查机构。北京大学和中科院计算所的研究人员也进行了这方面的跟踪和研究。舆情监测研究呈现多元化特征,依据各自对舆情的认识和侧重点,分别在舆情挖掘、舆情应用等方面出现差异化。常用的主要的技术包括文本聚类、分类、倾向性识别、自动选取等文本信息内容识别技术以及动态图表展示、商业智能、数据库挖掘等。随后重心转移到五项基础性的研究任务,包括面向新闻广播类报道的切分任务;面向己知话题的跟踪任务;面向未知话题的检测任务;对未知话题首次相关报道的检测任务和报道间相关性的检测任务。近年来,自然语言智能处理越来越多应用到搜索和数据采集中来,如何快速有效识别自然语言,让人机交互更顺畅、更自然,让搜索更智能,是未来需要进一步探索目和研究的。
技术实现思路
本专利技术的目的在于克服现有技术的不足,提供一种能够解决采集信息的广度问题,解决舆情分析方面按主题分类,确定舆论发布者信息的难度问题,确保舆情的准确性和及时性的具有电力行业特征的网络舆情分析与辅助决策系统。本专利技术的目的是通过以下技术方案来实现的:一种具有电力行业特征的网络舆情分析与辅助决策系统,包括用于采集电力行业相关网站和论坛上的舆情信息的信息采集模块、用于存储采集的舆情信息的数据库服务器、用于对采集到的舆情信息进行分析的舆情分析服务器、用于存储高风险关键词的存储设备和舆情应用模块;数据库服务器分别与信息采集模块和舆情分析服务器相连,舆情分析服务器分别与舆情应用模块和存储设备相连;所述舆情分析服务器能够根据网络舆情事件的热度自动生成热点舆情事件,并对生成的热点舆情事件进行跟踪;舆情分析服务器包括以下模块:基本分析模块:按照预设的规则来对网页进行判定;高级分析模块:对于重点网站和论坛的帖子进行深度分析,寻求相同和类似的帖子之间的关联性,对网名和网页的超链接和重点论坛,进行重点采集和相关URL所有链接深度挖掘;TOP分析模块:对网站访问人数多、地区性门户网站、行业网站以及人气高的网站和论坛进行挖掘,针对发帖最多的论坛和贴吧进行采集和分析;针对发帖数多、活跃的网民进行重点跟踪,对于其发布的信息追踪其在互联网上的传播情况,按照回复、删除、转载关系,建立网民舆情信息库,对于其发布的信息进行重点关注;所述舆情应用模块包括以下子模块:舆情监测门户管理子模块,用于进行工作导航、监测统计、舆情监测、负面信息管理、热点信息管理和信息更新;舆情信息监测管理子模块,用于对舆情信息进行识别,对负面舆情信息进行预警;用于自动抽取舆情信息中的关键词和文章要素,形成舆情信息的自动摘要;用于舆情信息的转载;对舆情的相关报道以图片的形式进行分析;用于进行快照取证;分类舆情管理子模块,英语对舆情信息来源、发布时间、类型进行分析,对重点舆情信息形成舆情专题报告,分析其在互联网上的发展趋势和更新情况;舆情简报工作管理子模块,用于自动生成舆情周报、月报、简报,对获得舆情信息的媒体类型、发布者、地域进行统计,然后进行统计图形分析,并导出统计结果;舆情信息追踪子模块,用于对舆情监测的信息进行追踪和处理;系统管理子模块,用于对分类规则、用户信息、用户角色、用户权限进行管理;舆情预警子模块:针对舆情出现的级别进行分类管理,对风险级别高于预设级别的舆情信息及时通知舆情管理者;舆情预警的内容和级别根据网络舆情的事件性质和舆情管理者的实际工作进行预先设定;预警采用舆情信息的发布人、回复人、分布地域和指定网站以及先关关键词的出现次数阈值,一旦超过该阈值即进行预警。进一步地,所述网络舆情预警包括基于内容分析的预警和基于数值分析的预警;基于内容分析的预警:在预警模型建立时,形成关注舆情和可识别的关键词,在进行海量舆情信息搜索时,对每一条舆情信息进行判断,若出现预设的关键词则发出预警,否则自动跳转到下一条舆情信息;基于数值分析的预警:对采集到的大量数据进行消重、去噪后,计算舆情信息的热度和敏感度,将热度和敏感度分别与预设的热度和敏感度进行比较,若舆情信息的热度和敏感度与预设值相同则判定该舆情信息属于热点信息,发出预警;否则不操作。进一步地,所述信息采集模块包括用于采集文字信息的文字信息采集主机,用于采集音视频信息的音视频采集主机和对音视频采集主机采集的音视频信息进行解码的音视频解码器。进一步地,所述信息采集模块包括业务层与数据处理层两层结构;业务层采用三级线程结构;一级线程为主控线程,控制网站采集线程和元搜索线程的运行,同时获取关键字和网站的配置修改内容,随时对现有运行线程进行调整;二级线程分为两种:一种为网站搜索线程,负责采集和过滤指定网站的网页信息;第二种是元搜索线程,负责通过百度和Google搜索获取相关网页;三级线程为网页抓取线程,负责通过网络将指定网页的所有内容抓取到本地数据库中;数据处理层采用Hibernate,将数据库映射为对象直接处理,供第三级线程调用,操作对应数据库表。进一步地,系统还包括用于显示舆情信息的舆情显示设备,舆情显示设备分别与舆情分析服务器和数据库服务器相连。进一步地,所述舆情预警子模块与外部报警装本文档来自技高网
...

【技术保护点】
1.一种具有电力行业特征的网络舆情分析与辅助决策系统,其特征在于,包括用于采集电力行业相关网站和论坛上的舆情信息的信息采集模块、用于存储采集的舆情信息的数据库服务器、用于对采集到的舆情信息进行分析的舆情分析服务器、用于存储高风险关键词的存储设备和舆情应用模块;数据库服务器分别与信息采集模块和舆情分析服务器相连,舆情分析服务器分别与舆情应用模块和存储设备相连;所述舆情分析服务器能够根据网络舆情事件的热度自动生成热点舆情事件,并对生成的热点舆情事件进行跟踪;舆情分析服务器包括以下模块:基本分析模块:按照预设的规则来对网页进行判定;高级分析模块:对于重点网站和论坛的帖子进行深度分析,寻求相同和类似的帖子之间的关联性,对网名和网页的超链接和重点论坛,进行重点采集和相关URL所有链接深度挖掘;TOP分析模块:对网站访问人数多、地区性门户网站、行业网站以及人气高的网站和论坛进行挖掘,针对发帖最多的论坛和贴吧进行采集和分析;针对发帖数多、活跃的网民进行重点跟踪,对于其发布的信息追踪其在互联网上的传播情况,按照回复、删除、转载关系,建立网民舆情信息库,对于其发布的信息进行重点关注;所述舆情应用模块包括以下子模块:舆情监测门户管理子模块,用于进行工作导航、监测统计、舆情监测、负面信息管理、热点信息管理和信息更新;舆情信息监测管理子模块,用于对舆情信息进行识别,对负面舆情信息进行预警;用于自动抽取舆情信息中的关键词和文章要素,形成舆情信息的自动摘要;用于舆情信息的转载;对舆情的相关报道以图片的形式进行分析;用于进行快照取证;分类舆情管理子模块,英语对舆情信息来源、发布时间、类型进行分析,对重点舆情信息形成舆情专题报告,分析其在互联网上的发展趋势和更新情况;舆情简报工作管理子模块,用于自动生成舆情周报、月报、简报,对获得舆情信息的媒体类型、发布者、地域进行统计,然后进行统计图形分析,并导出统计结果;舆情信息追踪子模块,用于对舆情监测的信息进行追踪和处理;系统管理子模块,用于对分类规则、用户信息、用户角色、用户权限进行管理;舆情预警子模块:针对舆情出现的级别进行分类管理,对风险级别高于预设级别的舆情信息及时通知舆情管理者;舆情预警的内容和级别根据网络舆情的事件性质和舆情管理者的实际工作进行预先设定;预警采用舆情信息的发布人、回复人、分布地域和指定网站以及先关关键词的出现次数阈值,一旦超过该阈值即进行预警。...

【技术特征摘要】
1.一种具有电力行业特征的网络舆情分析与辅助决策系统,其特征在于,包括用于采集电力行业相关网站和论坛上的舆情信息的信息采集模块、用于存储采集的舆情信息的数据库服务器、用于对采集到的舆情信息进行分析的舆情分析服务器、用于存储高风险关键词的存储设备和舆情应用模块;数据库服务器分别与信息采集模块和舆情分析服务器相连,舆情分析服务器分别与舆情应用模块和存储设备相连;所述舆情分析服务器能够根据网络舆情事件的热度自动生成热点舆情事件,并对生成的热点舆情事件进行跟踪;舆情分析服务器包括以下模块:基本分析模块:按照预设的规则来对网页进行判定;高级分析模块:对于重点网站和论坛的帖子进行深度分析,寻求相同和类似的帖子之间的关联性,对网名和网页的超链接和重点论坛,进行重点采集和相关URL所有链接深度挖掘;TOP分析模块:对网站访问人数多、地区性门户网站、行业网站以及人气高的网站和论坛进行挖掘,针对发帖最多的论坛和贴吧进行采集和分析;针对发帖数多、活跃的网民进行重点跟踪,对于其发布的信息追踪其在互联网上的传播情况,按照回复、删除、转载关系,建立网民舆情信息库,对于其发布的信息进行重点关注;所述舆情应用模块包括以下子模块:舆情监测门户管理子模块,用于进行工作导航、监测统计、舆情监测、负面信息管理、热点信息管理和信息更新;舆情信息监测管理子模块,用于对舆情信息进行识别,对负面舆情信息进行预警;用于自动抽取舆情信息中的关键词和文章要素,形成舆情信息的自动摘要;用于舆情信息的转载;对舆情的相关报道以图片的形式进行分析;用于进行快照取证;分类舆情管理子模块,英语对舆情信息来源、发布时间、类型进行分析,对重点舆情信息形成舆情专题报告,分析其在互联网上的发展趋势和更新情况;舆情简报工作管理子模块,用于自动生成舆情周报、月报、简报,对获得舆情信息的媒体类型、发布者、地域进行统计,然后进行统计图形分析,并导出统计结果;舆情信息追踪子模块,用于对舆情监测的信息进行追踪和处理;系统管理子模块,用于对分类规则、用户信息、用户角色、用户权限进行管理;舆情预警子模块:针对舆情出现的级别进行分类管理,对风险级别高于预设级别的舆情信息及时通知舆情管理者;舆情预警的内容和级别根据网络舆情的事件性质和舆情管理者的实际工作...

【专利技术属性】
技术研发人员:高涛黄思源张远舰张欣吴扬
申请(专利权)人:电子科技大学
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1