网络舆情预测方法及系统技术方案

技术编号:5341646 阅读:397 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种网络舆情预测方法及系统。该方法包括:对网络舆情信息进行预处理,获取进行预测所需的时间序列;根据经预处理获得的所述时间序列,建立相应的预测模型;基于所述预测模型预测网络舆情的发展趋势。本发明专利技术对于网络上的各个热点话题,能够在最短的时间内预测出其在未来短期内的发展趋势,便于通过舆情的引导手段,继续保持那些促进社会稳定的话题,而对于那些破坏社会和谐的话题,则要加以引导,使其逐渐消亡。

【技术实现步骤摘要】

本专利技术涉及网络信息安全分析和预测技术,更具体地,尤其涉及一种网络舆情 预测方法及系统。
技术介绍
近几年来,随着信息网络技术在世界范围内的极速发展,网络媒体已成为是继 报纸、广播、电视等大众传播方式和人际传播方式之外的新兴传播势力,网络成为反映 社会民意的主要载体之一。2010年7月15日,中国互联网络信息中心(CNNIC)发布的 统计报告显示,截止2010年6月底,中国网民数量已经突破了 4亿大关,总量达到了 4.2 亿,互联网普及率攀升至31.8%,高居世界第一。可以看出,在国内越来越多的人聚集 于互联网中,获取并更新互联网中的信息。互联网中的个体可以自由的发表观点,并与其他个体的观点进行交互。网络中 观点的宏观表现可看作是网络舆情(networkconsensus)。更为严格的定义如下网络舆情是由于各种事件的刺激而产生的通过互联网传播的人们对于该事件的 所有认知、态度、情感和行为倾向的集合。在网络环境中,舆情信息的主要载体包括 新闻、BBS、Blog等。网络舆情具有表达快捷、信息多元化和方式互动等特点,这是传 统媒体所无法比拟的。基于网络内容的网络舆情发展呈现出以下几个特点1、突发性,极短时间内网络中会产生大量的讨论;2、话题传播速度的迅猛 性,话题会经过网民很快地传播到各个网站;3、热点话题持久性,一般性的热点话题会 有大量网民反复地参与讨论;4、影响范围广,网络舆情在一定程度上影响了人们的日常 生活。网络舆情的突发性和快速传播的特性使其成为了社会舆论的一种快速的反应形 式,网络舆情已经开始对现实社会产生一定的影响,由于网络的开放性与虚拟性,给互 联网监管工作带来了很大的不便。网络中的个体可随意表达观点,如果该观点是以某一 热点事件为存在基础,在主观情绪化的作用下,该观点会迅速扩散。在现实生活中某些 个体遇到挫折,对社会问题片面认识等等,都会利用网络得以宣泄。因此在网络上更容 易出现庸俗、灰色的言论。因此,对网络舆情的研究是很有必要的。从网络安全的角度来看,提前预测网络舆情的发展趋势,并对网络舆情的发展 加以引导,这对于社会和谐稳定有着重要的意义。网络热点话题的持续性决定了这些热 点话题有一定的时间连续性,因此从时间的角度出发,以网络舆情内容的数量为单位对 网络热点话题的后续发展趋势进行预测。目前国内市场主要的舆情产品具有的功能有1、舆情分析功能。这是舆情产品的核心功能,主要内容包括(1)热点话题发 现、敏感话题识别,可以根据新闻出处权威度、评论数量、发言时间密集程度等参数, 识别出给定时间段内的热门话题。利用关键字布控和语义分析,识别敏感话题;(2)话 题倾向性分析。对于每个话题,对每个个体发表的观点、倾向性进行分析与统计;(3)主题跟踪。分析新发表文章、帖子的话题是否与已有主题相同;(4)自动摘要。对各类 主题能够自动形成摘要,以报告的形式呈现;(5)突发事件分析。对突发事件进行跨时 间、跨空间综合分析,获知事件发生发展的历程,并预测事件未来发展的趋势;(7)报 警系统。对突发事件、涉及内容安全的敏感话题及时发现并报警;(8)统计报告,根据 舆情分析引擎处理后的结果库生成报告,用户可通过浏览器浏览,提供信息检索功能, 根据指定条件对热点话题、倾向性进行查询,并浏览信息的具体内容,提供决策支持。2、网络信息自动采集。根据用户信息需求,设定主题目标,通过网络页面之间 的链接关系,从网上自动获取页面信息,并且通过链接不断向整个网络扩展,最终完成 定制范围的信息收集任务。3、数据清理功能。对收集到的信息进行预处理,如格式转换、数据清理,数据 统计。对于新闻评论,该功能可滤除无关信息,保存新闻的标题、源地址、发布时间、 内容、点击次数、参与评论人、评论内容、评论数量等信息。对于论坛BBS,记录帖子 的标题、发言人、发布时间、内容、回帖内容、回帖数量等,最后形成格式化信息。综上,现有的网络舆情分析方法仅针对已出现的网络舆情进行分析,并没有一 种较为有效地对网络舆情的发展趋势进行预测的算法,因此存在这样一种技术需求, 即,需要一种快速可靠的网络舆情预测方法来预测网络舆情的发展趋势。
技术实现思路
本专利技术的目的在于提供一种网络舆情预测方法及系统,基于本专利技术,能够更为 有效地对网络舆情的发展趋势进行预测。一方面,本专利技术一种网络舆情预测方法,包括预处理步骤,网络舆情信息进 行预处理,获取进行预测所需的时间序列;预测模型建立步骤,根据经预处理获得的所 述时间序列,建立相应的预测模型;预测步骤,基于所述预测模型预测网络舆情的发展 趋势。上述网络舆情预测方法中,优选所述预处理步骤进一步包括数据采集及聚类 步骤,采集网络舆情信息并对所述网络舆情信息进行聚类;热点获取步骤,依据聚类结 果,获取热点网络舆情信息;时间序列获取步骤,对所述热点网络舆情信息进行数据聚 合,获得进行预测所需的时间序列。上述网络舆情预测方法中,优选所述预测模型建立步骤中,依据所述时间序 列,建立的预测模型为逆向误差传播人工神经网络模型。上述网络舆情预测方法中,优选所述预测模型建立步骤中,所述逆向误差传播 人工神经网络模型包括输入层、隐蔽层和输出层;该模型建立步骤进一步包括人工神 经网络结构建立步骤,建立逆向误差传播人工神经网络结构,确定所述输入层、所述隐 蔽层、所述输出层的神经元个数;参数值确定步骤,确定所述时间序列中参数的取值; 预估算步骤,通过训练,预估算学习率、动量项两个参数的值;检测步骤,检验所述预 测模型的有效性。另一方面,本专利技术一种网络舆情预测系统,包括预处理模块、预测模型建立 模块和预测模块。其中,预处理模块用于网络舆情信息进行预处理,获取进行预测所需 的时间序列;预测模型建立模块用于根据经预处理获得的所述时间序列,建立相应的预测模型;预测模块用于基于所述预测模型预测网络舆情的发展趋势。上述网络舆情预测系统,优选所述预处理模块进一步包括数据采集及聚类单 元、热点获取单元和时间序列获取单元。其中,数据采集及聚类单元用于采集网络舆情 信息并对所述网络舆情信息进行聚类;热点获取单元用于依据聚类结果,获取热点网络 舆情信息;时间序列获取单元用于对所述热点网络舆情信息进行数据聚合,获得进行预 测所需的时间序列。上述网络舆情预测系统,优选所述预测模型建立模块中,依据所述时间序列, 建立的预测模型为逆向误差传播人工神经网络模型。上述网络舆情预测系统,优选所述预测模型建立模块中,所述逆向误差传播人 工神经网络模型包括输入层、隐蔽层和输出层;该预测模型建立模块进一步包括人工 神经网络结构建立单元、参数值确定单元、预估算单元和检测单元。其中,人工神经网 络结构建立单元用于建立逆向误差传播人工神经网络结构,确定所述输入层、所述隐蔽 层、所述输出层的神经元个数;参数值确定单元用于确定所述时间序列中参数的取值; 预估算单元用于通过训练,预估算学习率、动量项两个参数的值;检测单元用于检验所 述预测模型的有效性。相对于现有技术而言,本专利技术具有以下优点对于网络上的各个热点话题,能 够在最短的时间预测出其在未来短期内(一般为一天)的发展趋势,便于通过舆情的引导 手段,继续保持那些促进社会稳定的话题,而对于那些破坏社会和谐的话题,则要加以 引导,使其逐渐消本文档来自技高网
...

【技术保护点】
一种网络舆情预测方法,其特征在于,包括:预处理步骤,对网络舆情信息进行预处理,获取进行预测所需的时间序列;预测模型建立步骤,根据经预处理获得的所述时间序列,建立相应的预测模型;预测步骤,基于所述预测模型预测网络舆情的发展趋势。

【技术特征摘要】

【专利技术属性】
技术研发人员:刘云程军军张振江程辉张彦超司夏萌
申请(专利权)人:北京交通大学
类型:发明
国别省市:11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1