一种处理舆情话题的方法、装置和系统制造方法及图纸

技术编号:7522768 阅读:183 留言:0更新日期:2012-07-12 03:58
本发明专利技术涉及通信领域技术,尤其涉及处理舆情话题的方法、装置和系统,该方法包括:在网络中检索包含舆情信息的舆情话题;获取所述舆情话题的特征信息,检测所述舆情话题的特征信息是否符合报警条件;当符合报警条件时,保存所述舆情话题及其特征信息。使用本发明专利技术实施例提供的处理舆情话题的方法、装置及系统,通过获取并检测舆情话题的特征信息,对舆情话题进行预警。而且,可以对保存的舆情话题进行管理,并持续追踪,获取其传播、点击、评论等的变化趋势,全面掌握舆情话题。并且可以对舆情话题进行分析整理,生成舆情简报。

【技术实现步骤摘要】

本专利技术涉及通信领域技术,尤其涉及一种处理舆情话题的方法、装置和系统
技术介绍
随着互联网的迅猛发展,其作为一块正在加速膨胀的思想阵地,已成为舆情事件的重要发生地和扩散地。新闻网站不断转载各种媒体报道的事件;再加上互联网的虚拟性、 隐蔽性、发散性和渗透性等特点,越来越多的人愿意通过各种互动社区表达个人对舆情事件的看法。互联网信息传播的速度极快,网络舆情的爆发将以“内容威胁”的形式逐渐对社会公共安全形成威胁,对舆情话题的传播、扩散、网民评论情况越来越难以全面掌握,舆情事件的发展趋势难以控制。
技术实现思路
本专利技术实施例提供了一种处理舆情话题的方法、装置和系统,通过获取并检测舆情话题的特征信息,对舆情话题进行预警。本专利技术实施例提供了一种处理舆情话题的方法,该方法包括在网络中检索包含舆情信息的舆情话题;获取所述舆情话题的特征信息,检测所述舆情话题的特征信息是否符合报警条件;当符合报警条件时,保存所述舆情话题及其特征信息。相应的,本专利技术实施例提供了一种处理舆情话题的装置,包括检索模块,用于在网络中检索包含舆情信息的舆情话题;获取模块,用于获取所述舆情话题的特征信息;检测模块,用于检测所述舆情话题的特征信息是否符合报警条件;存储模块,用于当符合报警条件时,保存所述舆情话题及其特征信息。相应的,本专利技术实施例提供了一种处理舆情话题的系统,包括网络侧服务器和处理舆情话题的装置;所述网络侧服务器,用于提供包含舆情信息的舆情话题;所述处理舆情话题的装置,用于在网络中检索包含舆情信息的舆情话题;获取所述舆情话题的特征信息,检测所述舆情话题的特征信息是否符合报警条件;当符合报警条件时,保存所述舆情话题及其特征信息。本专利技术实施例提供了一种处理舆情话题的方法、装置及系统,用于在网络中检索包含舆情信息的舆情话题;获取所述舆情话题的特征信息,检测所述舆情话题的特征信息是否符合报警条件;当符合报警条件时,保存所述舆情话题及其特征信息。使用本专利技术实施例提供的处理舆情话题的方法、装置及系统,通过获取并检测舆情话题的特征信息,对舆情话题进行预警。而且,可以对保存的舆情话题进行管理,并持续追踪,获取其传播、点击、评论等的变化趋势,全面掌握舆情话题。并且可以对舆情话题进行分析整理,生成舆情简报。附图说明图1为本专利技术实施例中处理舆情话题的方法流程示意图;图2为本专利技术另一实施例中处理舆情话题的方法流程示意图;图3为本专利技术另一实施例中处理舆情话题的装置示意图;图4为本专利技术另一实施例中处理舆情话题的系统示意图。具体实施例方式下面结合各个附图对本专利技术实施例技术方案的主要实现原理具体实施方式及其对应能够达到的有益效果进行详细地阐述。为了解决现有技术存在的问题,本专利技术实施例提供了一种处理舆情话题的方法, 如图1所示,包括以下步骤步骤101、在网络中检索包含舆情信息的舆情话题;具体的,用户通过输入舆情信息,检索包含该舆情信息的舆情话题,还可以选择数据库中存储的舆情信息进行检索,该舆情信息预先保存在数据库中并定期更新。该预先在数据库中存储的舆情话题的舆情信息,可以包括发布人、发布地点、发布时间、标题、分类等,当用户检索舆情话题时,可以主动将上述舆情信息提供给用户。步骤102、获取舆情话题的特征信息,检测舆情话题的特征信息是否符合报警条件;具体的,可以在指定网站或全网中获取舆情话题的传播情况,例如可以在指定的网站中,根据预置的关键词规则和/或样本文档,获取该舆情话题的相关联话题及相似度,具体实现时可以使用网络爬虫技术进行采集;还可以在全部网络中,根据舆情话题的全网关键词,获取该舆情话题的相关联话题及相似度,具体实现时可以使用元搜索技术。该步骤主要提供原始统计数据,即在指定网站或者全部网络中,具有多少该舆情话题的相关联话题及相似度,当然,该相关联话题包括舆情话题本身。进行全网搜索时,可以主要搜索各种类型的站点,如网页类、新闻类、论坛类博客类等。上述在关键词规则和样本文档之间的逻辑关系可以是“与”,也可以是“或”,其中关键词搜索采用布尔逻辑运算的复杂条件,样本文档可采用单一文本片段或多文本片段。 而且使用多样本文档方式时,可以通过不同片段找到相关信息,多角度综合获知舆情话题的情况,有效的解决同一事件不同描述方式的问题。还可以获取该舆情话题在网络中的敏感信息、转载量、点击量、评论量、持续时间长度和相关联话题量等特征信息的数量和/或数量的变化量,并与预置的报警阈值进行比较;若大于报警阈值,则检测结果为符合报警条件;若不大于报警阈值,则检测结果为不符合报警条件。上述报警阈值可以为一项或者多项,具体使用时与获取的舆情话题的特征信息相对应,例如获取了舆情话题的点击量、回复量,则进行检测时使用点击量报警阈值和回复量报警阈值。而且,检测时可以同时使用某一个或多个特征信息的数量,还可以同时使用某一个或多个特征信息的数量增加量、增加率,还可以既使用一个或多个特征信息的数量, 又使用一个或多个特征信息的数量增加量等。其中,获取敏感信息时,需要对包含舆情话题的网页文本数据进行分词处理,然后根据预置的敏感词,获取网页文本数据中的敏感信息。具体的,运用中文分词技术对网页文本数据进行分词处理,正序及倒序的分析网页文本中的所有词,然后根据预置的敏感词,获取该网页中具有的敏感词。该预置的敏感词存储在数据库中,根据国家法律规定的敏感词进行设置,或者用户自行设置。步骤103、当符合报警条件时,保存舆情话题及其特征信息。具体的,当该舆情话题的一个或多个特征信息符合报警条件时,保存该舆情话题及其特征信息,可以采用数据挖掘技术定期进行对其分析及追踪,以便获知该舆情话题的进展。例如通过周期性分析舆情话题的转载情况及点击量、评论量的变化过程,形成对该舆情话题的连续追踪。用户可以通过修改定时器来设定或修改定期分析的具体时间。然后,可以保存分析结果并展示,以便用户查看。保存分析结果时,可以按照分析时间的不同分别保存,以便查看某个时间段中该舆情话题的相关信息,该相关信息包括舆情话题分布情况、点击量及评论量等。管理保存的多个舆情话题时,还可以按照相似度进行分类,查看时可以在某类话题下查找相应的舆情话题的分析结果,例如相关信息、变化趋势、是否报警等。此外,还可以根据舆情话题的特征信息,生成舆情简报,例如对舆情话题的所属网站、发布时间、传播路径等进行统计分析,生成舆情简报并保存在分析结果中,以便辅助用户更好的把握舆情传播规律,为制定舆情处理和舆情引导提供数据依据,还可以查看引导效果。通过上述描述,可以看出,使用本专利技术实施例提供的处理舆情话题的方法,通过获取并检测舆情话题的特征信息,对舆情话题进行预警。而且能够对舆情话题进行管理,并进行持续追踪,分析舆情话题的传播、点击、评论的变化趋势,对需要预警的话题进行预警提示。还可以自动对互联网上的舆论信息进行综合分析整理,为生成舆情简报提供数据材料。 进一步支撑全面掌握舆情事件,为舆论处理和引导决策提供重要支持,持续追踪分析舆论引导的效果。检索舆情话题时,用户可以按照需要添加话题,还可以同时设置多篇样例文本或关键词,多角度描述该话题,以便全面分析话题的传播演化趋势;并可以选择通过元搜索技术对互联网信息进行统计,了解互联网中关于该舆情话题的报道情况。通过自动分析舆情话题在网本文档来自技高网...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员:张丹杨建武梁汝锋吴新丽
申请(专利权)人:北大方正集团有限公司北京大学北京北大方正电子有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术