网络事件自动搜集分析系统及方法技术方案

技术编号:14923724 阅读:115 留言:0更新日期:2017-03-30 15:54
本发明专利技术为一种网络事件自动搜集分析方法及系统,包括一事件取样模组、一主题产生模组、一主题筛选模组及一事件决策支援模组。该事件取样从数个网络资源取得网络资讯。该主题产生模组将等网络资讯归纳为数个不同事件主题。该主题筛选模组判定事件主题是否为热门主题,且根据综合指数的高低依序排列各该热门主题。该事件决策支援模组根据每一热门主题的一关注度参数及一关注时间参数决定该热门主题的重要性等级。

【技术实现步骤摘要】

本专利技术为一种网络舆情的处理技术,特别是一种网络事件自动搜集分析系统及方法
技术介绍
由于网络的使用与发展成熟与庞大,造成过去的2年来,人类在网络上制造的资料量,占人类史上总资料量九成。预估到2020年数据量会比2010年大50倍,将有500亿个户联设备在搜集数据。网络上存在的这些巨量资料中有着珍贵的讯息,像是相关性(UnknownCorrelation)、未显露的模式(HiddenPatterns)、市场趋势(MarketTrend),可能埋藏着前所未见的知识跟应用等着被挖掘发现。因此从这些巨量资料中萃取出那些有价值的资讯来利用是目前各方产业研究的方向。网络舆情搜集是目前其中一种在网络巨量资料中萃取有价值资讯的手段。由于目前公众人物、执政者或管理、领导人经常因为对于舆情情势的误判而延误事件处理先机,或是处理方向错误导致事件成为事故。舆情包含社会舆情及网络舆情,其中网络舆情是社会舆情在网络空间的映射,是社会舆情的直接反映。传统的社会舆情存在于民间,存在于大众的思想观念和日常的街头巷尾的议论之中,前者难以捕捉,后者稍纵即逝,舆情的获取只能通过社会明察暗访、民意调查等方式进行,获取效率低下,样本少而且容易流于偏颇,耗费巨大。而随着网际网络的发展,大众往往以资讯化的方式发表各自看法,网络舆情比社会舆情更容易获取。然而,目前的舆情监测产品或服务,有些属于人与机构的监测,目的在监控人与机构在网络上的言行并对监控者自动提出特定行为发生的警示讯息;有些属于被动的事件监测,需由使用者自行设定特定事件主题及关键字,系统方能依据设定事件主题进行监测及分析。前者无法反映社会舆情的变化;后者则缓不济急,等需求者意识到重要主题时,往往已经错失处理先机。因此需要一种能够即时反应社会舆情变化,主动获知舆情的轻重缓急的系统及方法。
技术实现思路
本专利技术的一目的,在于提供一种根据搜集到的每一热门主题的一关注度参数的高低及一关注时间参数的长短予以重要性分级的网络事件自动搜集分析系统及方法。本专利技术的另一目的,在于提供一种主动搜集网络资源并即时反应网络上的事件变化,显示网络上事件的轻重缓急的网络事件自动搜集分析系统及方法。为达上述目的,本专利技术提供一种网络事件自动搜集分析方法,包括下列步骤:经由一事件取样模组取得网络资讯的内容及发布时间讯息储存在一资料库;经由一主题产生模组根据该资料库内的网络资讯数量的累计产生数个事件主题;经由一主题筛选模组针对每一事件主题依据数个参数得到一综合指数,并在该综合指数超过一预设警示值时将该事件主题判定为热门主题,且依据各该综合指数的高低依序排列各该热门主题;经由一事件决策支援模组的一事件决策次模组根据每一热门主题的一关注度参数及一关注时间参数决定该热门主题的重要性等级。本专利技术另外提供一种网络事件自动搜集分析系统,包括:一事件取样模组,用以取得网络资讯的内容及发布时间讯息;一资料库,连接该事件取样模组,储存取得的网络资讯的内容及发布时间讯息;一主题产生模组,连接该资料库产生数个事件主题:一主题筛选模组,针对每一事件主题依据数个参数得到一综合指数,并在该综合指数超过一预设警示值时将该事件主题判定为热门主题,且依据各该综合指数的高低依序排列各该热门主题;一事件决策支援模组,包括一事件决策次模组根据每一热门主题的一关注度参数及一关注时间参数决定该热门主题的重要性等级。附图说明下列附图的目的在于使本专利技术能更容易被理解,于本文中会详加描述该些附图,并使其构成具体实施例的一部份。通过本文中的具体实施例并参考相对应的附图,以详细解说本专利技术的具体实施例,并用以阐述专利技术的作用原理。图1为本专利技术的系统方块示意图;图2为系统的次模组的方块示意图;图3为系统的次模组的方块示意图;图4为本专利技术的方法流程示意图;图5为本专利技术重要性等级区分的示意图;图6为本专利技术显示在一客户端的示意图。【附图标记说明】10系统11事件取样模组12资料库13主题产生模组131词句分析次模组132分类/聚类次模组133群组关键词句次模组134事件主题产生次模组14主题筛选模组15事件决策支援模组151事件决策次模组152事件支援次模组20网络资料源31显示屏幕S01~S04步骤。具体实施方式以下将参照相关附图,说明本专利技术较佳实施,其中相同的元件将以相同的元件符号加以说明。请参阅图1为本专利技术的系统方块示意图;图2为系统的次模组的方块示意图。如图所示该系统10包括一事件取样模组11、一资料库12、一主题产生模组13、一主题筛选模组14及一事件决策支援模组15。该事件取样模组11用以从网络资料源20取得网络资讯的内容及发布时间讯息,网络资料源20包括网站、部落格、网络论坛、网络社群平台,例如但不限制为Facebook、Twitter、Plurk、Google+、Youtube、Google、Yahoo、Sina、批踢踢等。该资料库12连接该事件取样模组11以储存取得的网络资讯的内容及发布时间讯息。该主题产生模组13,连接该资料库12产生数个事件主题。该主题产生模组13包括一词句分析次模组131、一分类/聚类次模组132、一群组关键词句次模组133及一事件主题产生次模组134(如图2所示)。该词句分析次模组131系对资料库12内的每一网络资讯内容分析后找出至少一关键词句及至少一正负情绪词句,其中分析技术例如但不限制利用目前的中文分词技术、自然语言处理技术或中文讯息处理技术及情绪分析方法对网络资讯的内容文字进行去重复、断词、断句、语意分析后萃取出该关键词句及该正负情绪词句。尤其要说明的是,该词句分析次模组131是利用情绪分析方法从每一篇网络资讯的内容文字找出正负情绪词句,并判断该篇网络资讯为正评论或负评论。该情绪分析方法例如但不限制为首先建立情绪词库,其次将文本比对该情绪词库,最后计算出该正负面词句的分数。具体例如但不限制为中国台湾专利公告号I477987B揭示一种分析文本的方法,包含:拆解该文本成数句子,各该句子包括至少一分句,且各该至少一分句包括至少一词汇;分析该至少一词汇的一属性,其中该属性选自由一乐观词汇、一悲观词汇、一非情绪词汇及一否定修饰词汇所组成的群组其中之一;累计各该分句中的所有词汇的各该属性,以推算各该分句的一情绪倾本文档来自技高网
...
网络事件自动搜集分析系统及方法

【技术保护点】
一种网络事件自动搜集分析方法,包括下列步骤:经由一事件取样模组取得网络资讯的内容及发布时间讯息储存在一资料库;经由一主题产生模组根据该资料库内的网络资讯的累计数量产生数个不同事件主题;经由一主题筛选模组针对每一事件主题依据数个参数得到一综合指数,并在该综合指数超过一预设警示值时将该事件主题判定为热门主题,且依据各该综合指数的高低依序排列各该热门主题;经由一事件决策支援模组的一事件决策次模组根据每一热门主题的一关注度参数及一关注时间参数决定该热门主题的重要性等级。

【技术特征摘要】
2015.05.07 TW 1041145341.一种网络事件自动搜集分析方法,包括下列步骤:
经由一事件取样模组取得网络资讯的内容及发布时间讯息储存在一资料库;
经由一主题产生模组根据该资料库内的网络资讯的累计数量产生数个不同事件主题;
经由一主题筛选模组针对每一事件主题依据数个参数得到一综合指数,并在该综合指数超过一预设警示值时将该事件主题判定为热门主题,且依据各该综合指数的高低依序排列各该热门主题;
经由一事件决策支援模组的一事件决策次模组根据每一热门主题的一关注度参数及一关注时间参数决定该热门主题的重要性等级。
2.如权利要求1所述的网络事件自动搜集分析方法,其中该每一事件主题由该主题产生模组分析该资料库内的每一网络资讯内容后找出至少一关键词句及至少一正负情绪词句,并以分类或聚类处理将具有相似关键词句的网络资讯归为一事件群组,然后根据该事件群组内的每一网络资讯的关键词句定义该事件群组的群组关键词句,并根据该事件群组中的网络资讯数量累计至一预设值以产生一事件主题。
3.如权利要求1所述的网络事件自动搜集分析方法,其中该主题产生模组依据该群组关键词句将新进入该资料库内的网络资讯归入所属事件群组。
4.如权利要求2所述的网络事件自动搜集分析方法,还包括经由一事件决策支援模组的一事件支援次模组统计该热门主题的正负情绪词句然后按照一预设格式输出报告。
5.如权利要求1所述的网络事件自动搜集分析方法,其中各该参数包括:媒体关注指数、网民关注指数、网民回应指数、媒体情绪指数、网民情绪指数。
6.如权利要求1所述的网络事件自动搜集分析方法,其中该关注度参数包括该报导媒体的广度、媒体报导的声量、媒体报导的深度、网民关注报导媒体的广度、当日点阅总数量、累计点阅总数量及网民回应数量;该关注时间参数包括该媒体报导的持久度及该点阅数量增减数值。
7.如权利要求1或6所述的网络事件自动搜集分析方法,其中该关注时间参数预设有一第一比较值,该关注度参数预设有一第二比较值,且比较该关注时间参数大于或等于或小于该第一比较值及比较该关注度参数大于或等于或小于该第二比较值以对该重要性分级。
8.一种网络事件自...

【专利技术属性】
技术研发人员:杨雅惠
申请(专利权)人:浚鸿数据开发股份有限公司
类型:发明
国别省市:中国台湾;71

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1