基于云服务的数据传播性分析预测方法及系统技术方案

技术编号:10785104 阅读:93 留言:0更新日期:2014-12-17 12:13
本发明专利技术公开了一种基于云服务的数据传播性分析预测方法及系统,首先在需要进行数据分析预测的多个地点分别建立云端,并建立与云端相对应的多个数据分析云平台,每个分析云平台对其对应云端所采集或接收到的网络数据进行数据分类,然后建立所有云端共享的数据模型库,将分析云平台分类后的网络数据加入数据模型库的数据模型中,对不同数据模型进行网络数据的监控、挖掘和分析,最后通过数据交互平台,展示数据模型库的分析和挖掘结果。通过本发明专利技术所述的方法及系统,能够提供有效的数据挖掘模型库,可以根据用户需要通过交互平台展示给用户最有效最关心的信息,并可监控分析信息的传播趋势,提供有效的数据传播性分析预测。

【技术实现步骤摘要】
基于云服务的数据传播性分析预测方法及系统
本专利技术涉及数据挖掘分析及前端交互
,具体涉及一种基于云服务的数据传播性分析预测方法及系统。
技术介绍
研究机构Wearesocial日前发布了中国社交、数字、移动行业数据报告,值得注意的是,中国互联网用户超过欧盟总人口,18至27岁中国网民平均每天上网5个小时,中国网民每秒钟搜索量达1万次。此外,中国的社交网络使用率增速迅猛,2011年微博服务实现爆炸性增长,街旁等LBS服务也大踏步起飞。中国网民4.85亿,互联网普及率36%。手机用户近9.2亿,手机普及率67%。中国每月新增互联网用户约1000万。网民的高速增长,以及各种社交平台的普及,包括新浪微博,腾讯微信,人人网,开心网等,尤其移动客户端的数据流量要远超PC端,人们交流习惯的改变,使得信息传播的速度大大加快。如何及时获取有效的信息,并加以分析,预测出未来的传播方向,以及如何及时的将这部分信息展示给关心数据传播方向的人们,将是一个很重要的课题。目前市场上少有对数据传播性的分析预测方法,一方面是由于数据传播太快,一方面是由于没有系统的对数据传播地域进行规划。每个应用系统都有自己的一套规则,一套模型,数据来源大多是各自的数据库,根据数据之间的关联关系挖掘数据。在各自的业务领域内,有的发现了好的数据挖掘模型,从而获得了正确的分析结果,从中获得商机,而有的却没办法挖掘出有价值的结果,当然有的是因为数据的问题,有的是因为缺乏良好的数据模型。本专利技术能够系统的解决上述问题,提供有效的数据挖掘模型库,完整的挖掘各领域数据,并展示给用户最有效最关心的信息。专利技术内容针对现有技术中存在的缺陷以及实际应用的需要,本专利技术的目的在于提供一种基于云服务的数据传播性分析预测方法及系统,提供有效的网络数据分析预测方法和实时的数据交互平台。为实现上述目的,本专利技术采用的技术方案如下:一种基于云服务的数据传播性分析预测方法,包括以下步骤:(1)在需要进行数据分析预测的多个地点分别建立云端;所述的云端用于本地采集各自地点内的网络数据或者接收其它云端所发送的网络数据;(2)建立与所述云端相对应的多个数据分析云平台,每个分析云平台对其对应云端所采集或接收到的网络数据进行数据分类;(3)建立所有云端共享的数据模型库,将分析云平台分类后的网络数据加入数据模型库的数据模型中,对不同数据模型进行网络数据的监控、挖掘和分析;(4)建立数据交互平台,展示数据模型库的分析和挖掘结果;所述的数据交互平台还用于分析云平台间的数据交互。一种基于云服务的数据传播性分析预测系统,包括:云端建立模块:用于在需要进行数据传播性分析预测的多个地点内分别建立云端;所述的云端用于本地采集各自地点内的网络数据或者接收其它云端所发送的网络数据;分析云平台建立模块:用于建立与所述云端相对应的多个数据分析云平台,每个分析云平台对其对应云端所采集到或接收到的网络数据进行数据分类;数据模型库建立模块:用于建立所有云端共享的数据模型库,将分析云平台分类后的网络数据加入数据模型库的数据模型中,对不同数据模型进行网络数据的监控、挖掘和分析;交互平台建立模块:用于建立数据交互平台,展示数据模型库的分析和挖掘结果;所述的数据交互平台还用于分析云平台间的数据交互。本专利技术的有益效果在于:本专利技术所述的方法及系统,能够提供有效的数据挖掘模型库,记录完善各领域数据,并进行数据分类,可以根据用户需要通过交互平台展示给用户最有效最关心的信息,并可监控分析信息的传播趋势,提供有效的数据传播性分析预测,提供数据分析挖掘结果。附图说明图1为本专利技术一种基于云服务的数据传播性分析预测系统的结构框图;图2为本专利技术基于云服务的数据传播性分析预测方法的流程图;图3为具体实施方式中云端的框架布置示意图;图4为具体实施方式中云分析平台的框架布置示意图;图5为具体实施方式中数据交互平台的示意图。具体实施方式下面结合说明书附图与具体实施方式对本专利技术做进一步的详细说明。图1示出了本专利技术一种基于云服务的数据传播性分析预测系统的结构框图,该系统主要包括云端建立模块11、分析云平台建立模块12、数据模型库建立模块13和交互平台建立模块14,其中:云端建立模块11用于在需要进行数据传播性分析预测的多个地点内分别建立云端;所述的云端用于本地采集各自地点内的网络数据或者接收其它云端所发送的网络数据;分析云平台建立模块12用于建立与所述云端相对应的多个数据分析云平台,每个分析云平台对其对应云端所采集到或接收到的网络数据进行数据分类;数据模型库建立模块13用于建立所有云端共享的数据模型库,将分析云平台分类后的网络数据加入数据模型库的数据模型中,对不同数据模型进行网络数据的监控、挖掘和分析;交互平台建立模块14用于建立数据交互平台,展示数据模型库的分析和挖掘结果;所述的数据交互平台还用于分析云平台间的数据交互;该模块包括还包括了以下几个单元:数据挖掘单元:用于在交互平台展示数据分析挖掘结果;传播分析单元:用于由数据交互平台提供网络数据的传播性分析图;预警单元:用于对数据分析挖掘结果以及数据传播性分析可能引起的结果,作出预警;预处理单元:用于针对预警单元作出的预警,提供有效的解决方案。当然,数据挖掘单元、传播分析单元、预警单元以及预处理单元都是可以根据需要的不同的数据信息类型进行定制,由数据交互平台提供数据。图2示出了基于图1中基于云服务的数据传播性分析预测系统的一种基于云服务的数据传播性分析预测方法的流程图,该方法包括以下步骤:步骤S21:在需要进行数据分析预测的多个地点分别建立云端;首先,建立基于云的数据中心,本专利技术云数据中心的建立时在需要进行数据分析预测的多个地点分别建立云端,云端用于本地采集各自地点内的网络数据或者接收其它云端所发送的网络数据。建立云端的地点是指具有数据特征分布的多个地点,数据特征是指具有相同属性的数据,所述的属性相同包括数据的来源区域相同、来源网站相同或者数据的发布平台相同。例如希望网络数据以目标网站分开,像微博数据,可以分别建立新浪,腾讯,网易,搜狐的数据云端。大多数情况下,需求目标决定原始的数据特征,而在中国,海量数据的传播性分析,无疑以区域分布是最合适的,所以本实施方式中以区域为数据特征,在不同的多个区域内分别建立云端,如以省市自治区、香港、澳门等N个区域分别建立云端,N个云端组成云网络,每个云端负责收集器所在区域的网络数据,并接收其它云端发送的带有该云端区域数据特征(即属于该区域)的数据。云端,即为数据云,以云端为中心,本地采集或者接收其他云端发送的带有该云端数据特征的数据,云端的建立的技术已经很成熟,在数据共享传输上,则需要定义更加好的接口条件。本实施方式中云端进行网络数据采集的方式包括以下几种级别的采集方式:级别一:云端通过雷达,配置相应的模板采集数据;或是通过各社交平台提供的数据获取接口,获取数据。日数量级在千万级。级别二:由各大门户网站,社交平台主动的推送数据,对各个社交平台,门户网站建立数据通道,对方累积一定数量的数据,即通过通道实时传输。再加上级别一收集的数据,日数量级亿级。级别三:由各地区电信,联通部门数据分流,所有中转部门(即数据筛选层,对所有接收到的数据,根据定义好的格式进行筛选)在接收到本文档来自技高网...
基于云服务的数据传播性分析预测方法及系统

【技术保护点】
一种基于云服务的数据传播性分析预测方法,包括以下步骤:(1)在需要进行数据分析预测的多个地点分别建立云端;所述的云端用于本地采集各自地点内的网络数据或者接收其它云端所发送的网络数据;(2)建立与所述云端相对应的多个数据分析云平台,每个分析云平台对其对应云端所采集或接收到的网络数据进行数据分类;(3)建立所有云端共享的数据模型库,将分析云平台分类后的网络数据加入数据模型库的数据模型中,对不同数据模型进行网络数据的监控、挖掘和分析;(4)建立数据交互平台,展示数据模型库的分析挖掘结果;所述的数据交互平台还用于分析云平台间的数据交互。

【技术特征摘要】
1.一种基于云服务的数据传播性分析预测方法,包括以下步骤:(1)在需要进行数据分析预测的多个地点分别建立云端;所述的云端用于本地采集各自地点内的网络数据或者接收其它云端所发送的网络数据;所述的地点是指具有数据特征分布的多个地点,数据特征是指具有相同属性的数据,所述的属性相同包括数据的来源区域相同、来源网站相同或者数据的发布平台相同;(2)建立与所述云端相对应的多个数据分析云平台,每个分析云平台对其对应云端所采集或接收到的网络数据进行数据分类;(3)建立所有云端共享的数据模型库,将分析云平台分类后的网络数据加入数据模型库的数据模型中,对不同数据模型进行网络数据的监控、挖掘和分析;对不同数据模型进行网络数据监控、挖掘和分析的具体方式为:根据需求,同时在多个云端对需求的数据进行实时监控,记录设定时间间隔内增长的数据量,并将监控点的数据变化实时传输给数据交互平台;根据区域内某个领域的数据模型进行数据分析挖掘,得到分析挖掘结果,并分析不同区域内该领域分析挖掘结果的异同性,以判断区域内分析挖掘结果的正确性;对数据交互平台不同时间段内热门的话题进行聚类分析,并将单独区域的聚类分析结果发送到数据交互平台;(4)建立数据交互平台,展示数据模型库的分析挖掘结果;所述的数据交互平台还用于分析云平台间的数据交互。2.如权利要求1所述的一种基于云服务的数据传播性分析预测方法,其特征在于:步骤(1)中,在将采集到或者接收到的网络数据存储到各个云端前建立过滤墙,按照某一数据模型对网络数据进行过滤存储。3.如权利要求2所述的一种基于云服务的数据传播性分析预测方法,其特征在于,步骤(1)中,当以数据的来源区域相同作为数据特征,在多个不同的区域分别建立云端时,每个云端进行网络数据采集的具体方式为:a.云端通过雷达,配置相应的数据采集模块进行数据采集,或者通过各社交平台提供的数据获取接口,获取网络数据;b.对各大门户网站和社交平台建立数据通道,各大门户网站和社交平台主动将网络数据推送到云端;c.由区域的电信、联通部门的数据中转部门在接收到数据包准备转发时,复制一份发送到该区域的云端;所述的数据中转部分是指数据筛选层,数据筛选层根据设置好的格式进行数据的筛选。4.如权利要求3所述的一种基于云服务的数据传播性分析预测方法,其特征在于,步骤(2)中,分析云平台对其对应云端所采集到或接收到的网络数据进行数据分类的具体方式为:①根据网络数据的来源进行数据分类,将网络数据分为来自移动端和PC端的数据;②根据网络数据的数据类型进行分类;所述的数据类型包括新闻、论坛、博客和微博;③对同一数据类型下的网络数据进行再分类,同一数据类型下的数据包括政治、经济、文化、体育、社交和生活;④对再分类后的网络数据建立索引。5.如权利要求4所述的一种基于云服务的数据传播性分析预测方法,其特征在于,步骤④中,按照再分类后的网...

【专利技术属性】
技术研发人员:许立志张丹杨建武梁汝峰
申请(专利权)人:北大方正集团有限公司北京大学北京北大方正电子有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1