一种基于云计算的大数据统一分析处理方法技术

技术编号：9528767 阅读：138 留言：0更新日期：2014-01-02 18:14

本发明专利技术涉及一种基于云计算的大数据统一分析处理方法，该方法包括：基于云计算技术构建高可扩展的海量结构化、非结构化和半结构化数据的分布式存储平台；在云计算平台上实现海量异构数据的分布式并行处理，解析异构数据的查询分析请求，按照查询分析的数据对象所在位置调度数据处理计算，将数据分析处理计算分布到各数据存储节点上，实现海量数据的并行分析处理；集成结构化数据查询分析接口与非结构化数据查询分析接口，实现异构数据的并行分析处理，提供统一数据访问接口；基于云服务技术为大数据应用提供结构化数据服务和非结构化数据服务。具有克服了大数据分析处理的复杂性和挑战性，满足大数据处理的规模不断增长和实时性需求等优点。

全部详细技术资料下载

【技术实现步骤摘要】
【专利摘要】本专利技术涉及，该方法包括：基于云计算技术构建高可扩展的海量结构化、非结构化和半结构化数据的分布式存储平台；在云计算平台上实现海量异构数据的分布式并行处理，解析异构数据的查询分析请求，按照查询分析的数据对象所在位置调度数据处理计算，将数据分析处理计算分布到各数据存储节点上，实现海量数据的并行分析处理；集成结构化数据查询分析接口与非结构化数据查询分析接口，实现异构数据的并行分析处理，提供统一数据访问接口；基于云服务技术为大数据应用提供结构化数据服务和非结构化数据服务。具有克服了大数据分析处理的复杂性和挑战性，满足大数据处理的规模不断增长和实时性需求等优点。【专利说明】
本专利技术涉及分布式数据处理技术，特别涉及一种基于云计算的大数据统一分析处理方法。
技术介绍
随着互联网、移动互联网、物联网等应用的飞速发展，全球数据量出现了爆炸式增长。IDC公司发布的数字宇宙研究报告称，全球信息总量每两年就会增长一倍，2011年全球被创建和被复制的数据总量为1.8ZB。IDC认为，到下一个十年(2020年)，全球所有IT部门拥有服务器的总量将会比现在多出10倍，所管理的数据将会比现在多出50倍。预计到2020年，全球将总共拥有35ZB的数据量。数据量的飞速增长预示着我们现在已经进入了一个大数据的时代。然而，当前不仅仅是数据规模越来越大，而且数据类型多和处理实时性要求都极大地增加了大数据处理的复杂度。IDC的权威定义为:满足4V(Variety，Velocity,Volume，Value，即种类多、流量大、容量大、价值高)指标的数据称为大数据。大数据给传统...
一种基于云计算的大数据统一分析处理方法

【技术保护点】
一种基于云计算的大数据统一分析处理方法，其特征在于，包括以下步骤：（1）基于云计算技术构建高可扩展的海量结构化、非结构化和半结构化数据的分布式存储平台；（2）基于云计算实现并行数据处理，在高可扩展的云计算平台上实现海量结构化、半结构化和非结构化数据的分布式并行分析处理，对异构数据的查询分析请求进行解析并制定数据处理计算的优化分布调度方式，按照查询分析的数据对象所在位置调度数据处理计算，将数据分析处理计算分布到各数据存储节点上，实现海量数据的并行分析处理；（3）集成结构化数据查询分析接口与非结构化数据查询分析接口，进行异构数据的并行分析处理，提供统一数据访问接口；（4）基于云服务技术为大数据应用提供结构化数据服务和非结构化数据服务。

【技术特征摘要】

【专利技术属性】
技术研发人员：林伟伟，齐德昱，
申请(专利权)人：华南理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人