一种高可用的大数据平台制造技术

技术编号：19342069 阅读：21 留言：0更新日期：2018-11-07 13:51

本发明专利技术公开了一种高可用的大数据平台，包括：支架服务器和布置在所述支架服务器上的平台系统集群，所述平台系统集群包括：数据存储子平台系统；数据集成子平台系统；数据计算子平台系统；智能全文检索子平台系统和统一运维监测子平台系统，所述统一运维监测子平台系统统一的安装部署及运维监测管理。根据本发明专利技术的高可用的大数据平台，是一个高可用大大数据平台及统一的运维监测系统，从数据采集，存储，计算分析，可视化检索，统一运维监测管理的高可用的大数据系统。从数据采集系统到数据到数据可视化形成有效的完整的体系，减少一般的大数据平台不能形成完整的闭环，造成数据丢失，数据分析不完整的弊端。

A high availability big data platform

The invention discloses a high available large data platform, which comprises a support server and a platform system cluster arranged on the support server. The platform system cluster includes: a data storage sub-platform system; a data integration sub-platform system; a data computing sub-platform system; an intelligent full-text retrieval sub-platform system and a platform system. The unified operation and maintenance monitoring sub-platform system, the unified operation and maintenance monitoring sub-platform system unified installation, deployment and operation and maintenance monitoring management. According to the present invention, the high available large data platform is a high available large data platform and a unified operation and maintenance monitoring system. It is a high available large data system from data acquisition, storage, calculation and analysis, visual retrieval and unified operation and maintenance monitoring management. From data acquisition system to data visualization, an effective and complete system is formed, which reduces the drawbacks of the general large data platform that can not form a complete closed loop, resulting in data loss and incomplete data analysis.

全部详细技术资料下载

【技术实现步骤摘要】
一种高可用的大数据平台
本专利技术涉及大数据处理
，具体而言，特别涉及一种高可用的大数据平台。
技术介绍
当今世界，信息化浪潮席卷全球，大数据、云计算、物联网等蓬勃发展，使互联网时代迈上一个新台阶，大数据技术无疑是整个信息行业乃至整个社会的热点话题，各行各业都在探讨大数据可以为自身所在的行业带来怎样的变化和提升，以实现“人在干、数在转、云在算”的价值理念为最高目标。大数据平台基于开源分布式框架Hadoop为基础并深度优化，且整合大量优秀开源技术框架，形成以数据分布式采集，大数据聚合传输，数据分布式存储，实时和离线数据分析计算，智能全文检索，大数据可视化等构成大数据生态系统。传统的数据库无法支撑在海量数据全量计算及存储，使用起来十分不便。
技术实现思路
本专利技术旨在至少在一定程度上解决现有技术中的上述技术问题之一。有鉴于此，本专利技术需要提供一种…优点(独立权利要求带来的技术效果，要简洁)的主题)。根据本专利技术实施例的高可用的大数据平台，包括：支架服务器和布置在所述支架服务器上的平台系统集群，所述平台系统集群包括：数据存储子平台系统；数据集成子平台系统，所述数据集成子平台系统通过Agent客户端实时采集数据，通过Flume将数据及时传送至Kafka集群，同时不同网络位置Kafak集群将采集数据实时发送至数据存储平台系统；数据计算子平台系统，所述数据计算子平台系统通过MapReduce离线计算，Storm计算流数据框架做数据统计分析，数据关联挖掘和模型预测功能，使用异步通信框架对海量数据，数学建模迭代求优，获取最优参数模型，再使用模型参数预测未来发展趋势...

【技术保护点】
1.一种高可用的大数据平台，其特征在于，包括：支架服务器和布置在所述支架服务器上的平台系统集群，所述平台系统集群包括：数据存储子平台系统；数据集成子平台系统，所述数据集成子平台系统通过Agent客户端实时采集数据，通过Flume将数据及时传送至Kafka集群，同时不同网络位置Kafak集群将采集数据实时发送至数据存储平台系统；数据计算子平台系统，所述数据计算子平台系统通过MapReduce离线计算，Storm计算流数据框架做数据统计分析，数据关联挖掘和模型预测功能，使用异步通信框架对海量数据，数学建模迭代求优，获取最优参数模型，再使用模型参数预测未来发展趋势，以便于精准控制和智能决策；智能全文检索子平台系统，所述智能全文检索子平台系统使用自然语言处理技术，倒排序算法实现数据内容全文检索；统一运维监测子平台系统，所述统一运维监测子平台系统统一的安装部署及运维监测管理。

【技术特征摘要】
1.一种高可用的大数据平台，其特征在于，包括：支架服务器和布置在所述支架服务器上的平台系统集群，所述平台系统集群包括：数据存储子平台系统；数据集成子平台系统，所述数据集成子平台系统通过Agent客户端实时采集数据，通过Flume将数据及时传送至Kafka集群，同时不同网络位置Kafak集群将采集数据实时发送至数据存储平台系统；数据计算子平台系统，所述数据计算子平台系统通过MapReduce离线计算，Storm计算流数据框架做数据统计分析，数据关联挖掘和模型预测功能，使用异步通信框架对海量数据，数学建模迭代求优，获取最优参数模型，再使用模型参数预测未来发展趋势，以便于精准控制和智能决策；智能全文检索...

【专利技术属性】
技术研发人员：魏素扬，
申请(专利权)人：江苏鸣鹤云科技有限公司，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人