一种大数据库系统的安装工具技术方案

技术编号:14983789 阅读:66 留言:0更新日期:2017-04-03 14:55
本发明专利技术公开了一种大数据库系统的安装工具,包括大数据库系统的安装面板,所述安装面板上分布有所有大数据库系统需要设置的选项名称标签控件,由用户键入大数据库系统参数值用的文本框控件和由用户选择大数据库系统参数值用的文本框控件、复合框控件、列表框控件、复选框控件、单选按扭控件,用于运行大数据库系统的安装程序的命令按扭控件;所述大数据库系统各个选项的参数值与所述安装程序相关联。该安装工具可在安装大数据库系统之前设置好所有选项和参数,大部分选项和参数只需要通过鼠标进行设置,大大减少了键盘输入的几率,大大减少了将选项和参数设置错误的可能性,提高了设置效率。

【技术实现步骤摘要】

本专利技术涉及一种数据库系统的安装工具,尤其涉及一种大数据库系统的安装工具
技术介绍
随着计算机技术的发展,单机版数据库系统应运而生并得到了不断发展和完善。但是,随着互联网、移动互联网和物联网的发展,我们迎来了一个海量数据的时代,对这些海量数据的分析已经成为一个非常重要且紧迫的需求。传统单机版数据库系统已无法满足网络时代的海量大数据管理要求,无论是存储容量、存取速度、查询速度都受到极大的限制。一种基于pythonweb的Apache大数据库系统为网络时代的海量大数据提供了一个分布式可扩展、大容量、高速存取、高速查询的数据库平台。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。其中,Hadoop由分布式文件系统HDFS和分布式批处理计算框架Mapreduce组成。其计算模型以函数式编程中的Map–Reduce两个函数为原型,发展出了适用于多机并行处理的计算模式,使集群的整体处理能力可以横向扩展,解决了单机数据处理的瓶颈。Spark支持包括HDFS在内的多种数据存储方式,这使得Spark成为一套更通用的数据分析处理系统。在基于Spark又开发了针对各种计算领域的工具包,比如流式计算SparkStream,机器学习包Mllib,支持SQL查询的SparkSQL,图计算GraphX。而Hadoop经过多年的发展,日渐成熟,其HDFS已经成为大数据文件系统的事实标准。Hadoop和Spark就是现在大数据分析处理平台的基石。Ambari是hadoop分布式集群配置管理工具,是由hortonworks主导的开源项目。它已经成为apache基金会的孵化器项目,已经成为hadoop运维系统中的得力助手,引起了业界和学术界的关注。Ambari采用的不是一个新的思想和架构,也不是完成了软件的新的革命,而是充分利用了一些已有的优秀开源软件,巧妙地把它们结合起来,使其在分布式环境中做到了集群式服务管理能力、监控能力、展示能力。这些优秀开源软件有:在agent端,采用了puppet管理节点;在Web端,采用了ember.js作为前端的MVC构架和NodeJS相关工具,用handlebars.js作为页面渲染引擎,在CSS/HTML方面还用了Bootstrap框架;在Server端,采用了Jetty,Spring,Jetty,JAX-RS等;同时利用了Ganglia,Nagios的分布式监控能力。Ambari架构采用的是Server/Client的模式,主要由两部分组成:ambari-agent和ambari-server。ambari依赖其它已经成熟的工具,例如其ambari-server就依赖python,而ambari-agent还同时依赖ruby,puppet,facter等工具,还有它也依赖一些监控工具nagios和ganglia用于监控集群状况。其中:puppet是分布式集群配置管理工具,也是典型的Server/Client模式,能够集中式管理分布式集群的安装配置部署,主要语言是ruby。facter是用python写的一个节点资源采集库,用于采集节点的系统信息,例如OS信息,主机信息等。由于ambari-agent主要是用python写的,因此用facter可以很好地采集到节点信息。Ambari依赖的众多开源软件,包括部署工具,消息队列,需要在每个节点安装客户端。而安装这些工具,又需要配置软件的源地址,不能做到离线安装。当前围绕着ApacheHadoop这个分布式数据处理工具已经开发了一系列大数据计算查询工具,比如Spark,Hive.但这些工具只提供了最基本的计算,存储功能。Hadoop和Spark依赖脚本执行操作。启动集群前需要对操作系统进行配置,步骤繁琐,不利于维护。1)现有的开源部署软件架构复杂,各组件要完全通过键入命令行输入选项独立安装,部署工具本身的安装无法自动化,使用户不能快速地、不能无人执守地进行大数据平台的安装。2)配置文件管理分散,需要手工填写。大数据平台的每个组件都有2,到3个配置文件需要配置,配置文件的管理复杂度随着大数据平台中组件的增加而增加。3)大数据平台使用xml作为标准的配置文件,用户手工改写配置时容易造成文件格式错误,导致进程读取文件失败而使启动发生错误。4)没有图形化界面,用户需要学会使用linuxshell编程才能完成部署工作。5)传统的shell部署脚本,顺序执行安装过程的全部命令,当某一个命令执行失败之后,不能立刻退出并且报告错误,不利于故障及时暴露,延长了安装过程消耗的时间,降低了安装效率。
技术实现思路
本专利技术要解决的技术问题是提供一种大数据库系统的安装工具,该安装工具可在安装大数据库系统之前设置好所有选项和参数,大部分选项和参数只需要通过鼠标进行设置,大大减少了键盘输入的几率,大大减少了将选项和参数设置错误的可能性,提高了设置效率,设置好选项和参数后,可自动地、连续地安装大数据库系统的所有组件,实现无人执守地进行大数据平台的安装,大大提高了大数据库系统的安装效率。为了解决上述技术问题,本专利技术提供了一种大数据库系统的安装工具,包括大数据库系统的安装面板,所述安装面板上分布有所有大数据库系统需要设置的选项名称标签控件,由用户键入大数据库系统参数值用的文本框控件和由用户选择大数据库系统参数值用的文本框控件、复合框控件、列表框控件、复选框控件、单选按扭控件,用于运行大数据库系统的安装程序的命令按扭控件;所述大数据库系统各个选项的参数值与所述安装程序相关联。所述安装面板是网页。所述网页内设置有标签控件,所述标签控件中共有八个标签,八个所述标签名称分别是通用配置、Hadoop配置、Hive配置、Spark配置、Zookeeper配置、HA配置、监控套件配置、配置预览。所述大数据库系统包括Hadoop组件、Hive组件、Spark组件、Zookeeper组件;所述Hadoop组件中的选项和参数值设置在标签名称是Hadoop配置的窗口中,所述Hive组件的选项和参数值设置在标签名称是Hive配置的窗口中,所述Spark组件的选项和参数值设置在标签名称是Spark配置的窗口中,所述Zookeeper组件的选项和参数值设置在标签名称是Zookeeper配置的窗口中。所述通用配置中的选项名称包括Root密码、用户、本文档来自技高网
...

【技术保护点】
一种大数据库系统的安装工具,其特征在于,包括大数据库系统的安装面板,所述安装面板上分布有所有大数据库系统需要设置的选项名称标签控件,由用户键入大数据库系统参数值用的文本框控件和由用户选择大数据库系统参数值用的文本框控件、复合框控件、列表框控件、复选框控件、单选按扭控件,用于运行大数据库系统的安装程序的命令按扭控件;所述大数据库系统各个选项的参数值与所述安装程序相关联。

【技术特征摘要】
1.一种大数据库系统的安装工具,其特征在于,包括大数据库系统的
安装面板,所述安装面板上分布有
所有大数据库系统需要设置的选项名称标签控件,
由用户键入大数据库系统参数值用的文本框控件和由用户选择大数据
库系统参数值用的文本框控件、复合框控件、列表框控件、复选框控件、
单选按扭控件,
用于运行大数据库系统的安装程序的命令按扭控件;
所述大数据库系统各个选项的参数值与所述安装程序相关联。
2.根据权利要求1所述的大数据库系统的安装工具,其特征在于,所
述安装面板是网页。
3.根据权利要求2所述的大数据库系统的安装工具,其特征在于,所
述网页内设置有标签控件,所述标签控件中共有八个标签,八个所述标签
名称分别是通用配置、Hadoop配置、Hive配置、Spark配置、Zookeeper配置、HA
配置、监控套件配置、配置预览。
4.根据权利要求3所述的大数据库系统的安装工具,其特征在于,所
述大数据库系统包括Hadoop组件、Hive组件、Spark组件、Zookeeper组件;
所述Hadoop组件中的选项和参数值设置在标签名称是Hadoop配置的窗口
中,
所述Hive组件的选项和参数值设置在标签名称是Hive配置的窗口中,
所述Spark组件的选项和参数值设置在标签名称是Spark配置的窗口中,
所述Zookeeper组件的选项和参数值设置在标签名称是Zookeeper配置的窗
口中。
5.根据权利要求3所述的大数据库系统的安装工具,其特征在于,
所述通用配置中的选...

【专利技术属性】
技术研发人员:朱天骏冯骏
申请(专利权)人:深圳市华讯方舟软件技术有限公司深圳市华讯方舟科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1