本发明专利技术公开一种Hadoop大数据平台多租户作业管理方法及其系统,其中所述方法包括:为指定用户预分配作业资源信息;提供作业提交界面,通过所述作业提交界面接收来自指定用户的作业数据及其作业参数;根据所述作业资源信息对所述作业数据进行包装,建立所述作业资源信息与所述作业数据之间的对应关系;当所述作业数据被调度时,根据所述作业资源信息设置所述作业数据的作业参数,以使根据所述作业参数在大数据平台运行所述作业数据。通过本发明专利技术降低了大数据平台的资源消耗,节省了平台的建设成本。
【技术实现步骤摘要】
Hadoop大数据平台多租户作业管理方法及其系统
本专利技术涉及大数据平台
,尤其涉及一种Hadoop大数据平台多租户作业管理方法及其系统。
技术介绍
随着大数据时代的到来,构建了越来越多的大数据平台,很多公司也有了自己的大数据平台,并基于此构建了自己的大数据应用。目前,很多公司的大数据平台都是使用单一的租户,所有用户通过一个共同的租户向平台提交作业。因此,权限、资源、队列、作业信息等都无法很好的隔离和管理。这种方式会导致大数据平台不稳定,增加日常维护的成本。例如,开发人员和运行工作流的人员使用相同的用户,这样导致开发和测试的作业与每天线上运行的定时作业使用相同的集群资源池,相同的数据权限。而共用资源池会引发资源的争抢,导致线上定时作业不能按时完成。数据权限的混乱经常会出现因为开发人员的误操作,导致线上数据被误删除。这些都造成了大数据平台的不稳定性。面对上述问题,现有技术一般有两类解决方案:一是基于编码规则的作业提交方案,这种方案要求用户提交的作业必须按照规则去编码,然后由平台相关程序来设置作业信息。比如,不能在MR(MapReduce,基于Hadoop平台的一个分布式离线计算框架)代码里面写作业名,不能在MR代码里设置MapReduce资源,队列等。因为Hadoop默认写在代码里面的作业信息的优先级最高,会覆盖所有别的方式设置的作业参数。二是基于文本解析的作业提交方案,这种方案会使用文本分析器去分析用户编写的程序,然后过滤出用户自己设置的非法作业参数。这对用户来说是非常不友好的,而且,分析源代码需要很大的资源消耗,会在很大程序上增加平台的建设成本。以上两种方法都有非常多的缺点,第一种方案对用户来说限制太多,大大降低了用户作业的灵活性。第二种方案可移植性太差,需要专用的文本解析平台的协调工作。
技术实现思路
本专利技术的主要目的在于提供一种Hadoop大数据平台多租户作业管理方法及其系统,以解决现有技术中的上述问题。根据本专利技术实施例提供一种Hadoop大数据平台多租户作业管理方法,其包括:为指定用户预分配作业资源信息;提供作业提交界面,通过所述作业提交界面接收来自指定用户的作业数据及其作业参数;根据所述作业资源信息对所述作业数据进行包装,建立所述作业资源信息与所述作业数据之间的对应关系;当所述作业数据被调度时,根据所述作业资源信息设置所述作业数据的作业参数,以使根据所述作业参数在大数据平台运行所述作业数据。其中,所述对所述作业数据进行包装,还包括:为所述作业数据设置作业标识。其中,所述方法还包括:当所述作业数据信息被调度时拦截所述作业数据,判断所述作业数据信息是否设置有作业标识,若是则执行根据所述作业参数设置所述作业数据的作业参数的步骤。其中,所述方法还包括:生成新的作业提交模块,所述新的作业提交模块的优先级高于Hadoop原生作业提交模块;当所述作业数据被调度时,执行所述新的作业提交模块,根据所述作业资源信息设置所述作业数据的预定的作业参数。其中,所述作业资源信息包括:用户对应的大数据平台租户信息、该租户在大数据平台上使用的资源信息。其中,所述作业数据的相关参数信息包括:作业标识、MapReduce资源信息。根据本专利技术实施例还提供一种Hadoop大数据平台多租户作业管理系统,其包括:资源预分配模块,用于为指定用户预分配作业资源信息;作业提交界面,用于接收来自指定用户的作业数据及其作业参数;作业包装模块,用于根据所述作业资源信息对所述作业数据进行包装,建立所述作业资源信息与所述作业数据之间的对应关系;作业提交模块,用于当所述作业数据被调度时,根据所述作业资源信息设置所述作业数据的作业参数,以使根据所述作业参数在大数据平台运行所述作业数据。其中,所述作业包装模块还用于,为所述作业数据设置作业标识。其中,所述系统还包括:作业选择模块,用于当所述作业数据信息被调度时拦截所述作业数据,判断所述作业数据信息是否设置有作业标识,若是则执行所述作业提交模块的处理。其中,所述作业提交模块的优先级高于Hadoop原生作业提交模块。根据本专利技术的技术方案,通过预先为每个指定用户预先分配作业资源信息,根据所述作业资源信息设置所述作业数据的作业参数,以使根据所述作业参数在大数据平台运行所述作业数据,降低了大数据平台的资源消耗,节省了平台的建设成本。并且,本专利技术的技术方案简单、易用,具有良好的用户交互体验。附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构成本专利技术的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1是本专利技术一个实施例的大数据平台多租户作业管理方法的流程图;图2是本专利技术另一实施例的大数据平台多租户作业管理方法的流程图;图3是根据本专利技术实施例的大数据平台多租户作业管理系统的结构框图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚,下面将结合本专利技术具体实施例及相应的附图对本专利技术技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。以下结合附图,详细说明本专利技术各实施例提供的技术方案。本专利技术提供一种大数据平台多租户作业管理方法,该方法可应用于大数据平台多租户作业管理系统(简称为Bdagent系统),该系统可设置于大数据平台的客户端。图1是根据本专利技术一个实施例的大数据平台多租户作业管理方法的流程图。如图1所示,所述方法包括:步骤S102,为指定用户预分配作业资源信息。为大数据平台的多个用户中的每个用户预先分配与作业(job)相关的资源信息,其中所述资源信息主要包括:用户对应的大数据平台租户,该租户在大数据平台上可以使用的资源队列,以及资源配额。其中租户是指在大数据平台上提交作业的用户,多个用户可以使用同一个租户提交作业。租户是大数据平台上的真正用户,平台的权限、资源、作业信息都是以租户为单位来进行管理的。步骤S104,提供作业提交界面,通过所述作业提交界面接收来自指定用户的作业数据及其作业参数。在本专利技术实施例中,为用户提供了一个指定的作业提交界面,使用户开发好的程序或脚本等作业数据通过该指定的界面提交。用户在所述作业提交界面不仅需要提交其作业数据,还需要提供该作业数据对应的一些相关参数信息,例如包括:作业标识、使用的MapReduce资源信息等。具体地,用户通过作业提交界面将MR程序或HSQL脚本等作业数据提交,并输入作业标识(例如作业名)、MapReduce资源信息(内存信息以及作业希望提交到的资源队列名称)。通过作业提交界面接收到用户的作业数据后,存储该作业数据。步骤S106,根据所述作业资源信息对所述作业数据进行包装,建立所述作业资源信息与所述作业数据之间的对应关系。在本专利技术实施例中,根据为用户的作业数据预分配的资源信息包装该作业数据,这个过程对用户来说是透明的,用户完全不用关心自己作业提交流程中的任何环节。通过本步骤,用户的标准作业已经被自动的设置了作业信息相关的参数。步骤S108,当所述作业数据被调度时,根据所述作业资源信息设置所述作业数据的作业参数,以使根据所述作业参数在大数据平台运行所述作业数据。本文档来自技高网...

【技术保护点】
一种Hadoop大数据平台多租户作业管理方法,其特征在于,包括:为指定用户预分配作业资源信息;提供作业提交界面,通过所述作业提交界面接收来自指定用户的作业数据及其作业参数;根据所述作业资源信息对所述作业数据进行包装,建立所述作业资源信息与所述作业数据之间的对应关系;当所述作业数据被调度时,根据所述作业资源信息设置所述作业数据的作业参数,以使根据所述作业参数在大数据平台运行所述作业数据。
【技术特征摘要】
1.一种Hadoop大数据平台多租户作业管理方法,其特征在于,包括:为指定用户预分配作业资源信息;提供作业提交界面,通过所述作业提交界面接收来自指定用户的作业数据及其作业参数;根据所述作业资源信息对所述作业数据进行包装,建立所述作业资源信息与所述作业数据之间的对应关系;当所述作业数据被调度时,根据所述作业资源信息设置所述作业数据的作业参数,以使根据所述作业参数在大数据平台运行所述作业数据。2.根据权利要求1所述的方法,其特征在于,所述对所述作业数据进行包装,还包括:为所述作业数据设置作业标识。3.根据权利要求2所述的方法,其特征在于,还包括:当所述作业数据信息被调度时拦截所述作业数据,判断所述作业数据信息是否设置有作业标识,若是则执行根据所述作业参数设置所述作业数据的作业参数的步骤。4.根据权利要求1所述的方法,其特征在于,还包括:生成新的作业提交模块,所述新的作业提交模块的优先级高于Hadoop原生作业提交模块;当所述作业数据被调度时,执行所述新的作业提交模块,根据所述作业资源信息设置所述作业数据的预定的作业参数。5.根据权利要求1至4中任一项所述的方法,其特征在于,所述作业资源信息包...
【专利技术属性】
技术研发人员:苏萌,刘国栋,刘钰,赵群,高俊,
申请(专利权)人:北京百分点信息科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。