The invention provides an intelligent big data training method and system based on a scalable cluster. The training system includes management module, content teaching module and evaluation module; the management module realizes the management of script template, the management of docker basic image that big data training relies on as the execution environment and the management of all data sets in the operation process of the training system; the content teaching module is used by the training instructor to create the training model and realize the interaction between the training trainees and the training system The evaluation module is used to realize task management, container life cycle management, resource management and storage management of the training system. The invention proposes a teaching mechanism of tutor compiling practical training, trainees learning practical training and trainees challenging practical training, realizing the organic unity of \teaching learning using\. In addition, using kubernetes's easy to expand feature, the dynamic adjustment of cluster can be realized according to the background load in the process of students' challenge training, ensuring the reasonable and efficient use of resources.
【技术实现步骤摘要】
基于可伸缩集群的智能化大数据实训方法及系统
本申请涉及大数据实训
,特别是涉及一种基于可伸缩集群的智能化大数据实训方法及系统。
技术介绍
随着大数据时代的到来,互联网信息产业迎来了新一轮的发展高潮,大数据已经渗透到当今各个行业和业务功能区域,成为一个重要的生产要素。随之,市场上对大数据人才的需求量日渐增长,根据2018年6月的大数据人才报告,全国只有46万个大数据人才,未来3-5年人才缺口将高达150万。由此可见,大数据人才培养问题是现阶段大数据发展亟待解决的问题。目前,诸多在线教育平台和机构都设立了大数据技术模块,侧重关注对于大数据技术的教授和实验练习,这些平台的基本思路是通过视频或者文字讲授的方式拆解一门技术,循序渐进的引导学员进行学习和实验。典型的平台包括MOOC平台,实验楼等。MOOC平台以讲师视频授课的形式存在,一个系列的课程比如被分成多个小节,每个小节从几十分钟到几个小时不等,通常讲述一个知识点或者本门技术的一个特性,一门课程结束后通常会辅以课后的练习作业,并提供相应的讨论区模块供学员讨论交流。实验楼是近几年兴起的一种比较新颖的模式,侧重实验,其工作区域分为左右两个模块,左侧为本实验的相关知识和实验内容,右侧为模拟实验区域,学员在学习和了解相关知识之后,通过实验楼提供的在线Linux系统作为基础实验环境进行试验,在实验过程中,学员可以记录笔记和截图,作为其实验报告内容。上述提及的两种教育模式能够教授学员大数据
的基本知识,基本原理,但是缺乏对于学员的复杂工程能力和实际解决问题的 ...
【技术保护点】
1.基于可伸缩集群的智能化大数据实训系统,其特征在于,包括管理模块、内容教学模块以及评测模块;/n管理模块实现对脚本模板管理,大数据实训所依赖作为执行环境的Docker基础镜像的管理以及实训系统运行过程所有数据集的管理;/n内容教学模块用于实训导师创建实训模型,同时实现实训学员与实训系统的交互;/n评测模块用于实现实训系统的任务管理,容器生命周期管理,资源管理以及存储管理。/n
【技术特征摘要】
1.基于可伸缩集群的智能化大数据实训系统,其特征在于,包括管理模块、内容教学模块以及评测模块;
管理模块实现对脚本模板管理,大数据实训所依赖作为执行环境的Docker基础镜像的管理以及实训系统运行过程所有数据集的管理;
内容教学模块用于实训导师创建实训模型,同时实现实训学员与实训系统的交互;
评测模块用于实现实训系统的任务管理,容器生命周期管理,资源管理以及存储管理。
2.根据权利要求1所述的基于可伸缩集群的智能化大数据实训系统,其特征在于,
管理模块包括脚本模板管理模块,DockerRegistry管理模块及数据仓库管理模块;
脚本模板管理模块为每一技术类型的实训提供对应脚本模板的网页端管理接口;
DockerRegistry管理模块,用于管理大数据实训所依赖作为执行环境的Docker基础镜像,提供对镜像的新增、删除、版本迭代功能,以及Docker集群之间的镜像同步功能;同时,通过Docker的Cgroups机制对评测容器的资源进行限定,防止评测容器资源消耗过大,而导致物理节点宕机;
数据仓库管理模块,以版本库的形式管理系统运行过程中所有实训的代码及大数据实训相关的数据集,提供代码版本回溯以及数据集在线更新功能。
3.根据权利要求1所述的基于可伸缩集群的智能化大数据实训系统,其特征在于,
内容教学模块包括实训模板模块和学员实训模块;
实训模板模块,是实训导师创建的实训模型,为实训导师提供任务关卡管理,基础代码版本库管理,数据集管理,脚本管理和实训附加配置管理;
学员实训模块是实训学员与实训系统的交互模块,是实训学员基于实训模型创建的实例,在每一个学员实训开启时,实训系统会为实训学员fork一份实训模板模块的版本库作为基础代码库,同时根据实训配置为实训学员准备实训环境,实训学员依赖学员实训模块完成练习之后,提交测评,实训系统发送评测请求到评测模块。
4.根据权利要求1所述的基于可伸缩集群的智能化大数据实训系统,其特征在于,
评测模块,包括任务管理模块,容器生命周期管理模块,资源管理模块及存储管理模块;
任务管理模块,基于Kubernetes的调度策略将不同的评测请求,调度至不同的工作节点,启动相应的容器...
【专利技术属性】
技术研发人员:黄井泉,尹刚,杨树明,马宁,钟金,何振远,
申请(专利权)人:湖南智擎科技有限公司,
类型:发明
国别省市:湖南;43
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。