The present invention provides a real-time scheduling method for large data, the method includes: the master node assignments into independent tasks, load nodes to apply to the master node and task execution; the master node operations a slice, get this slice of all two slice execution information sent to the load; load this piece of memory mapping and two slices, and then add the thread pool thread; each load node performs a two task after a reduce, send the results to the master node, the master node will send to load the reduce operation process; load allocation in accordance with the master node host list file the requirements of the task will be distributed through the map process to the load node, and from the load node through the reduce process to obtain the corresponding results merging task; intermediate results to get the final result, the main festival The final job results are communicated remotely via socket communications to corresponding task holders. The invention provides a real-time scheduling method for large data, which improves the efficiency of cloud computing to meet the needs of high-performance cloud computing.
【技术实现步骤摘要】
大数据即时调度方法
本专利技术涉及大数据,特别涉及一种大数据即时调度方法。
技术介绍
云计算通过互联网将庞大的数据存储和计算处理程序分布到集群系统的计算机中,并且提供相应的应用程序服务。用户在对资源提交访问请求时,系统能够自动地将请求切换到实际的存放资源的计算机和存储系统。虚拟化技术的云计算平台在海量数据处理方面取得了令人满意的成果。但云计算将海量数据分布在大规模集群上进行并行处理,由于目前主流云计算平台底层采用虚拟化技术,其上所有软件和应用均运行在虚拟硬件之上,这种策略必然带来一定程度上的性能降低。而且MapReduce内部实现机制是采用先存储数据再读出转发处理的策略,当中间数据量变大、个数增多时,这种模式必然产生大量的无用的磁盘I/O操作;如果数据在远端,这样会增加网络负载;如果数据在本地,则会受I/O瓶颈限制,从而降低了任务执行的效率。
技术实现思路
为解决上述现有技术所存在的问题,本专利技术提出了一种大数据即时调度方法,包括:主节点将作业分成独立的任务,并维护任务状态数组;负载节点启动后,向主节点申请任务,得到任务后按预定的方案执行任务;任务执行完成后,将任务的结果反馈给主节点并申请下一个任务;如果负载节点得到的任务信息无效,则本次并行计算任务成功完成,负载节点结束业务;从任务队列取出最高优先级的作业;主节点对作业进行分片,得到一级分片,放入负载池;主节点查询状态表得到一级分片的信息,然后获取到此分片中所有二级分片的执行信息打包发送给负载;负载接收到任务,对此片做内存映射和二次分片,检测总的核心数,建立线程池,然后将分片放入线程池,线程通过负载内部状态 ...
【技术保护点】
一种大数据即时调度方法,其特征在于,包括:主节点将作业分成独立的任务,并维护任务状态数组;负载节点启动后,向主节点申请任务,得到任务后按预定的方案执行任务;任务执行完成后,将任务的结果反馈给主节点并申请下一个任务;如果负载节点得到的任务信息无效,则本次并行计算任务成功完成,负载节点结束业务;从任务队列取出最高优先级的作业;主节点对作业进行分片,得到一级分片,放入负载池;主节点查询状态表得到一级分片的信息,然后获取到此分片中所有二级分片的执行信息打包发送给负载;负载接收到任务,对此片做内存映射和二次分片,检测总的核心数,建立线程池,然后将分片放入线程池,线程通过负载内部状态表取得二级任务分片,直到表中内容全部为执行完成;负载节点的每个线程执行完成一个二级任务分片后进行一次reduce,将reduce结果和内部状态表发送给主节点,主节点确定是否给此负载发送另外一个分片,若需要发送新的任务,则继续取任务发送给负载;直到状态表中内容全部为执行完成后,主节点给每个负载发送退出指令,负载触发事件信号,通知监控等待退出,所有负载和主节点等待一起退出;主节点将负载发送来的结果进行reduce操作;主节 ...
【技术特征摘要】
1.一种大数据即时调度方法,其特征在于,包括:主节点将作业分成独立的任务,并维护任务状态数组;负载节点启动后,向主节点申请任务,得到任务后按预定的方案执行任务;任务执行完成后,将任务的结果反馈给主节点并申请下一个任务;如果负载节点得到的任务信息无效,则本次并行计算任务成功完成,负载节点结束业务;从任务队列取出最高优先级的作业;主节点对作业进行分片,得到一级分片,放入负载池;主节点查询状态表得到一级分片的信息,然后获取到此分片中所有二级分片的执行信息打包发送给负载;负载接收到任务,对此片做内存映射和二次分片,检测总的核心数,建立线程池,然后将分片放入线程池,线程通过负载内部状态表取得二级任务分片,直到表中内容全部为执行完成;负载节点的每个线程执行完成一个二级任务分片后进行一次reduce,将reduce结果和内部状态表发送给主节点,主节点确定是否给此负载发送另外一个分片,若需要发送新的任务,则继续取任务发送给负载;...
【专利技术属性】
技术研发人员:赖真霖,文君,
申请(专利权)人:成都四象联创科技有限公司,
类型:发明
国别省市:四川,51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。