Including a Hadoop task monitoring method: (1) to perform initialization operation; (2) white users user white list: get a list of the name of the account with permissions by querying the database user name validity check for the following tasks; (3) the task of acquiring white white list tasks: get the task list by querying the database to check the legality of the task behind, on the white list to skip the task; (4) to obtain the running task task set: by Hadoop API to obtain the task set; (5) to determine whether set task is empty, is the step (6), otherwise the execution steps (8); (6) removed from the task set in a task task: remove a task from task set; (7) check the legality of single task: check the indicators of the task, judging whether the task is illegal, jump to step (5); (8). Beam. There is a system.
【技术实现步骤摘要】
一种hadoop任务监控方法及系统
本专利技术涉及大数据处理的
,尤其涉及一种hadoop任务监控方法,以及hadoop任务监控系统。
技术介绍
关于web页面实现的任务查看功能,目前用户只能查看web页面,如果任务严重拖累集群,只能手动发现、手动杀死kill。这样用户体验感很差,浪费大量劳动力。
技术实现思路
为克服现有技术的缺陷,本专利技术要解决的技术问题是提供了一种hadoop任务监控方法,其自动实时监控hadoop集群的每个任务的资源占用情况,发现任务占用资源过多将会自动关闭任务。本专利技术的技术方案是:这种hadoop任务监控方法,该方法包括以下步骤:(1)开始,执行初始化的操作;(2)获取用户白名单whiteusers:通过查询数据库获取有权限的账户名称列表,便于后面的任务用户名合法性检查;(3)获取任务白名单whitetasks:通过查询数据库获取任务白名单列表,便于后面的任务合法性检查,在白名单中的任务略过;(4)获取正在运行的任务taskset:通过hadoop的api获取任务集合;(5)判断taskset是否为空,是则执行步骤(6),否则执行步骤(8);(6)从taskset中移出一个任务task:从taskset中取出一个任务;(7)检查单个task的合法性:检查任务的各项指标,判断任务是否非法,跳转到步骤(5);(8)结束。本专利技术通过整个过程自动判定执行,准实时保护hadoop系统的安全,自动实时监控hadoop集群的每个任务的资源占用情况,发现任务占用资源过多将会自动关闭任务。还提供了一种hadoop任务监控系统,该系统包括 ...
【技术保护点】
一种hadoop任务监控方法,其特征在于:该方法包括以下步骤:(1)开始,执行初始化的操作;(2)获取用户白名单white users:通过查询数据库获取有权限的账户名称列表,便于后面的任务用户名合法性检查;(3)获取任务白名单white tasks:通过查询数据库获取任务白名单列表,便于后面的任务合法性检查,在白名单中的任务略过;(4)获取正在运行的任务task set:通过hadoop的api获取任务集合;(5)判断task set是否为空,是则执行步骤(6),否则执行步骤(8);(6)从task set中移出一个任务task:从task set中取出一个任务;(7)检查单个task的合法性:检查任务的各项指标,判断任务是否非法,跳转到步骤(5);(8)结束。
【技术特征摘要】
1.一种hadoop任务监控方法,其特征在于:该方法包括以下步骤:(1)开始,执行初始化的操作;(2)获取用户白名单whiteusers:通过查询数据库获取有权限的账户名称列表,便于后面的任务用户名合法性检查;(3)获取任务白名单whitetasks:通过查询数据库获取任务白名单列表,便于后面的任务合法性检查,在白名单中的任务略过;(4)获取正在运行的任务taskset:通过hadoop的api获取任务集合;(5)判断taskset是否为空,是则执行步骤(6),否则执行步骤(8);(6)从taskset中移出一个任务task:从taskset中取出一个任务;(7)检查单个task的合法性:检查任务的各项指标,判断任务是否非法,跳转到步骤(5);(8)结束。2.根据权利要求1所述的hadoop任务监控方法,其特征在于:所述步骤(7)包括以下分步骤:(7.1)初始化任务信息;(7.2)判断提交任务的用户是否在用户白名单中,是则执行步骤(7.3),否则执行步骤(7.8);(7.3)判断该任务是否为白名单任务,如果是则放弃检查,执行步骤(7.9),否则执行步骤(7.4);(7.4)判断检查任务的map数是否超出规定,如果是则执行步骤(7.8),否则执行步骤(7.5);(7.5)判断检查任务的reduce数是否超出规定,如果是则执行步骤(7.8),否则执行步骤(7.6);(7.6)判断检查任务的输出量是否超出规定,如果是则执行步骤(7.8),否则执行步骤(7.7);(7.7)判断检查任务的运行时间是...
【专利技术属性】
技术研发人员:崔晶晶,吴淑佳,
申请(专利权)人:北京集奥聚合科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。