【技术实现步骤摘要】
基于敏捷数据仓库的运维系统及方法
[0001]本专利技术涉及数据仓库运维管理
,具体地说,涉及基于敏捷数据仓 库的运维系统及方法。
技术介绍
[0002]随着大数据的快速发展、数据量的爆炸性增长,传统数据库已经无法满足 企业的需求,数据仓库也就应运而生。数据仓库是数据库的一种概念上的升级, 可以容纳更多的数据及更加庞大的数据集,其目标是实现跨系统数据共享、解 决信息孤岛、提升数据质量、辅助决策分析及提供统一的数据服务,为企业的 决策制定过程提供所有类型数据支撑的战略集合。同时,数据仓库的运行过程 中也面临着各种挑战,主要为:随着数据仓库的建设规模越来越大,这些数据 仓库系统往往拥有很大的服务器规模,再加上其他设备,一个大型数据仓库运 行过程中需要管理同时运行的大量设备,因此随着数据仓库业务的不断变化, 也伴随着数仓设备不断出现的各类故障问题,导致数据仓库的运维工作难以 管理且运维成本高昂。从而自动化运维、远程运维、智能网管以及敏捷运维等 都纷纷产生,经过几年的技术演进,目前只有敏捷运维却变得越来越火。数据 仓库的运维方式主要是由操作员通过工作机远程登陆到数据仓库系统中的相 关主机,对主机进行调度系统、数据库、磁盘、软件环境、数据情况等方面的 检查维护操作,查找批处理的运行情况并上报以便及时处理。然而,数据仓库 的运维工作量大、运维项目繁琐,目前却没有较为完善的数据仓库的运维系统 及方法,往往需要投入大量的运维人员,导致运维工作耗时长、成本高且容易 出现遗漏,鉴于此,我们提出了基于敏捷数据仓库的运维系统及方法。< ...
【技术保护点】
【技术特征摘要】
1.基于敏捷数据仓库的运维系统,其特征在于:包括 基建管理单元(100)、运维作业单元(200)、异常管理单元(300)和 定期任务单元(400);所述基建管理单元(100)、所述运维作业单元(200)、 所述异常管理单元(300)与所述定期任务单元(400)依次通过网络通信连接; 所述基建管理单元(100)用于对支撑系统运行的基建设备进行集中的连接管 控;所述运维作业单元(200)用于对数仓的日常运维工作进行作业分配和管 理;所述异常管理单元(300)用于对数仓及系统运行过程中的异常情况进行 监测并进行故障处理操作;所述定期任务单元(400)用于通过程序设定定期 的任务对数仓的运维工作进行完善和补充; 所述基建管理单元(100)包括数据仓库模块(101)、运维终端模块(102)、 工具管理模块(103)和用户管理模块(104); 所述运维作业单元(200)包括数据检查模块(201)、数库检查模块(202)、 ETL 处理模块(203)和异常处理模块(204); 所述异常管理单元(300)包括备份系统模块(301)、故障监测模块(302)、 业务转移模块(303)和隔离自愈模块(304); 所述定期任务单元(400)包括数据备份模块(401)、运维日志模块(402)、 系统重启模块(403)和总结统计模块(404)。2.根据权利要求 1 所述的基于敏捷数据仓库的运维系统,其特征在于: 所述数据仓库模块(101)、所述运维终端模块(102)、所述工具管理模块(103) 与所述用户管理模块(104)依次通过网络通信连接;所述数据仓库模块(101) 用于根据业务需求按照常规流程搭建敏捷数据仓库的架构体系并正常投入使 用;所述运维终端模块(102)用于在数仓架构基础上增设部分终端设备以承 载运维系统的软件平台来支撑运维工作;所述工具管理模块(103)用于通过 开发工具开发软件自动化管理平台并载入多种敏捷运维工具来满足数仓运维 的需求;所述用户管理模块(104)用于给用户提供访问系统的通道并根据用 权 利 要 求 书 2 户的身份开放相应的操作权限。3.根据权利要求 2 所述的基于敏捷数据仓库的运维系统,其特征在于: 所述工具管理模块(103)包括自动部署模块(1031)、数据扩容模块(1032)、 资源调配模块(1033)和配置下发模块(1034);所述自动部署模块(1031)、 所述数据扩容模块(1032)、所述资源调配模块(1033)与所述配置下发模块 (1034)依次通过网络通信连接;所述自动部署模块(1031)用于通过软件自 动化管理使敏捷运维工具在平台上完成自动化部署,并通过工具实现数仓业 务的快速自动部署;所述数据扩容模块(1032)用于通过在敏捷运维软件工具 上做业务部署来实现数据中心的扩容操作,不需关注数仓基础架构的实现,也 不需增加运维人员,并可以增强运维工具的监控效果;所述资源调配模块 (1033)用于通过各敏捷软件工具之间的自动互联互通来快速进行底层的资 源调配;所述配置下发模块(1034)用于通过软件自动下发系统的底层资源调 配及网络配置。4.根据权利要求 3 所述的基于敏捷数据仓库的运维系统,其特征在于: 所述资源调配模块(1033)中,资源调配过程中采用作业优先级算法,其计算 公式为: 푃푗 [
푖
] = 푃표 [
푖
] + 푁
ꢀ∗ꢀ
푇푤푎푖푡
; 其中,
푃표 [
푖
]为作业提交时指定的优先级,
푇푤푎푖푡
为作业在队列中等待的时 间,
푁
为常数因子,随着等待时间的增加,作业优先级动态的增加,直到增加 到阈值,即最高优先级。5.根据权利要求 2 所述的基于敏捷数据仓库的运维系统,其特征在于: 所述数据检查模块(201)、所述数库检查模块(202)、所述 ETL 处理模块 (203)与所述异常处理模块(204)依次通过网络通信连接且并列运行;所述 数据检查模块(201)用于每日在数据仓库
启动批处理程序之前对源头的数据 和生产处的数据进行检查以确保当日批处理程序正常作业;所述数库检查模 权 利 要 求 书 3 块(202)用于每日定时查看数据仓库中包括 STAGE、APP_SPACE、PDM 等各子 库的空间情况,每日查看磁盘、磁带是否余有以便数据备份需求的足够空间, 并在空间不足时及时同时管理员来分配库空间或增加磁盘空间;所述 ETL 处 理模块(203)用于通过 ETL 批处理工具对数据仓库运行过程中的对数据进行 ETL 全过程中的各主要项目进行检测管理;所述异常处理模块(204)用于由 运维人员按照预设程序查找数仓问题、找到原因并上报,指定处理方案、在获 得数仓客户的授权后执行实时,并详细记录整个处理过程。6.根据权利要求 5 所述的基于敏捷数据仓库的运维系统,其特征在于: 所述数据检查模块(201)包括常规数据模块(2011)、转定长传输模块(2012)、 源数据传输模块(2013)和下游系统数据模块(2014);所述常规数据模块 (2011)、所述转定长传输模块(2012)、所述源数据传输模块(2013)与所 述下游系统数据模块(2014)依次通过网络通信连接且并列运行;所述常规数 据模块(2011)...
【专利技术属性】
技术研发人员:王洋,孙佳亮,杜斌,
申请(专利权)人:中建材信云智联科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。