一种分布式大数据组件统一服务引擎设计方法技术

技术编号：38565963 阅读：11 留言：0更新日期：2023-08-22 21:04

本发明专利技术提供了一种分布式大数据组件统一服务引擎设计方法、设备和计算机可读存储介质，方法包括如下步骤：根据大数据计算框架spark/flink的特点，在系统中以jonName

全部详细技术资料下载

【技术实现步骤摘要】
一种分布式大数据组件统一服务引擎设计方法

[0001]本专利技术涉及服务引擎
，具体而言，涉及一种分布式大数据组件统一服务引擎设计方法、设备和计算机可读存储介质。

技术介绍

[0002]本专利技术对于
技术介绍
的描述属于与本专利技术相关的相关技术，仅仅是用于说明和便于理解本专利技术的
技术实现思路
，不应理解为申请人明确认为或推定申请人认为是本专利技术在首次提出申请的申请日的现有技术。
[0003]随着互联网急速发展，大量互联网公司开始研发大数据平台，表现为对组件技术和数据的统一整合，对开发的低成本期望也越来越高，这些变化催生了对大数据平台的变革和创新。但是如何高效整合大数据组件并对外开放接口功能成为了大数据平台亟待解决的问题。特别是与后端及其他技术部门的解耦和使用成为了大数据平台要解决的问题之一。
[0004]目前大数据平台通常采用SPARK、FLINK计算框架作为平台的离线引擎和实时引擎，主流HADOOP、HIVE进行存储和资源调度，并结合其他大数据生态组件来满足用户对数据进行查询和计算的需求。传统的做法是将hdfs、hive、kafka等较为简单的大数据组件的基本操作放在后端微服务系统中，由后端维护；而spark、flink较为复杂的大数据引擎则放在大数据部门进行研发和维护。对于前者来讲实现简单，但是如果后端和大数据部门基于某个组件涉及到相同业务时，则需要两个部门同时修改内部逻辑，这在开发的时候无疑带来了巨大的精力消耗；对于后者来讲，将spark、flink较为复杂的大数据引擎放在大数据部门研发...

【技术保护点】

【技术特征摘要】
1.一种分布式大数据组件统一服务引擎设计方法，其特征在于，包括如下步骤：根据大数据计算框架spark/flink的特点，在系统中以jonName
‑
plugins
‑
module的组织方式来引用相关业务开发的源码包和配置文件以及启动脚本，不依赖其他jar包，提供大数据计算引擎中核心的计算引擎层；对具有相同特点的计算框架按照上述步骤进行添加，并通过前缀进行区分。2.根据权利要求1所述的分布式大数据组件统一服务引擎设计方法，其特征在于，还包括如下步骤：所述大数据计算引擎通过engine
‑
module的组织方式将大数据生态组件进行整合。3.根据权利要求2所述的分布式大数据组件统一服务引擎设计方法，其特征在于，所述整合操作包括如下步骤：通过engine
‑
hbase模块整合hbase
‑
API相关操作，提供hbase核心操作支撑能力并作为大数据计算引擎系统中hbase底层处理引擎；通过engine
‑
hive模块整合hive
‑
API相关操作，提供hive核心操作支撑能力并作为大数据计算引擎系统中hive底层处理引擎；通过engine
‑
kafka模块整合kafka
‑
API相关操作，提供kafka核心操作支撑能力并作为大数据计算引擎系统中kafka底层处理引擎；通过engine
‑
hdfs模块整合hdfs
‑
API相关操作，提供hdfs核心操作支撑能力并作为大数据计算引擎系统中hdfs底层处理引擎；通过engine
‑
yarn模块整合yarn
‑
API相关操作，提供yarn核心操作支撑能力并作为大数据计算引擎系统中yarn底层处理引擎。4.根据权利要求3所述的分布式大数据组件统一服务引擎设计方法，其特征在于，所述整合操作中的各个步骤均不依...

【专利技术属性】
技术研发人员：杨娟，杨再飞，翟士丹，高亮，
申请(专利权)人：北京海致星图科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人