一种基于presto的数据加载方法、装置及电子设备制造方法及图纸

技术编号：37369739 阅读：13 留言：0更新日期：2023-04-27 07:15

本发明专利技术属于数据处理技术领域，具体涉及一种基于presto的数据加载方法、装置及电子设备，该方法通过获取用户输入的数据库SQL语句，根据该数据库SQL语句配置kafka schema的映射关系，其中，kafka schema定义了presto和kafka元数据两者的映射关系，根据该数据库SQL语句加载kafka元数据，实现presto动态加载kafka数据，避免了重新启动presto主节点，解决现有的presto加载kafka数据时由于重新启动presto主节点，而无法对外提供服务的问题。而无法对外提供服务的问题。而无法对外提供服务的问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于presto的数据加载方法、装置及电子设备

[0001]本专利技术属于数据处理
，具体涉及一种基于presto的数据加载方法、装置及电子设备。

技术介绍

[0002]Presto是Facebook开源的MPP(Massive Parallel Processing)SQL引擎，其理念来源于一个叫Volcano的并行数据库，该数据库提出了一个并行执行SQL的模型，它被设计为用来专门进行高速、实时的数据分析。Presto是一个SQL计算引擎，分离计算层和存储层，其不存储数据，通过Connector SPI实现对各种数据源(Storage)的访问。Kafka最初由Linkedin公司开发，是一个分布式、分区的、多副本的、多订阅者，基于zookeeper协调的分布式日志系统(也可以当做MQ系统)，常见可以用于web/nginx日志、访问日志，消息服务等等，Linkedin于2010年贡献给了Apache基金会并成为顶级开源项目。
[0003]目前，现有Presto查询Kafka中数据，是通过将一个静态的配置文件JSON来定义kafka schema，该schema定义了Kafka消息数据中field到Presto表中的column映射关系。现有的方案存在如下问题：
[0004]1、如果schema发生变化，比如Kafka需要新增一个字段映射，或者删除一个字段映射，都需要重新编辑配置文件保存最新的映射关系，并且还需要重新启动Presto主节点实例来加载最新的schema。
[0005]2、...

【技术保护点】

【技术特征摘要】
1.一种基于presto的数据加载方法，其特征在于，包括：获取用户输入的数据库SQL语句；其中，所述数据库SQL语句用于配置kafkaschema的映射关系，所述kafka schema用于定义presto和kafka元数据两者的映射关系；根据所述数据库SQL语句加载kafka元数据。2.根据权利要求1所述的方法，其特征在于，所述根据所述数据库SQL语句加载kafka元数据，包括：对所述数据库SQL语句进行解析，确定语法信息、目标表信息，和/或，附加信息；根据所述语法信息、目标表信息，和/或，所述附加信息配置kafka schema的映射关系；根据所述映射关系加载所述kafka元数据。3.根据权利要求2所述的方法，其特征在于，所述根据所述语法信息、目标表信息，和/或，所述附加信息配置kafka schema的映射关系，包括：若所述语法信息为create table语句，则将所述目标表信息以及所述附加信息组装kafka schema的映射关系；若所述语法信息为alter table语句，则根据所述确定目标表信息更新kafka schema的映射关系；若所述语法信息为drop table语句，则根据所述确定目标表信息删除kafka schema的映射关系。4.根据权利要求3所述的方法，其特征在于，所述目...

【专利技术属性】
技术研发人员：秦瑞，
申请(专利权)人：上海中通吉网络技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人