【技术实现步骤摘要】
本申请涉及大数据处理,尤其是一种hive表转换为数据湖表的方法及装置。
技术介绍
1、现有的数据湖框架如iceberg、hudi、paimon等,已经支持了将hive转换为对应的数据湖表。以spark和paimon为例,其中spark是大数据计算引擎。paimon提供了一个名为migrate_table的存储过程,使用spark sql执行以下sql语句:call sys.migrate_table(source_type=>'hive',table=>'db.srctable',options=>'x1=y1,x2=y2');即可将hive中的tbl表转换为paimon表,表名不变。
2、spark在执行migrate_table这个存储过程的过程中,会执行以下操作:
3、1.获取srctable的元数据信息;
4、2.创建一个表名为srctable_paimon_的paimon表;
5、3.将srctable下的文件移动到srctable_paimon_对应的hdfs
...【技术保护点】
1.一种Hive表转换为数据湖表的方法,其特征在于,包括:
2.根据权利要求1所述的Hive表转换为数据湖表的方法,其特征在于,创建用于被Spark SQL调用的存储过程,包括:
3.根据权利要求2所述的Hive表转换为数据湖表的方法,其特征在于,所述ProcedureParameter数组对象包括source_type、table、target_table和options。
4.根据权利要求2所述的Hive表转换为数据湖表的方法,其特征在于,创建目标Paimon表,包括:
5.根据权利要求1所述的Hive表转换为数据湖
...【技术特征摘要】
1.一种hive表转换为数据湖表的方法,其特征在于,包括:
2.根据权利要求1所述的hive表转换为数据湖表的方法,其特征在于,创建用于被spark sql调用的存储过程,包括:
3.根据权利要求2所述的hive表转换为数据湖表的方法,其特征在于,所述procedureparameter数组对象包括source_type、table、target_table和options。
4.根据权利要求2所述的hive表转换为数据湖表的方法,其特征在于,创建目标paimon表,包括:
5.根据权利要求1所述的hive表转换为数据湖表的方法,其特征在于,通过spark读取源hive表的数据,包括:
6.根据权利要求1所述的hive表转换为...
【专利技术属性】
技术研发人员:徐超,梁伟雄,闵佳,
申请(专利权)人:杭州玳数科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。