基于Spark的离线数据处理系统、运行方法、设备及介质技术方案

技术编号：37817258 阅读：17 留言：0更新日期：2023-06-09 09:48

本发明专利技术公开了一种基于Spark的离线数据处理系统、运行方法、设备及介质，包括：可视化交互层，用于提供离线数据的任务节点配置界面和工作流配置界面，并将配置好的工作流发送至解释执行层；解释执行层，用于接收可视化交互层发送来的工作流，按照预设的调度执行策略，读取工作流中的任务节点并将经解释器处理后的任务节点发送至数据处理层；数据处理层，用于接收经解释器处理过的任务节点，将Spark作为计算引擎，运行任务节点，得到运行结果；可视化交互层，用于提供结果显示界面，将接收到的运行结果展示在结果显示界面上。采用本发明专利技术实施例能够方便用户以较小的学习成本完成海量数据的处理分析，降低了海量数据处理操作的门槛。槛。槛。

全部详细技术资料下载

【技术实现步骤摘要】
基于Spark的离线数据处理系统、运行方法、设备及介质

[0001]本专利技术涉及基于Spark的离线数据处理
，尤其涉及一种基于Spark的离线数据处理系统、运行方法、设备及介质。

技术介绍

[0002]当前海量数据处理分析工具中，以Apache Flink和Apache Spark为代表的流、批混合计算引擎(平台)拥有较大的流行度。Flink的批处理模型在很大程度上仅是对流处理模型的扩展，而Spark为流处理系统采用批处理的方法，需要对进入系统的数据进行缓冲，等待缓冲区清空会导致延迟增高，不适合处理对延迟有较高要求的工作负载。因此，Spark引擎(平台)更适合离线批处理需求下的数据处理任务。然而基于Spark的数据处理分析应用在开发、测试、使用过程中，仍面临使用门槛普遍较高问题，例如使用者需要具备专业的数据处理知识、学习掌握工具的处理方法、要求具备一定的编码能力等。

技术实现思路

[0003]本专利技术实施例的目的是提供一种基于Spark的离线数据处理系统、运行方法、设备及介质，通过对离线数据的计算处理可配置化，方便用户以较小的学习成本完成海量数据的处理分析，降低了海量数据处理操作的门槛。
[0004]为实现上述目的，本专利技术实施例提供了一种基于Spark的离线数据处理系统，包括：
[0005]可视化交互层，用于提供离线数据的任务节点配置界面和工作流配置界面，并将配置好的工作流发送至解释执行层；其中，所述工作流包括若干配置好的任务节点；
[0006]所述解释执行层，...

【技术保护点】

【技术特征摘要】
1.一种基于Spark的离线数据处理系统，其特征在于，包括：可视化交互层，用于提供离线数据的任务节点配置界面和工作流配置界面，并将配置好的工作流发送至解释执行层；其中，所述工作流包括若干配置好的任务节点；所述解释执行层，用于接收所述可视化交互层发送来的所述工作流，按照预设的调度执行策略，读取所述工作流中的任务节点并将经解释器处理后的所述任务节点发送至数据处理层；所述数据处理层，用于接收经所述解释器处理过的任务节点，将Spark作为计算引擎，运行所述任务节点，得到运行结果；所述可视化交互层，用于提供结果显示界面，将接收到的所述运行结果展示在所述结果显示界面上。2.如权利要求1所述的基于Spark的离线数据处理系统，其特征在于，所述任务节点配置界面包括：任务节点名称输入子界面、数据源字段输入子界面、计算程序类型选择子界面、Spark应用名称输入子界面、Spark运行参数输入子界面、输出返回值确定子界面和任务节点配置保存确定子界面。3.如权利要求1所述的基于Spark的离线数据处理系统，其特征在于，所述工作流配置界面包括：工作流名称输入子界面、任务节点放置子界面、工作流调度执行策略选择界面、工作流数据共享确认界面和工作流配置保存子界面。4.如权利要求3所述的基于Spark的离线数据处理系统，其特征在于，响应于用户的工作流数据共享确认指令，所述解释执行层还用于：实例化任意一个org.apache.spark.repl.SparkILoop类的对象SparkILoop；通过所述对象SparkILoop，调用getAddedJars()方法，加载org.apache.spark.repl.Main所依赖的外部Jar包环境，获取所述外部Jar包环境的路径；通过所述对象SparkILoop，实例化解释器类IMain的对象intp；由所述解释器类IMain的对象intp，通过Java的反射机制，获取repl class uri地址的属性值；将预设的外部环境配置参数、所述属性值和所述路径传递到SparkConf中；由repl包通过SparkConf生成一个新的SparkContext对象；将需要执行的任务节点交给所述解释器类IMain的对象intp，并将得到的经所述解释器类IMain的对象intp...

【专利技术属性】
技术研发人员：羊少帅，张铁山，刘韧，廖海波，
申请(专利权)人：中电科普天科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人