数据处理方法、装置、电子设备及可读存储介质制造方法及图纸

技术编号：25834423 阅读：21 留言：0更新日期：2020-10-02 14:15

本申请实施例提供了一种数据处理方法、装置、电子设备及可读存储介质。该方法由终端设备执行，该方法包括：获取数据处理请求，数据处理请求中包括待执行代码文件；加载待执行代码文件所对应的Spark任务执行文件；通过运行Spark任务执行文件，生成待执行代码文件对应的Spark对象；启动Spark对象对应的线程，通过线程将待执行代码文件中的待执行代码发送至Spark集群，以使Spark集群运行待执行代码，并返回运行待执行代码的运行结果。在本申请实施例中，在获取到待执行代码时，只需设置核心处理逻辑即可在终端设备中将待执行代码发送至Spark集群，简化了运行待执行代码的流程，还提高了灵活性和扩展性。

全部详细技术资料下载

【技术实现步骤摘要】
数据处理方法、装置、电子设备及可读存储介质
本申请涉及计算机
，具体而言，本申请涉及一种数据处理方法、装置、电子设备及可读存储介质。
技术介绍
如图1所示，现有技术中在使用NiFi工具执行Spark任务时，需要启动额外的livy服务器(图中的Livy服务器)将Spark任务提交到Spark集群中运行，具体可以包括：NiFi处理器在获取到待执行代码后，通过http(HyperTextTransferProtocol，超文本传输协议)请求方式将待执行代码发送到livy服务器，然后由livy服务器将执行代码提交到Spark集群中运行，Spark集群运行待执行代码后将运行结果返回至NiFi中。但是，在这过程中需要额外安装配置livy服务器，进而在使用NiFi执行Spark任务时便增加了使用的复杂度、降低了处理效率，并且在扩展灵活性等方面不够灵活。
技术实现思路
本申请的目的旨在至少能解决上述的技术缺陷之一。一方面，本申请实施例提供了一种数据处理方法，该方法由终端设备执行，该方法包括：获取数据处理请求，数据处理请求中包括待执行代码文件；加载待执行代码文件所对应的Spark任务执行文件；通过运行Spark任务执行文件，生成待执行代码文件对应的Spark对象；启动Spark对象对应的线程，通过线程将待执行代码文件中的待执行代码发送至Spark集群，以使Spark集群运行待执行代码，并返回运行待执行代码的运行结果。另一方面，本申请实施例提供了一种数据处...

【技术保护点】
1.一种数据处理方法，其特征在于，所述方法由终端设备执行，所述方法包括：/n获取数据处理请求，所述数据处理请求中包括待执行代码文件；/n加载所述待执行代码文件所对应的Spark任务执行文件；/n通过运行所述Spark任务执行文件，生成所述待执行代码文件对应的Spark对象；/n启动所述Spark对象对应的线程，通过所述线程将所述待执行代码文件中的待执行代码发送至Spark集群，以使所述Spark集群运行所述待执行代码，并返回运行所述待执行代码的运行结果。/n

【技术特征摘要】
1.一种数据处理方法，其特征在于，所述方法由终端设备执行，所述方法包括：
获取数据处理请求，所述数据处理请求中包括待执行代码文件；
加载所述待执行代码文件所对应的Spark任务执行文件；
通过运行所述Spark任务执行文件，生成所述待执行代码文件对应的Spark对象；
启动所述Spark对象对应的线程，通过所述线程将所述待执行代码文件中的待执行代码发送至Spark集群，以使所述Spark集群运行所述待执行代码，并返回运行所述待执行代码的运行结果。

2.根据权利要求1所述的方法，其特征在于，所述加载所述待执行代码文件所对应的Spark任务执行文件，包括：
确定所述待执行代码文件的编程语言类型；
根据所述编程语言类型，加载所述编程语言类型对应的Spark任务执行文件。

3.根据权利要求2所述的方法，其特征在于，所述编程语言类型为Scala编程语言或python编程语言；
若所述编程语言类型为Scala编程语言，所述启动所述Spark对象对应的线程，通过所述线程将所述待执行代码文件中的待执行代码发送至Spark集群，包括：
通过所述线程创建对应于所述编程语言类型的解释器对象；
通过所述解释器对象，将所述待执行代码文件中的待执行代码发送至Spark集群。

4.根据权利要求3所述的方法，其特征在于，所述通过所述解释器对象，将所述待执行代码文件中的待执行代码发送至Spark集群，包括：
加载所述待执行代码文件中的待执行代码；
启动所述解释器对象，并通过所述解释器对象对加载的所述待执行代码进行编译，得到编译后的执行代码；
将所述编译后的执行代码发送至Spark集群。

5.根据权利要求4所述的方法，其特征在于，所述通过所述解释器对象对加载的所述待执行代码进行编译，得到编译后的执行代码之前，还包括：
将加载的所述待执行代码封装为可运行类；
所述通过所述解释器对象对加载的所述待执行代码进行编译，得到编译后的执行代码，包括：
通过所述解释器对象对所述可运行类进行编译，得到编译后的执行代码。

6.根据权利要求1至5任一项所述的方法，其特征在于，所述方法还包括：
接收查询请求...

【专利技术属性】
技术研发人员：缪洲光，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人