基于不同计算机语言的数据处理方法、系统、介质及设备技术方案

技术编号:33555149 阅读:18 留言:0更新日期:2022-05-26 22:51
本发明专利技术提供一种基于不同计算机语言的数据处理方法、系统、介质及设备,包括:令第一计算机语言与第二计算机语言进行文件共享,利用所述第一计算机语言对所述原始数据文件中的原始数据进行预处理,将预处理后的原始数据存放于所述文件共享系统中,利用所述第二计算机语言由所述文件共享系统中读取预处理后的原始数据,进行数据处理;或令所述第一计算机语言与所述第二计算机语言进行数据共享,将预处理后的原始数据转换为所述第二计算机语言对应的数据结构文件,由所述第二计算机语言直接对所述数据结构文件进行数据处理。本发明专利技术提供了一种便捷的计算系统方法,融合了不同计算机语言各自的强大的功能,且弥补各自的不足。且弥补各自的不足。且弥补各自的不足。

【技术实现步骤摘要】
基于不同计算机语言的数据处理方法、系统、介质及设备


[0001]本专利技术属于数据处理的
,涉及一种数据处理方法,特别是涉及一种基于不同计算机语言的数据处理方法、系统、介质及设备。

技术介绍

[0002]目前,在进行数据处理和统计分析时,数据科学工具的选择成了亟待解决的问题。在实际工作中,对于小数据集的数据操作和可视化,excel是比较好的选择,当数据集达到了一定规模时,excel的处理效率就会越来越慢且无法满足复杂的计算,对于大数据处理操作,一般会选择Python,因为Python有强大的数据科学处理开源库,如pandas、numpy等可以高效的完成数据处理和计算。对于一般的数据统计分析场景,SPSS(Statistical Product and Service Solutions,统计产品与服务解决方案)等统计分析软件可以提供大多数统计分析功能,输出可视化分析图表,但是SPSS等软件的统计理论和方法支持也有限,且难以满足个性化的统计分析需求,由此一般会选择R进行统计分析,因为相比于统计软件,R拥有自己的脚本语言和丰富的开源统计库。在脚本语言方面,Python在泛型编程上更具有优势,在API(Application Programming Interface,应用程序接口)构建问题上,Python也可以快速实现轻量级的API,而R则比较复杂。综上,现有统计分析工具存在的问题主要集中在以下方面:(1)现有的统计分析工具是相互独立。(2)对于复杂的统计分析任务,单个统计工具无法独立完成。(3)R语言是专业统计分析语言,但是在工程化和API构建方面略显不足。(4)Python语言是计算机工程语言且拥有强大的数据科学处理能力,但是在统计分析上不如R语言。(5)需要同时掌握Python和R语言能力的专业人员才能使用。
[0003]因此,如何提供一种基于不同计算机语言的数据处理方法、系统、介质及设备,以解决现有技术无法将不同数据处理分析工具结合使用,利用各自的优点并规避各自的不足等缺陷,成为本领域技术人员亟待解决的技术问题。

技术实现思路

[0004]鉴于以上所述现有技术的缺点,本专利技术的目的在于提供一种基于不同计算机语言的数据处理方法、系统、介质及设备,用于解决现有技术无法将不同数据处理分析工具结合使用,利用各自的优点并规避各自的不足的问题。
[0005]为实现上述目的及其他相关目的,本专利技术一方面提供一种基于不同计算机语言的数据处理方法,所述基于不同计算机语言的数据处理方法包括:令第一计算机语言与第二计算机语言进行文件共享,原始数据文件存放于一文件共享系统的预设路径中,利用所述第一计算机语言对所述原始数据文件中的原始数据进行预处理,将预处理后的原始数据存放于所述文件共享系统中,利用所述第二计算机语言由所述文件共享系统中读取预处理后的原始数据,进行数据处理;或令所述第一计算机语言与所述第二计算机语言进行数据共享,原始数据文件存放于一文件共享系统的预设路径中,利用所述第一计算机语言对所述原始数据文件中的原始数据进行预处理,将预处理后的原始数据转换为所述第二计算机语
言对应的数据结构文件,由所述第二计算机语言直接对所述数据结构文件进行数据处理,将数据处理结果转换为所述第一计算机语言对应的数据结构文件。
[0006]于本专利技术的一实施例中,所述第一计算机语言包括Python语言,所述第二计算机语言包括R语言。
[0007]于本专利技术的一实施例中,在所述第一计算机语言与所述第二计算机语言进行文件共享时,将预处理后的原始数据存放于所述文件共享系统的预设目录中,生成待处理任务加入至任务队列系统中,等待所述第二计算机语言由所述文件共享系统中读取预处理后的原始数据,进行数据处理。
[0008]于本专利技术的一实施例中,在所述第一计算机语言与所述第二计算机语言进行数据共享时,将预处理后的原始数据放于内存中,在所述内存中转换为所述第二计算机语言对应的数据结构文件,由所述第二计算机语言直接对所述数据结构文件进行数据处理,将数据处理结果在所述内存中转换为所述第一计算机语言对应的数据结构文件。
[0009]于本专利技术的一实施例中,在所述将数据处理结果转换为所述第一计算机语言对应的数据结构文件的步骤之后,所述基于不同计算机语言的数据处理方法还包括:将所述第一计算机语言对应的数据结构文件返回至用户的终端。
[0010]于本专利技术的一实施例中,利用所述第一计算机语言对所述原始数据文件中的原始数据进行预处理包括:数据读取、数据清洗、数据验证和数据格式转换。
[0011]为实现上述目的及其他相关目的,本专利技术另一方面提供一种基于不同计算机语言的数据处理系统,其特征在于,所述基于不同计算机语言的数据处理系统包括:第一计算机语言模块、第二计算机语言模块、文件共享系统模块和内存管理模块;令第一计算机语言与第二计算机语言进行文件共享,原始数据文件存放于一文件共享系统的预设路径中,所述第一计算机语言模块利用所述第一计算机语言对所述原始数据文件中的原始数据进行预处理,将预处理后的原始数据存放于所述文件共享系统模块的文件共享系统中,所述第二计算机语言模块利用所述第二计算机语言由所述文件共享系统中读取预处理后的原始数据,进行数据处理;或令所述第一计算机语言与所述第二计算机语言进行数据共享,原始数据文件存放于一文件共享系统的预设路径中,所述第一计算机语言模块利用所述第一计算机语言对所述原始数据文件中的原始数据进行预处理,将预处理后的原始数据放于所述内存管理模块的内存中,在所述内存中转换为所述第二计算机语言对应的数据结构文件,所述第二计算机语言模块利用所述第二计算机语言直接对所述数据结构文件进行数据处理,将数据处理结果在所述内存中转换为所述第一计算机语言对应的数据结构文件。
[0012]于本专利技术的一实施例中,所述基于不同计算机语言的数据处理系统还包括:任务管理系统模块,用于负责任务调度和资源调度,保障数据处理任务顺利执行,资源合理应用;API框架:用于与外部软件或系统以API访问方式进行调用。
[0013]为实现上述目的及其他相关目的,本专利技术又一方面提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现所述的基于不同计算机语言的数据处理方法。
[0014]为实现上述目的及其他相关目的,本专利技术最后一方面提供一种电子设备,包括:处理器及存储器;所述存储器用于存储计算机程序,所述处理器用于执行所述存储器存储的计算机程序,以使所述电子设备执行所述的基于不同计算机语言的数据处理方法。
[0015]如上所述,本专利技术所述的基于不同计算机语言的数据处理方法、系统、介质及设备,具有以下有益效果:
[0016]本专利技术可以将不同数据处理分析工具结合使用,利用各自的优点并规避各自的不足,针对Python语言和R语言,具体提供了一种便捷的使用Python调用R语言的计算系统方法,融合了Python和R的各自的强大的功能,弥补各自的不足。功能涵盖数据处理、数据统计分析、数据建模等数据科学重要的部分,提本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于不同计算机语言的数据处理方法,其特征在于,所述基于不同计算机语言的数据处理方法包括:令第一计算机语言与第二计算机语言进行文件共享,原始数据文件存放于一文件共享系统的预设路径中,利用所述第一计算机语言对所述原始数据文件中的原始数据进行预处理,将预处理后的原始数据存放于所述文件共享系统中,利用所述第二计算机语言由所述文件共享系统中读取预处理后的原始数据,进行数据处理;或令所述第一计算机语言与所述第二计算机语言进行数据共享,原始数据文件存放于一文件共享系统的预设路径中,利用所述第一计算机语言对所述原始数据文件中的原始数据进行预处理,将预处理后的原始数据转换为所述第二计算机语言对应的数据结构文件,由所述第二计算机语言直接对所述数据结构文件进行数据处理,将数据处理结果转换为所述第一计算机语言对应的数据结构文件。2.根据权利要求1所述的基于不同计算机语言的数据处理方法,其特征在于:所述第一计算机语言包括Python语言,所述第二计算机语言包括R语言。3.根据权利要求1所述的基于不同计算机语言的数据处理方法,其特征在于:在所述第一计算机语言与所述第二计算机语言进行文件共享时,将预处理后的原始数据存放于所述文件共享系统的预设目录中,生成待处理任务加入至任务队列系统中,等待所述第二计算机语言由所述文件共享系统中读取预处理后的原始数据,进行数据处理。4.根据权利要求1所述的基于不同计算机语言的数据处理方法,其特征在于:在所述第一计算机语言与所述第二计算机语言进行数据共享时,将预处理后的原始数据放于内存中,在所述内存中转换为所述第二计算机语言对应的数据结构文件,由所述第二计算机语言直接对所述数据结构文件进行数据处理,将数据处理结果在所述内存中转换为所述第一计算机语言对应的数据结构文件。5.根据权利要求1所述的基于不同计算机语言的数据处理方法,其特征在于,在所述将数据处理结果转换为所述第一计算机语言对应的数据结构文件的步骤之后,所述基于不同计算机语言的数据处理方法还包括:将所述第一计算机语言对应的数据结构文件返回至用户的终端。6.根据权利要求1所述的...

【专利技术属性】
技术研发人员:张少典马汉东徐文祥朱珉薛颜波
申请(专利权)人:上海森亿医疗科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1