This application discloses a distributed parallel computing method, device, computer equipment and storage medium. The method includes saving the original data to Hive database, obtaining the pre-stored computing model in Hive database, and inputting the original data and computing model to Hadoop distributed computing framework for operation to get the results. This method uses Hadoop distributed computing framework to distribute concurrent computation of massive raw data according to the computing model. The scalability of the computing system is optimized, and the computing efficiency is improved.
【技术实现步骤摘要】
分布式并行运算方法、装置、计算机设备及存储介质
本申请涉及分布式运算
,尤其涉及一种分布式并行运算方法、装置、计算机设备及存储介质。
技术介绍
目前企业的佣金批量计算过程中,佣金批量计算主要基于多线程计算技术。多线程存在以下问题:1)扩展性差,性能依赖于单一硬件性能。2)大幅提升性能困难,无法实现分布式计算。
技术实现思路
本申请提供了一种分布式并行运算方法、装置、计算机设备及存储介质,旨在解决现有技术中佣金批量计算主要基于多线程计算技术,其存在扩展性差,且运算效率低下的问题。第一方面,本申请提供了一种分布式并行运算方法,其包括:将待计算原始数据保存至Hive数据库;获取Hive数据库中预先存储的计算模型;将待计算原始数据和计算模型输入至Hadoop分布式计算框架进行运算,得到运算结果。第二方面,本申请提供了一种分布式并行运算装置,其包括:数据保存单元,用于将待计算原始数据保存至Hive数据库;计算模型获取单元,用于获取Hive数据库中预先存储的计算模型;分布式运算单元,用于将待计算原始数据和计算模型输入至Hadoop分布式计算框架进行运算,得到运算结果。第三方面,本申请又提供了一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现本申请提供的任一项所述的分布式并行运算方法。第四方面,本申请还提供了一种存储介质,其中所述存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行本申请提供的任一项所述的分布式并行运算方法。本申请提供一种分布式并行运 ...
【技术保护点】
1.一种分布式并行运算方法,其特征在于,包括:将待计算原始数据保存至Hive数据库;获取Hive数据库中预先存储的计算模型;将待计算原始数据和计算模型输入至Hadoop分布式计算框架进行运算,得到运算结果。
【技术特征摘要】
1.一种分布式并行运算方法,其特征在于,包括:将待计算原始数据保存至Hive数据库;获取Hive数据库中预先存储的计算模型;将待计算原始数据和计算模型输入至Hadoop分布式计算框架进行运算,得到运算结果。2.根据权利要求1所述的分布式并行运算方法,其特征在于,所述将待计算原始数据保存至Hive数据库,包括:生成与待计算原始数据对应的表名,根据表名在Hive数据库对应建立存储表格;读取待计算原始数据的每一张数据表,生成与每一张数据表一一对应的Sqoop脚本;通过与每一张数据表一一对应的Sqoop脚本,将待计算原始数据保存至Hive数据库中的存储表格。3.根据权利要求1所述的分布式并行运算方法,其特征在于,所述将待计算原始数据和计算模型输入至Hadoop分布式计算框架进行运算之前,还包括:将预先配置有相同主机名称、及Hadoop压缩包的终端进行联网并建立集群,得到Hadoop分布式计算框架。4.根据权利要求1所述的分布式并行运算方法,其特征在于,所述获将待计算原始数据和计算模型输入至Hadoop分布式计算框架进行运算,得到运算结果,包括:将待计算原始数据输入至Hadoop分布式计算框架中的任务跟踪进程;将待计算原始数据根据预设的分片数目进行分片,任务跟踪进程将分片后数据传输至Hadoop分布式计算框架中的任务处理进程;任务处理进程对分片后数据对应进行map运算或reduce运算后,得到与分片后数据对应的运算结果。5.根据权利要求4所述的分布式并行运算方法,其特征在于,所述任务处理进程对分片后数据对应进行map运算或reduce运算后,得到与分片后数据对应的运算结果之后,还包括;将运算结果存储在Hadoop分布式计算框架中的分布式文...
【专利技术属性】
技术研发人员:周毅,
申请(专利权)人:中国平安人寿保险股份有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。