分布式并行运算方法、装置、计算机设备及存储介质制造方法及图纸

技术编号：19543611 阅读：53 留言：0更新日期：2018-11-24 20:35

本申请公开了一种分布式并行运算方法、装置、计算机设备及存储介质。该方法包括：将待计算原始数据保存至Hive数据库；获取Hive数据库中预先存储的计算模型；将待计算原始数据和计算模型输入至Hadoop分布式计算框架进行运算，得到运算结果。该方法通过Hadoop分布式计算框架根据计算模型对海量的待计算原始数据进线分布式并发运算，计算系统的扩展性能得到优化，且提高了运算效率。

Distributed Parallel Computing Method, Device, Computer Equipment and Storage Media

This application discloses a distributed parallel computing method, device, computer equipment and storage medium. The method includes saving the original data to Hive database, obtaining the pre-stored computing model in Hive database, and inputting the original data and computing model to Hadoop distributed computing framework for operation to get the results. This method uses Hadoop distributed computing framework to distribute concurrent computation of massive raw data according to the computing model. The scalability of the computing system is optimized, and the computing efficiency is improved.

全部详细技术资料下载

【技术实现步骤摘要】
分布式并行运算方法、装置、计算机设备及存储介质
本申请涉及分布式运算
，尤其涉及一种分布式并行运算方法、装置、计算机设备及存储介质。
技术介绍
目前企业的佣金批量计算过程中，佣金批量计算主要基于多线程计算技术。多线程存在以下问题：1)扩展性差，性能依赖于单一硬件性能。2)大幅提升性能困难，无法实现分布式计算。
技术实现思路
本申请提供了一种分布式并行运算方法、装置、计算机设备及存储介质，旨在解决现有技术中佣金批量计算主要基于多线程计算技术，其存在扩展性差，且运算效率低下的问题。第一方面，本申请提供了一种分布式并行运算方法，其包括：将待计算原始数据保存至Hive数据库；获取Hive数据库中预先存储的计算模型；将待计算原始数据和计算模型输入至Hadoop分布式计算框架进行运算，得到运算结果。第二方面，本申请提供了一种分布式并行运算装置，其包括：数据保存单元，用于将待计算原始数据保存至Hive数据库；计算模型获取单元，用于获取Hive数据库中预先存储的计算模型；分布式运算单元，用于将待计算原始数据和计算模型输入至Hadoop分布式计算框架进行运算，得到运算结果。第三方...

【技术保护点】
1.一种分布式并行运算方法，其特征在于，包括：将待计算原始数据保存至Hive数据库；获取Hive数据库中预先存储的计算模型；将待计算原始数据和计算模型输入至Hadoop分布式计算框架进行运算，得到运算结果。

【技术特征摘要】
1.一种分布式并行运算方法，其特征在于，包括：将待计算原始数据保存至Hive数据库；获取Hive数据库中预先存储的计算模型；将待计算原始数据和计算模型输入至Hadoop分布式计算框架进行运算，得到运算结果。2.根据权利要求1所述的分布式并行运算方法，其特征在于，所述将待计算原始数据保存至Hive数据库，包括：生成与待计算原始数据对应的表名，根据表名在Hive数据库对应建立存储表格；读取待计算原始数据的每一张数据表，生成与每一张数据表一一对应的Sqoop脚本；通过与每一张数据表一一对应的Sqoop脚本，将待计算原始数据保存至Hive数据库中的存储表格。3.根据权利要求1所述的分布式并行运算方法，其特征在于，所述将待计算原始数据和计算模型输入至Hadoop分布式计算框架进行运算之前，还包括：将预先配置有相同主机名称、及Hadoop压缩包的终端进行联网并建立集群，得到Hadoop分布式计算框架。4.根据权利要求1所述的分布式并行运算方法，其特征在于，所述获将待计算原始数据和计算模型输入至Hadoop分布式计算框架进行运算，得到运算结果，包括：将待计算原始数据输入至Hadoop分布式计算框架中的任务跟踪进程；将待计算原始数据根据预设的分片数目进行分片，任务跟踪进程将分片后数据传输至Hadoop分布式计算框架中的任务处理进程；任务处理进程对分片后数据对应进行map运算或reduce运算后，得到与分片后数据对应的运算结果。5.根据权利要求4所述的分布式并行运算方法，其特征在于，所述任务处理进程对分片后数据对应进行map运算或reduce运算后，得到与分片后数据对应的运算结果之后，还包括；将运算结果存储在Hadoop分布式计算框架中的分布式文...

【专利技术属性】
技术研发人员：周毅，
申请(专利权)人：中国平安人寿保险股份有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人