一种并行空间叠加计算中的任务拆分方法及装置制造方法及图纸

技术编号：19593403 阅读：156 留言：0更新日期：2018-11-28 04:53

本发明专利技术适用于地理信息技术领域，提供一种并行空间叠加计算中的任务拆分方法及装置，所述方法包括：输入两个地理要素集；根据所述两个地理要素集的地理范围，确定参与计算的地理范围；将所述参与计算的地理范围划分为若干个地理格网；将两个地理要素集中的要素标记ID；将被标记的两组地理要素集中有相同格网ID的要素作为一个任务单元，并将其在同一计算节点上计算，不同的任务单元分布在不同节点上执行，输出结果要素集；将所述结果要素集进行合并，得到最终的计算结果；输出结果要素集。本方法满足MapReduce思想，可用于Hadoop、Spark等大数据计算框架。

全部详细技术资料下载

【技术实现步骤摘要】
一种并行空间叠加计算中的任务拆分方法及装置
本专利技术属于地理信息
，尤其涉及一种并行空间叠加计算中的任务拆分方法及装置。
技术介绍
随着国家大数据战略逐步落地，政府部门的数据资产日益完善，数据总量和数据质量在不断提高。传统的单机算法已经不能满足应用需要，比如计算全省范围内2016年至2017年的土地变更情况。目前常见的并行地理要素叠加分析的任务拆分方法：根据叠加规则和两个要素集的地理范围，计算出参与计算的地理范围，再将地理范围划分成m*n的地理格网；将要素集中完全包含在地理格网内部的要素作为一组，即是m*n组，也就是两个要素集分别有m*n组计算任务；计算任务编号相同的两组要素独立计算，多组计算任务可分配在多个计算节点上并行执行；在地理格网边线上的要素单独作为一组，与另一个要素集的全集作为一个任务，并将此任务在一个独立的计算节点执行。将各节点上的执行结果进行合并。上述方法流程不能很好的适应Spark框架，不符合Map/Reduce思想，同时，存在数据倾斜问题；另外，格网的稀疏密度会影响跨格网要素的数量，如果格网稀疏，那么单个格网内的要素会变多，如果格网密集，...

【技术保护点】
1.一种并行空间叠加计算中的任务拆分方法，其特征在于，所述方法包括如下步骤：S1、输入两个地理要素集；S2、根据所述两个地理要素集的地理范围，确定参与计算的地理范围；S3、将所述参与计算的地理范围划分为若干个地理格网；S4、将两个地理要素集中完全包含在地理格网内部的要素标记相应的格网ID，对于跨边界的要素做切割操作得到子要素，并将包含在地理格网内部的子要素标记对应的格网ID，最后得到两组被标记的地理要素集；S5、将被标记的两组地理要素集中有相同格网ID的要素作为一个任务单元，并将其在同一计算节点上计算，不同的任务单元分布在不同节点上执行，输出结果要素集；S6、将所述结果要素集进行合并，得到最终...

【技术特征摘要】
1.一种并行空间叠加计算中的任务拆分方法，其特征在于，所述方法包括如下步骤：S1、输入两个地理要素集；S2、根据所述两个地理要素集的地理范围，确定参与计算的地理范围；S3、将所述参与计算的地理范围划分为若干个地理格网；S4、将两个地理要素集中完全包含在地理格网内部的要素标记相应的格网ID，对于跨边界的要素做切割操作得到子要素，并将包含在地理格网内部的子要素标记对应的格网ID，最后得到两组被标记的地理要素集；S5、将被标记的两组地理要素集中有相同格网ID的要素作为一个任务单元，并将其在同一计算节点上计算，不同的任务单元分布在不同节点上执行，输出结果要素集；S6、将所述结果要素集进行合并，得到最终的计算结果；S7、输出结果要素集。2.如权利要求1所述并行空间叠加计算中的任务拆分方法，其特征在于，每个地理要素集具有一个要素集ID，地理要素集中的各要素具有一个要素ID，步骤S5输出的结果要素集中每个要素均标记Key，用于记录结果要素集中各要素来源，所述Key由两个要素集ID和两个要素ID共四个元素组成；步骤S6中，将结果要素集中具有同Key的要素进行合并。3.如权利要求1所述并行空间叠加计算中的任务拆分方法，其特征在于，步骤S...

【专利技术属性】
技术研发人员：吴杰，杨曦，刘奕夫，窦明罡，贺楷锴，付智能，
申请(专利权)人：武大吉奥信息技术有限公司，
类型：发明
国别省市：湖北,42

全部详细技术资料下载我是这个专利的主人