一种基于Spark的并行化遗传算法求解多终端协同接入网络方法技术

技术编号：16400749 阅读：31 留言：0更新日期：2017-10-17 20:51

一种基于Spark的并行化遗传算法求解多终端协同接入网络方法，适用于通信终端集与大型服务器协同工作。步骤为：大型服务器确认接入通信终端的数量和网络终端参数；大型服务器将所有的网络终端参数信息存储于集群的HDFS目录中；以Spark集群的方式切分储存在HDFS目录中的网络终端参数信息；对切分后的信息进行基于Spark集群的并行化遗传算法，得到适合当前的多终端协同接入网络方案的最终代种群数据；对最终代种群数据寻优，从而得到最优网络方案；利用最优网络方案与多个通信终端进行并行化网络通信。其能够在Spark集群的多个节点上实现完全的并行化遗传算法优选终端集协同接入网络，降低了网络终端选择的复杂度和计算量，显著提高网络终端的选择质量和传输速率。

A parallel genetic algorithm based on Spark for multi terminal cooperative access network

A parallel genetic algorithm based on Spark is used to solve the multi terminal cooperative access network, which is suitable for the cooperation between the communication terminal set and the large server. The steps are: large-scale server access to a communication terminal to confirm the quantity and parameters of the network terminal; large server all the terminal parameters of network information stored in the HDFS directory of the cluster; Spark cluster segmentation method of network information storage terminal parameters in the HDFS directory of the Spark cluster; parallel genetic algorithm based on segmentation information finally, population data for the current collaborative multi terminal access network scheme; on the final population data optimization, in order to get the optimal network scheme; parallel network communication by using optimal network scheme with multiple communication terminal. It can realize parallel genetic algorithm optimized set of cooperative network access terminal completely in multi node Spark cluster, reduce the complexity of network terminal selection and calculation, significantly improve the selection quality and transmission rate of network terminal.

全部详细技术资料下载

【技术实现步骤摘要】
一种基于Spark的并行化遗传算法求解多终端协同接入网络方法
本专利技术涉及一种多终端协同接入网络方法，尤其适用于一种基于Spark的并行化遗传算法求解多终端协同接入网络方法技术背景Spark是一个开源的分布式计算框架，它基于弹性分布式数据集(RDD)，RDD采用先进的有向无环图机制支持循环数据流操作，通过一次迭代导入内存就可以完成多次迭代，类似于GeneticAlgorithm这样需要大量迭代的算法非常适合在Spark平台上运算。遗传算法(GeneticAlgorithm)是模拟达尔文生物进化论的自然选择和遗传学机理的生物进化过程的计算模型，是一种通过模拟自然进化过程搜索最优解的方法。传统的遗传算法所进行的交叉、变异、选择等操作都是以个体的集合即种群为单位进行的，对于每个个体都具有一定的并行性，所以遗传算法具有天然的并行性，尤其当处理大规模数据集时，各个子种群间可实现完全的并行化处理。多终端协同网络是指多个终端之间以协同的方式共享广域网通信能力，共同为用户提供业务，从而摆脱单个终端在性能、处理能力等方面的局限性，实现终端和网络资源的高效利用。随着通信网络技术和终端设备的不断发展，用户业务可选择的终端和接入方式逐渐多样化。为了克服单一无线接入技术的性能瓶颈，充分利用用户周围的终端和网络资源，多终端协同通信模式应运而生。在多终端多网络环境下，如何选择合适的终端为用户服务是一个难题，而基于Spark的遗传算法并行化多终端网络选择可以有效改善。
技术实现思路
针对上述技术问题，提供一种方法简单，执行效率高，有效降低了网络终端优选的计算量和复杂度，在多个节点上实现...
一种基于Spark的并行化遗传算法求解多终端协同接入网络方法

【技术保护点】
一种基于Spark的并行化遗传算法求解多终端协同接入网络方法，选择适合的多个通信终端集与大型服务器协同工作执行数据业务，其特征在于步骤如下：大型服务器确认接入各个通信终端的数量和每个通信终端的网络终端参数；大型服务器将所有的网络终端参数信息存储于Spark集群的HDFS目录中；大型服务器以Spark集群的方式切分储存在HDFS目录中的网络终端参数信息；对切分后的网络终端参数信息进行基于Spark集群的并行化遗传算法，从而得到适合当前的多终端协同接入网络方案的最终代种群数据；对最终代种群数据寻优，从而得到最适合当前的多终端协同接入网络方案；大型服务器利用最适合当前的多终端协同接入网络方案与方案中的多个通信终端进行并行化网络通信。

【技术特征摘要】
1.一种基于Spark的并行化遗传算法求解多终端协同接入网络方法，选择适合的多个通信终端集与大型服务器协同工作执行数据业务，其特征在于步骤如下：大型服务器确认接入各个通信终端的数量和每个通信终端的网络终端参数；大型服务器将所有的网络终端参数信息存储于Spark集群的HDFS目录中；大型服务器以Spark集群的方式切分储存在HDFS目录中的网络终端参数信息；对切分后的网络终端参数信息进行基于Spark集群的并行化遗传算法，从而得到适合当前的多终端协同接入网络方案的最终代种群数据；对最终代种群数据寻优，从而得到最适合当前的多终端协同接入网络方案；大型服务器利用最适合当前的多终端协同接入网络方案与方案中的多个通信终端进行并行化网络通信。2.根据权利要求1所述的基于Spark的并行化遗传算法求解多终端协同接入网络方法，其特征在于进一步的选择步骤如下：步骤1.根据需求将大型服务器的所有网络终端参数进行遗传算法初始化，将初始化后的变量参数转换为二进制，将每个二进制化后的参数变量作为个体样本逐行存储于大型服务器集群的HDFS中形成所有通信终端的初始种群样本数据；步骤2.根据需要寻求终端的数量设定Spark集群节点数量，将初始种群样本数据按种群样本数据个体总数/Spark集群节点数的方式平均切分成多个基于Spark集群的子种群；步骤3.利用遗传算法对多个基于Spark集群的子种群中的各个终端参数变量进行全局进化寻优，以重排序的方法在进化阶段打乱子代各自子种群个体分布，合并所有子种群个体后进行自然选择，得到最终代种群个体；步骤4.利用Spark的APIs函数reduceByKey对所有最终代种群个体的适应度进行排序，得到全局适应度符合所需终端要求的多个最优个体，再对多个最优个体解码得到终端权值参数，根据最优终端权值参数值从候选终端中选择最优参数集，比较当前终端集所能提供的数据速率Rc是否满足用户需求数据速率Rt，若满足则结束选择，否则返回步骤1继续选取，直到选取最优的终端集作为最优多终端协同接入网络方案；步骤5.大型服务器利用最优多终端协同接入网络方案与相应的通信终端进行并行化网络通信。3.根据权利要求2所述的基于Spark的并行化遗传算法求解多终端协同接入网络方法，其特征在于：重排序的方法在进化阶段打乱子代各自子种群个体分布后合并所有子种群进行自然选择的步骤根据需要可进行多次迭代循环操作，该...

【专利技术属性】
技术研发人员：刘鹏，叶帅，王学奎，赵慧含，尹良飞，仰彦妍，孟磊，
申请(专利权)人：中国矿业大学，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人