一种基于CUDA平台的FPA实现方法及系统技术方案

技术编号:17033625 阅读:32 留言:0更新日期:2018-01-13 19:49
本申请实施例公开了一种基于CUDA平台的FPA实现方法及系统,涉及计算机应用领域。所述方法包括:确定转换概率和位置信息;配置线程块F(i)和线程数量N;更新最优的线程执行单元F(X),所述F(X)执行效率最高;生成随机数;判断随机数是否大于转换概率;若是,根据全局授粉更新位置;若否,根据局部授粉更新位置;所述更新位置为更新矢量位置X(i);输出结果数据,所述结果数据为线程执行单元F(X)的执行时间。本申请的基于CUDA平台的FPA实现方法及系统,通过更新线程执行单元,并更新矢量位置,以保证FPA收敛,有效减小FPA的执行时间。

【技术实现步骤摘要】
一种基于CUDA平台的FPA实现方法及系统
本申请涉及计算机应用领域,尤其涉及FPA实现方法及系统。
技术介绍
目前,基于统一计算设备架构CUDA(ComputeUnifiedDeviceArchitecture)这一编程模型平台,计算机行业正在从只使用中央处理器CPU(CentralProcessingUnit)的中央处理方式向CPU与图形处理器GPU(GraphicProcessingUnit)并用的协同处理方式发展。CUDA平台采用CPU与GPU的编程模式,CPU负责处理运算计算机内部的所有数据,GPU负责处理需要显示输出的数据。CUDA平台是实施大规模并行运算的通用平台之一,CUDA技术广泛应用于飞行器数值模拟、生物信息处理、核武器、大型事务处理、石油勘探、地震数据处理、数值天气预报等领域。此外,相比于传统的花朵授粉算法FPA(FlowerPollinationAlgorithm),并行FPA的计算效率有着明显的提高,然而,由于FPA在迭代过程中的计算比较繁琐,导致并行FPA的加速比低于一般智能方法的加速比。因此,期望提供一种基于CUDA平台的FPA实现方法及系统,通过更新线程执行单元,并更新矢量位置,以保证FPA收敛,有效减小FPA的执行时间。
技术实现思路
根据本申请的一些实施例的第一方面,提供了一种FPA实现方法,应用于终端(例如,电子设备等)中,所述方法可以包括:确定转换概率和位置信息;配置线程块F(i)和线程数量N;更新最优的线程执行单元F(X),所述F(X)执行效率最高;生成随机数;判断随机数是否大于转换概率;若是,根据全局授粉更新位置;若否,根据局部授粉更新位置;所述更新位置为更新矢量位置X(i);输出结果数据,所述结果数据为线程执行单元F(X)的执行时间。在一些实施例中,所述方法可以进一步包括:判断是否达到迭代次数;若是,输出结果数据;若否,返回生成随机数。在一些实施例中,所述转换概率包括生存概率,所述生存概率与距离范围成反比,进一步包括:所述距离范围小,生存概率大,根据全局授粉更新位置;所述距离范围大,生存概率小,根据局部授粉更新位置。在一些实施例中,所述方法可以进一步包括:调度线程的计算适应值,所述适应值包括所述距离范围。在一些实施例中,在CUDA平台实现并行FPA方法,进一步包括采用CPU和GPU异构模式,以及单指令多线程模型。在一些实施例中,所述方法可以进一步包括:执行FPA具体的并行规模;调整CUDA平台的参数设置和内存访问方式。在一些实施例中,所述方法可以进一步包括:根据仿真结果图,分析并行FPA的收敛性。在一些实施例中,所述CPU确定转换概率和位置信息,以及输出结果数据。在一些实施例中,所述GPU生成随机数,以及更新矢量位置。根据本申请的一些实施例的第二方面,提供了一个系统,包括:一个存储器,被配置为存储数据及指令;一个与存储器建立通信的处理器,其中,当执行存储器中的指令时,所述处理器被配置为:确定转换概率和位置信息;配置线程块F(i)和线程数量N;更新最优的线程执行单元F(X),所述F(X)执行效率最高;生成随机数;判断随机数是否大于转换概率;若是,根据全局授粉更新位置;若否,根据局部授粉更新位置;所述更新位置为更新矢量位置X(i);输出结果数据,所述结果数据为线程执行单元F(X)的执行时间。因此,根据本申请的一些实施例提供的一种基于CUDA平台的FPA实现方法及系统,通过更新线程执行单元,并更新矢量位置,以保证FPA收敛,有效减小FPA的执行时间。附图说明为更好地理解并阐述本申请的一些实施例,以下将结合附图参考实施例的描述,在这些附图中,同样的数字编号在附图中指示相应的部分。图1是根据本申请的一些实施例提供的网络环境系统的示例性示意图。图2是根据本申请的一些实施例提供的电子设备功能配置的示例性单元示意图。图3是根据本申请的一些实施例提供的FPA基本实现方法的示例性流程图。图4是根据本申请的一些实施例提供的基于CUDA平台的FPA实现方法的示例性流程图。图5是根据本申请的一些实施例提供的FPA方法的CPU,以及CPU与GPU的f1收敛曲线。图6是根据本申请的一些实施例提供的FPA方法的CPU,以及CPU与GPU的f2收敛曲线。图7是根据本申请的一些实施例提供的FPA方法的CPU,以及CPU与GPU的f3收敛曲线。图8是根据本申请的一些实施例提供的FPA方法的CPU,以及CPU与GPU的f4收敛曲线。具体实施方式以下参考附图的描述为便于综合理解由权利要求及其等效内容所定义的本申请的各种实施例。这些实施例包括各种特定细节以便于理解,但这些仅被视为示例性的。因此,本领域技术人员可以理解对在此描述的各种实施例进行各种变化和修改而不会脱离本申请的范围和精神。另外,为简要并清楚地描述本申请,本申请将省略对公知功能和结构的描述。在以下说明书和权利要求书中使用的术语和短语不限于字面含义,而是仅为能够清楚和一致地理解本申请。因此,对于本领域技术人员,可以理解,提供对本申请各种实施例的描述仅仅是为说明的目的,而不是限制所附权利要求及其等效定义的本申请。下面将结合本申请一些实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。需要说明的是,在本申请实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请实施例和所附权利要求书中所使用的单数形式的“一”、“一个”、“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本申请中使用的术语“和/或”是指并包含一个或多个相绑定的列出项目的任何或所有可能组合。表达“第一”、“第二”、“所述第一”和“所述第二”是用于修饰相应元件而不考虑顺序或者重要性,仅仅被用于区分一种元件与另一元件,而不限制相应元件。根据本申请一些实施例的终端可以是电子设备,该电子设备可以包括智能手机、个人电脑(PC,例如平板电脑、台式电脑、笔记本、上网本、掌上电脑PDA)、移动电话、电子书阅读器、便携式多媒体播放器(PMP)、音频/视频播放器(MP3/MP4)、摄像机、虚拟现实设备(VR)和可穿戴设备等中的一种或几种的组合。根据本申请的一些实施例,所述可穿戴设备可以包括附件类型(例如手表、戒指、手环、眼镜、或头戴式装置(HMD))、集成类型(例如电子服装)、装饰类型(例如皮肤垫、纹身或内置电子装置)等,或几种的组合。在本申请的一些实施例中,所述电子设备可以是灵活的,不限于上述设备,或者可以是上述各种设备中的一种或几种的组合。在本申请中,术语“用户”可以指示使用电子设备的人或使用电子设备的设备(例如人工智能电子设备)。本申请实施例提供了一种FPA实现方法。为了便于理解本申请实施例,以下将参考附图对本申请实施例进行详细描述。图1是根据本申请的一些实施例提供的网络环境系统100的示例性示意图。如图1所示,网络环境系统100可以包括电子设备110、网络120和服务器130等。电子设备110可以包括总线111、处理器112、存储器11本文档来自技高网...
一种基于CUDA平台的FPA实现方法及系统

【技术保护点】
一种FPA实现方法,其特征在于,包括:确定转换概率和位置信息;配置线程块F(i)和线程数量N;更新最优的线程执行单元F(X),所述F(X)执行效率最高;生成随机数;判断随机数是否大于转换概率;若是,根据全局授粉更新位置;若否,根据局部授粉更新位置;所述更新位置为更新矢量位置X(i);输出结果数据,所述结果数据为线程执行单元F(X)的执行时间。

【技术特征摘要】
1.一种FPA实现方法,其特征在于,包括:确定转换概率和位置信息;配置线程块F(i)和线程数量N;更新最优的线程执行单元F(X),所述F(X)执行效率最高;生成随机数;判断随机数是否大于转换概率;若是,根据全局授粉更新位置;若否,根据局部授粉更新位置;所述更新位置为更新矢量位置X(i);输出结果数据,所述结果数据为线程执行单元F(X)的执行时间。2.根据权利要求1所述的FPA实现方法,其特征在于,进一步包括:判断是否达到迭代次数;若是,输出结果数据;若否,返回生成随机数。3.根据权利要求1所述的FPA实现方法,其特征在于,所述转换概率包括生存概率,所述生存概率与距离范围成反比,进一步包括:所述距离范围小,生存概率大,根据全局授粉更新位置;所述距离范围大,生存概率小,根据局部授粉更新位置。4.根据权利要求3所述的FPA实现方法,其特征在于,进一步包括:调度线程的计算适应值,所述适应值包括所述距离范围。5.根据权利要求1所述的FPA实现方法,其特征在于,在CUDA平台实现并行FPA方法,进一步包括采用CPU和GP...

【专利技术属性】
技术研发人员:刘小东邓见章蒋杰
申请(专利权)人:上海爱优威软件开发有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1