【技术实现步骤摘要】
异构计算中核函数参数的高性能传递方法及异构计算系统
[0001]本专利技术涉及一种参数传递方法及异构计算系统,尤其是一种异构计算中核函数参数的高性能传递方法及异构计算系统。
技术介绍
[0002]近几年兴起的人工智能、深度学习等领域对计算性能的需求极高,传统的CPU(Central Processing Unit)处理器架构已不能完全满足需求,因此,从依赖工艺、功耗提高性能转向依靠架构的改变,促使异构架构的出现,基于异构架构的高性能计算机成为发展的主流趋势。
[0003]异构架构一般是由通用计算单元和专用计算单元组成,一般地,通用计算单元作为控制设备(称为主机端),专用计算单元作为协处理器(称为设备端),由主机端和设备端合作共同执行通用计算任务即为异构计算。异构计算时,计算数据由主机准备,通过核函数(异构编程接口)将计算数据传至设备,以实现在设备端上进行计算。
[0004]现有技术中,通过异构编程接口将计算数据传至设备端,在运行阶段通过读取计算数据的地址取出数据,对数据进行解析,最后将参数进行组装,再将组装后 ...
【技术保护点】
【技术特征摘要】
1.一种异构计算中核函数参数的高性能传递方法,其特征是,所述核函数参数的高性能传递方法包括:提供异构架构所用的源代码,在所述源代码内配置调用异构计算用的核函数;利用异构编译器对源代码编译时,核函数中的参数利用所述异构编译器在编译阶段进行解析与组装,以在将源代码编译生成可执行文件时,所述组装后的核函数参数作为可执行文件运行时的API参数;在异构架构主机端运行所述可执行文件,其中,在运行所述执行文件时,启动所述核函数并基于<<<>>>操作符将计算数据作为核函数的参数传递至异构架构内对应的设备端。2.根据权利要求1所述的异构计算中核函数参数的高性能传递方法,其特征是,在所述源代码内通过<<<>>>操作符调用异构计算用的核函数。3.根据权利要求2所述的异构计算中核函数参数的高性能传递方法,其特征是,利用异构编译器将<<<>>>操作符展开时,则有:使用异构编译器将设备端的源代码编译生成设备端的二进制FatBinary,将<<<>>>操作符展开为运行时接口,并通过调用运行时接口将生成的设备端的二进制FatBinary预注册在设备端;通过运行时的Push接口,保存调用核函数的配置选项;解析并组装所述核函数的参数;通过运行时的Pop接口,恢...
【专利技术属性】
技术研发人员:谭丽敏,苏振宇,朱道永,程相群,刘旭,
申请(专利权)人:太初无锡电子科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。