一种TensorFlow的FPGA异构加速实现方法、系统、终端及存储介质技术方案

技术编号:23315022 阅读:30 留言:0更新日期:2020-02-11 17:46
本发明专利技术提供一种TensorFlow的FPGA异构加速实现方法、系统、终端及存储介质,包括:将FPGA注册为TensorFlow可识别设备;将FPGA定义为网络层OP的支持设备;将TensorFlow的原网络层OP替换为定义的网络层OP。本发明专利技术能够实现TensorFlow框架下AI算法模型训练任务对FPGA设备的支持,最终实现支持CPU、GPU和FPGA的AI算法模型训练超异构混合计算平台。

A heterogeneous acceleration method, system, terminal and storage medium of tensorflow FPGA

【技术实现步骤摘要】
一种TensorFlow的FPGA异构加速实现方法、系统、终端及存储介质
本专利技术涉及深度学习
,具体涉及一种TensorFlow的FPGA异构加速实现方法、系统、终端及存储介质。
技术介绍
随着大数据、机器学习和人工智能在不同应用领域的发展,传统的计算架构已无法满足其对计算效能持续增长的迫切需求,面向应用的新型混合计算架构研究已经成为业界众多企业和科研机构未来重要的研究方向。作为深度学习领域最热门的端到端开源深度学习框架,TensorFlow拥有全面、灵活的工具,库和社区资源生态系统,可让研究人员推动深度学习领域的最新技术。开发人员能够使用Keras等直观的高级API轻松构建和训练ML模型,并且可以立即进行模型迭代和轻松调试。当前的TensorFlow最新开源版本能够原生支持使用CPU、GPU对深度学习网络进行混合异构计算,但对于低能耗高性能的FPGA加速设备缺少原生技术支持。
技术实现思路
针对现有技术的上述不足,本专利技术提供一种TensorFlow的FPGA异构加速实现方法、系统、终端及存储介本文档来自技高网...

【技术保护点】
1.一种TensorFlow的FPGA异构加速实现方法,其特征在于,包括:/n将FPGA注册为TensorFlow可识别设备;/n将FPGA定义为网络层OP的支持设备;/n将TensorFlow的原网络层OP替换为定义的网络层OP。/n

【技术特征摘要】
1.一种TensorFlow的FPGA异构加速实现方法,其特征在于,包括:
将FPGA注册为TensorFlow可识别设备;
将FPGA定义为网络层OP的支持设备;
将TensorFlow的原网络层OP替换为定义的网络层OP。


2.根据权利要求1所述的方法,其特征在于,所述将FPGA注册为TensorFlow可识别设备,包括:
进入TensorFlow源码修改模式;
根据源码的create_device机制,通过模拟CPU设备注册方法将FPGA注册为TensorFlow可识别设备。


3.根据权利要求1所述的方法,其特征在于,所述将FPGA定义为网络层OP的支持设备,包括:
自定义网络层OP的前向计算,将FPGA设置为支持设备;
自定义网络层OP的后向计算,将FPGA设置为支持设备;
自定义后向计算的python端接口,并将定义接口添加到TensorFlow源码目录中。


4.一种TensorFlow的FPGA异构加速实现系统,其特征在于,包括:
设备注册单元,配置用于将FPGA注册为TensorFlow可识别设备;
网络定义单元,配置用于将FPGA定义为网络层O...

【专利技术属性】
技术研发人员:王丽
申请(专利权)人:苏州浪潮智能科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1