当前位置: 首页 > 专利查询>清华大学专利>正文

用于存算一体系统的编译装置和编译方法、计算设备制造方法及图纸

技术编号:37843619 阅读:16 留言:0更新日期:2023-06-14 09:49
一种用于存算一体系统的编译装置和编译方法、计算设备。该编译装置包括获取模块、优化模块和编译模块。获取模块配置为根据神经网络模型的描述信息获取神经网络模型中多个网络层的计算需求量;优化模块配置为根据多个网络层的计算需求量将存算一体系统的硬件资源分配给多个网络层;编译模块配置为根据存算一体系统的硬件资源的分配方案生成存算一体系统的硬件可执行代码。该编译装置能够对存算一体系统运行神经网络模型的硬件资源进行合理的分配和优化,为计算量大的网络层分配更多资源,还能够将神经网络模型自动映射到存算一体系统上,为存算一体系统自动分配运行神经网络模型的硬件资源,从而有效提高存算一体系统进行推理计算的执行效率。行推理计算的执行效率。行推理计算的执行效率。

【技术实现步骤摘要】
用于存算一体系统的编译装置和编译方法、计算设备


[0001]本公开的实施例涉及一种用于存算一体系统的编译装置和编译方法、计算设备和计算机可读存储介质。

技术介绍

[0002]存算一体系统相比于传统的冯诺依曼计算系统在许多神经网络的推理任务中可以获得更高的计算能效比,近几年在国内外被广泛研究,有望应用于许多终端设备中。但是,随着神经网络算法的结构越来越多样,存算一体系统的结构越来越复杂,通过手工的方式将神经网络算法映射到存算一体系统中是十分困难且低效的,手工映射过程中的任何错误都会带来不可忽略的代价。

技术实现思路

[0003]本公开至少一实施例提供一种用于存算一体系统的编译装置,该编译装置包括:获取模块,配置为根据神经网络模型的描述信息获取所述神经网络模型中多个网络层的计算需求量;优化模块,配置为根据所述多个网络层的所述计算需求量将所述存算一体系统的硬件资源分配给所述多个网络层;编译模块,配置为根据所述存算一体系统的硬件资源的分配方案生成所述存算一体系统的硬件可执行代码。
[0004]例如,在本公开至少一实施例提供的编译本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种用于存算一体系统的编译装置,包括:获取模块,配置为根据神经网络模型的描述信息获取所述神经网络模型中多个网络层的计算需求量;优化模块,配置为根据所述多个网络层的所述计算需求量将所述存算一体系统的硬件资源分配给所述多个网络层;编译模块,配置为根据所述存算一体系统的硬件资源的分配方案生成所述存算一体系统的硬件可执行代码。2.根据权利要求1所述的编译装置,其中,所述描述信息包括所述神经网络模型的网络层、连接关系和算子类型中的至少一个。3.根据权利要求1所述的编译装置,还包括:评估模块,配置为对所述存算一体系统的硬件资源的分配方案进行评估,以确定是否需要调整所述存算一体系统的硬件资源的分配方案。4.根据权利要求3所述的编译装置,其中,所述优化模块还配置为根据所述评估模块对所述分配方案的评估结果调整所述分配方案。5.根据权利要求1

4任一项所述的编译装置,还包括:输出模块,配置为根据所述硬件可执行代码将所述神经网络模型映射到所述存算一体系统中,以使得所述存算一体系统自动执行所述神经网络模型。6.一种用于存算一体系统的编译方法,包括:根据神经网络模型的描述信息获取所述神经网络模型中多个网络层的计算需求量;根据所述多个网络层的所述计算需求量将所述存算一体系统的硬件资源分配给所述多个网络层;根据所述存算一体系统的硬件资源的分配方案生成所述存算一体系统的硬件可执行代码。7.根据权利要求5所述的编译方法,其中,所述根据所述多个网络层的所述计算需求量将所述存算一体系统的硬件资源分配给所述多个网络层,包括:根据所述多个网络层的所述计算需求量获取所述存算一体系统的剩余硬件资源;将所述存算一体系统的所述剩余硬件资源分配给所述计算需求量大于第一阈值条件的至少一个网络层。8.根据权利要求5所述的编译方法,还包括:对所述存算一体系统的硬件资源的分配方案进行评估,以确定是否需要调整所述存算一体系统的硬件资源的分配方案。9.根据权利要求8所述的编译方法,其中,所述对所述存算一体系统...

【专利技术属性】
技术研发人员:吴华强喻睿华高滨唐建石钱鹤
申请(专利权)人:清华大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1