一种基于张量融合的数据流优化方法、装置、设备及介质制造方法及图纸

技术编号:42376004 阅读:15 留言:0更新日期:2024-08-16 15:00
本发明专利技术公开了一种基于张量融合的数据流优化方法、装置、设备及介质,包括:获取神经网络编译器中算子节点,并确认算子节点间的矛盾数据流;遍历第一算子和第二算子的矛盾维度,并重新调度矛盾维度对矛盾数据流进行融合;根据当前张量融合的情况对所述第一算子和所述第二算子的切片形状进行重新划分,对重新划分后的切片大小进行调整,使得重新划分后的切片能够将绑定张量对应的中间切片容纳在芯片的缓存区中以消除矛盾,从而使得一对操作符中的任何数据流均能够融合;通过上述方式进行多算子融合过程中,通过解耦优化步骤能够将数据流探索从单算子内部拓展到算子间,得到最优的数据流,克服传统数据流由于需要大量访存的访存瓶颈问题。

【技术实现步骤摘要】

本专利技术涉及神经网络加速器,尤其涉及一种基于张量融合的数据流优化方法、装置、设备及介质


技术介绍

1、神经网络加速严重依赖数据流,其中主要包括三个关键决策,即调度、切片和映射。映射决定了乘加单元如何计算切片操作符,从而确定了局部缓存上的并行性和数据重用,而调度和切片决定了全局缓存上数据的重用。已经有许多数据流研究专注于空间加速器上的卷积。简而言之,它们主要针对单个操作符的数据流,以减少给定缓存大小下的片外存储器访问。

2、图1显示了三种最常见的单个矩阵相乘的数据流类型,即输出固定(os)、权重固定(ws)和输入固定(is)。通过仔细调整切片调度和大小,空间加速器可以有效地利用数据重用,以减少内存受限操作符的片外存储器访问。然而,由于操作密集度低,仅仅利用单个操作符的数据流是不充分的。因此,为了尽可能进一步减少片外存储器流量,需要进行多张量融合的跨操作符数据流。现有的数据流探索工具仅融合逐点操作符或具有固定数据流的两个张量操作符。在数据流设计空间中缺乏整体搜索将导致多张量融合的局部优化。

3、现有的算子优化作为神经网络编译器优化中本文档来自技高网...

【技术保护点】

1.一种基于张量融合的数据流优化方法,其特征在于,包括:

2.根据权利要求1所述的基于张量融合的数据流优化方法,其特征在于,所述基于解耦优化算法能够将数据流探索从单算子内部拓展到算子间进一步包括:

3.根据权利要求2所述的基于张量融合的数据流优化方法,其特征在于,所述基于解耦优化算法能够将数据流探索从单算子内部拓展到算子间进一步包括:

4.根据权利要求2所述的基于张量融合的数据流优化方法,其特征在于,所述基于解耦优化算法能够将数据流探索从单算子内部拓展到算子间进一步包括:

5.根据权利要求2所述的基于张量融合的数据流优化方法,其特征在于,所...

【技术特征摘要】

1.一种基于张量融合的数据流优化方法,其特征在于,包括:

2.根据权利要求1所述的基于张量融合的数据流优化方法,其特征在于,所述基于解耦优化算法能够将数据流探索从单算子内部拓展到算子间进一步包括:

3.根据权利要求2所述的基于张量融合的数据流优化方法,其特征在于,所述基于解耦优化算法能够将数据流探索从单算子内部拓展到算子间进一步包括:

4.根据权利要求2所述的基于张量融合的数据流优化方法,其特征在于,所述基于解耦优化算法能够将数据流探索从单算子内部拓展到算子间进一步包括:

5.根据权利要求2所述的基于张量融合的数据流优化方法,其特征在于,所述基于遗传算法来生成不同的调度,并基于分析法来选择...

【专利技术属性】
技术研发人员:景乃锋徐磊莫志文王琴蒋剑飞毛志刚
申请(专利权)人:上海交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1