【技术实现步骤摘要】
本专利技术涉及神经网络加速器,尤其涉及一种基于张量融合的数据流优化方法、装置、设备及介质。
技术介绍
1、神经网络加速严重依赖数据流,其中主要包括三个关键决策,即调度、切片和映射。映射决定了乘加单元如何计算切片操作符,从而确定了局部缓存上的并行性和数据重用,而调度和切片决定了全局缓存上数据的重用。已经有许多数据流研究专注于空间加速器上的卷积。简而言之,它们主要针对单个操作符的数据流,以减少给定缓存大小下的片外存储器访问。
2、图1显示了三种最常见的单个矩阵相乘的数据流类型,即输出固定(os)、权重固定(ws)和输入固定(is)。通过仔细调整切片调度和大小,空间加速器可以有效地利用数据重用,以减少内存受限操作符的片外存储器访问。然而,由于操作密集度低,仅仅利用单个操作符的数据流是不充分的。因此,为了尽可能进一步减少片外存储器流量,需要进行多张量融合的跨操作符数据流。现有的数据流探索工具仅融合逐点操作符或具有固定数据流的两个张量操作符。在数据流设计空间中缺乏整体搜索将导致多张量融合的局部优化。
3、现有的算子优化作为
...【技术保护点】
1.一种基于张量融合的数据流优化方法,其特征在于,包括:
2.根据权利要求1所述的基于张量融合的数据流优化方法,其特征在于,所述基于解耦优化算法能够将数据流探索从单算子内部拓展到算子间进一步包括:
3.根据权利要求2所述的基于张量融合的数据流优化方法,其特征在于,所述基于解耦优化算法能够将数据流探索从单算子内部拓展到算子间进一步包括:
4.根据权利要求2所述的基于张量融合的数据流优化方法,其特征在于,所述基于解耦优化算法能够将数据流探索从单算子内部拓展到算子间进一步包括:
5.根据权利要求2所述的基于张量融合的数据流优化
...【技术特征摘要】
1.一种基于张量融合的数据流优化方法,其特征在于,包括:
2.根据权利要求1所述的基于张量融合的数据流优化方法,其特征在于,所述基于解耦优化算法能够将数据流探索从单算子内部拓展到算子间进一步包括:
3.根据权利要求2所述的基于张量融合的数据流优化方法,其特征在于,所述基于解耦优化算法能够将数据流探索从单算子内部拓展到算子间进一步包括:
4.根据权利要求2所述的基于张量融合的数据流优化方法,其特征在于,所述基于解耦优化算法能够将数据流探索从单算子内部拓展到算子间进一步包括:
5.根据权利要求2所述的基于张量融合的数据流优化方法,其特征在于,所述基于遗传算法来生成不同的调度,并基于分析法来选择...
【专利技术属性】
技术研发人员:景乃锋,徐磊,莫志文,王琴,蒋剑飞,毛志刚,
申请(专利权)人:上海交通大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。