【技术实现步骤摘要】
应用于AI芯片的计算图简化方法、装置、设备及介质
[0001]本专利技术实施例涉及人工智能芯片技术,尤其涉及一种应用于AI芯片的计算图简化方法、装置、设备及介质。
技术介绍
[0002]目前在人工智能(Artificial Intelligence,AI)芯片神经网络模型的计算图优化时,由于市场和研究方向慢慢转向对子结构的优化,因此对子结构进行分析的需求也随之增加。
[0003]但现有的基于不同硬件及软件架构生成不同计算图表达的方式并不能直观、便利且统一的搜索、匹配子结构,并基于硬件特点对主计算图进行分析,并灵活的折叠简化主计算图,导致当前计算图优化分析及研究的成本增加。
技术实现思路
[0004]本专利技术实施例提供一种应用于AI芯片的计算图简化方法、装置、设备及介质,以对应用于AI芯片的计算图进行简化。
[0005]第一方面,本专利技术实施例提供了一种应用于AI芯片的计算图简化方法,包括:获取算法模型所对应的主计算图以及待搜索的子计算图,其中,所述主计算图和所述子计算图中分别包含所述算法模 ...
【技术保护点】
【技术特征摘要】
1.一种应用于AI芯片的计算图简化方法,其特征在于,包括:获取算法模型所对应的主计算图以及待搜索的子计算图,其中,所述主计算图和所述子计算图中分别包含所述算法模型的节点和节点描述;获取与所述主计算图适配的AI芯片信息,并根据所述AI芯片信息建立与所述主计算图和所述子计算图分别匹配的主结构体和子结构体;将所述子结构体与所述主结构体进行匹配识别,当确定在所述主结构体中匹配到所述子结构体时获取匹配位置,根据所述AI芯片信息和所述匹配位置对所述主结构体进行折叠获取简化后的主结构体。2.根据权利要求1所述的方法,其特征在于,所述获取与所述主计算图适配的AI芯片信息,并根据所述AI芯片信息建立与所述主计算图和所述子计算图分别匹配的主结构体和子结构体,包括:对所述主计算图中的节点描述进行识别,获取与所述主计算图适配的AI芯片信息,其中,所述节点描述包括节点类型和节点名称;根据所述AI芯片信息对所述主计算图和所述子计算图分别进行后向遍历计算,建立所述主结构体和所述子结构体,其中,所述主结构体和所述子结构体中分别包含所述算法模型的节点、节点描述和节点依赖关系。3.根据权利要求2所述的方法,其特征在于,所述根据所述AI芯片信息和所述匹配位置对所述主结构体进行折叠获取简化后的主结构体,包括:将所述匹配位置的子结构体进行折叠获取折叠主结构体;获取所述AI芯片信息的硬件参数信息,根据所述硬件参数信息确定所述折叠主结构体中各节点的硬件资源信息,其中,所述硬件资源信息包括存储空间使用量和运行时间评估信息;将各节点的所述硬件资源信息添加到所述折叠主结构体中获取所述简化后的主结构体。4.根据权利要求1所述的方法,其特征在于,所述将所述子结构体与所述主结构体进行匹配识别,包括:从所述主结构体中反向遍历寻找与所述子结构体最后一个节点相同的目标节点;获取所述目标节点的属性信息以及所述最后一个节点的属性信息,其中,所述属性信息中包含关联父节点;当确定所述目标节点的属性信息中所包含的关联父节点,与所述最后一个节点的属性信息中所包含的关联父节点完全相同或者存在重合时,则从所述目标节点依次反向遍历所述主结构体;判断所述主结构体中是否存在与所述子结构体中剩余节点相同并且属性信息也相同的节点,若存在,则确定在所述主结构体中匹配到所述子结构体,否则,在所述主结构体中没有匹配到所述子结构体。5.根据权利要求1所述的方法,其特征在于,所述当确定所述子结构体的数量为多个时,所述根据所述AI芯片信息和所述匹配位置对所述主结构体进行折叠获取简化后...
【专利技术属性】
技术研发人员:李超豪,孙诚程,张亚林,
申请(专利权)人:上海燧原科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。