执行程序的编译方法、芯片、电子设备及计算机可读存储介质技术

技术编号：33998800 阅读：25 留言：0更新日期：2022-07-02 11:35

本公开实施例公开了一种执行程序的编译方法、芯片、电子设备和计算机可读存储介质。其中该执行程序的编译方法包括：获取原始程序中每个子程序的数据总量；根据多个所述处理核的数据存储区域的大小和所述每个子程序的所述数据总量确定执行每个子程序所需要的处理核的个数；根据执行每个子程序所需要的处理核的个数对所述子程序进行分组；根据所述每个子程序的参数的大小确定同步点的位置；根据所述分组以及所述同步点的位置将所述原始程序编译成执行程序。上述方法编译生成所述执行程序的依据为原始程序的输入输出数据的总量对子程序进行分组并生成执行程序,解决了现有技术中的执行程序在执行时需要频繁访问外部存储器的技术问题。的技术问题。的技术问题。

全部详细技术资料下载

【技术实现步骤摘要】
执行程序的编译方法、芯片、电子设备及计算机可读存储介质

[0001]本公开涉及程序编译及处理器领域，尤其涉及一种执行程序的编译方法、芯片、电子设备及计算机可读存储介质

技术介绍

[0002]随着科学技术的发展，人类社会正在快速进入智能时代。智能时代的重要特点，就是人们获得数据的种类越来越多，获得数据的量越来越大，而对处理数据的速度要求越来越高。芯片是任务调度的基石，它从根本上决定了人们处理数据的能力。从应用领域来看，芯片主要有两条路线：一条是通用芯片路线，例如CPU(Central Processing Unit)等，它们能提供极大的灵活性，但是在处理特定领域算法时有效算力比较低；另一条是专用芯片路线，例如TPU(Tensor Processing Unit)等，它们在某些特定领域，能发挥较高的有效算力，但是面对灵活多变的比较通用的领域，它们处理能力比较差甚至无法处理。由于智能时代的数据种类繁多且数量巨大，所以要求芯片既具有极高的灵活性，能处理不同领域且日新月异的算法，又具有极强的处理能力，能快速处理极大的且急剧增长的数据量。
[000本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种执行程序的编译方法，用于包括多个处理核的系统中，其特征在于，包括：获取原始程序中每个子程序的数据总量；根据多个所述处理核的数据存储区域的大小和所述每个子程序的所述数据总量确定执行每个子程序所需要的处理核的个数；根据执行每个子程序所需要的处理核的个数对所述子程序进行分组，并为所述分组分配对应数量的所述处理核；根据所述每个子程序的参数的大小以及所述处理核的参数存储区域的大小确定同步点的位置；根据所述分组以及所述同步点的位置将所述原始程序编译成执行程序。2.如权利要求1中任一项所述的执行程序的编译方法，其特征在于，所述根据执行每个子程序所需要的处理核的个数对所述子程序进行分组，并为所述分组分配对应数量的所述处理核，包括：根据执行每个子程序所需要的处理核的个数以及所述处理核的总数确定所述子程序的分组；根据执行每个分组中的子程序所需要的处理核的个数以及所述处理核的总数为所述分组分配对应数量的所述处理核；其中，同一分组所分配的处理核个数相同。3.如权利要求2所述的执行程序的编译方法，其特征在于，所述原始程序包括多个子程序，所述子程序依次执行，所述根据执行每个子程序所需要的处理核的个数以及所述处理核的总数确定所述子程序的分组，包括：依次获取执行每个子程序所需要的处理核的个数；计算能够整除所述处理核的总数且不小于执行所述子程序所需要的处理核的个数的值作为所述子程序的第一值；其中，每个子程序对应一个第一值；依次将连续相同的第一值所对应的子程序确定为一个子程序的分组。4.如权利要求2所述的执行程序的编译方法，其特征在于，所述原始程序包括多个子程序，所述子程序依次执行，所述根据执行每个子程序所需要的处理核的个数以及所述处理核的总数确定所述子程序的分组，包括：依次获取执行每个子程序所需要的处理核的个数N
i
；其中i表示子程序的编号；获取当前N
i
中的最大值N
max1
；获取所有N
max1
所对应的子程序中编号最大的子程序...

【专利技术属性】
技术研发人员：ꢀ七四专利代理机构，
申请(专利权)人：北京希姆计算科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人