【技术实现步骤摘要】
一种传送dma控制信息的方法、装置、电子设备和存储介质
[0001]本申请涉及AI推理
,尤其涉及一种传送dma控制信息的方法、装置、电子设备和存储介质。
技术介绍
[0002]在CAISA Engine中,大部分控制操作都是dma(direct memory access,直接存储器访问)控制操作,根据算子的不同以及实际情况,实现一个算子的控制流需要的dma控制信息的dma类型可能有2
‑
10种,包括input、output、coeff和bias等。
[0003]在CAISA Engine中,dma控制信息由主控cpu生成,然后传送至实时cpu的TCM中,实时cpu使用dma控制信息去控制AI Engine推理,所以整个算子的运算过程中存在一次dma控制信息的搬运。
[0004]目前不管当前算子需要几种dma类型,主控cpu传给TCM的信息都会包含每种类型的dma控制信息,包含有用的dma控制信息和无用的dma控制信息,占用TCM的存储空间非常大。例如,每个dma控制器总共有16个寄 ...
【技术保护点】
【技术特征摘要】
1.一种传送dma控制信息的方法,其特征在于,应用于主控cpu,所述方法包括:获取全版本的dma控制信息,其中,所述全版本的dma控制信息中包括有效dma控制信息和无效dma控制信息;根据所述全版本的dma控制信息确定header中的bit位,其中,所述header中每个bit位指示一个dma控制信息;根据所述header中的bit位,从所述全版本的dma控制信息中选取出目标算子需要的有效dma控制信息;发送数据包至实时cpu对应的TCM,其中,所述数据包中包括所述header和所述有效dma控制信息。2.根据权利要求1所述的方法,其特征在于,所述根据所述全版本的dma控制信息确定header中的bit位包括:确定所述全版本的dma控制信息中每种dma控制信息的valid字段的bit位;若所述valid字段的bit位为1,则将所述dma控制信息对应header中的bit位设为1;若所述valid字段的bit位为0,则,则将所述dma控制信息对应header中的bit位设为0。3.根据权利要求1所述的方法,其特征在于,根据所述header中的bit位,从所述全版本的dma控制信息中选取出目标算子需要的有效dma控制信息包括:若所述bit位为1,则将所述bit位对应的dma控制信息作为目标算子需要的有效dma控制信息;若所述bit位为0,则将所述bit位对应的dma控制信息作为目标算子不需要的无效dma控制信息。4.根据权利要求1所述的方法,其特征在于,获取全版本的dma控制信息包括:加载特定格式的目标网络模型,其中,所述目标网络模型由初始格式的初始网络模型转换得到的;对所述目标网络模型进行解析,得到解析后的目标网络模型,其中,所述解析后的目标网络模型包括携带的全版本的dma控制信息。5.一种传送dma控制信息的方法,其特征在于,应用于实时cpu,所述方法包括:从TCM中获取主控cpu发送的数据包,其中,所述数据包中包括header和目标算子需要的有效dma控制信息,header中的bit位是根据全版本的dma控制信息得到的,所述全版本的d...
【专利技术属性】
技术研发人员:伍永情,蔡权雄,牛昕宇,
申请(专利权)人:深圳鲲云信息科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。