【技术实现步骤摘要】
一种数据处理方法、装置、神经网络加速器及存储介质
[0001]本申请实施例涉及数据缓存
,尤其涉及一种数据处理方法、装置、神经网络加速器及存储介质。
技术介绍
[0002]人工智能算法较为复杂,通常一个场景需要多个算法进行叠加才能完成,而一个算法也通常由多级计算层来实现,计算层可以分为张量类和向量类。
[0003]在通用神经网络加速器中,不同类型的计算层被分配到不同的计算引擎中进行计算,对于每一个计算层,其需要输入特征图像数据和权重数据,并在计算完成之后送回到存储空间中存储,所以对于每一个计算层,需要在存储空间中分配一段物理地址供其进行数据缓冲。
[0004]目前,主要采用微型控制单元以软件的方式进行计算层的物理地址分配,实现数据管理,但是管理的粒度主要是针对一个任务,举例来说,如果目前运行的场景是处理视频流,处理速度是60帧/秒,那么对于每一帧的数据,处理时间大概是16ms,所以,在处理每帧数据时,可以进行动态的地址分配,根据一帧数据经过所有的算法层所需要的存储空间大小进行地址分配,等这一帧数据处理完 ...
【技术保护点】
【技术特征摘要】
1.一种数据处理装置,其特征在于,包括:神经网络处理模块、内存分配模块,以及与所述神经网络处理模块和所述内存分配模块连接的存储模块;所述神经网络处理模块,用于执行预设神经网络中每个计算层,并将每个计算层对应的计算结果传输至所述存储模块;所述内存分配模块,用于持续获取所述存储模块中空闲的物理地址,生成所述空闲的物理地址与虚拟地址之间的地址映射信息,并依次为所述预设神经网络中每个计算层分配对应的虚拟地址空间;所述存储模块,用于基于所述虚拟地址空间的虚拟地址和所述地址映射信息,将所述预设神经网络中每个计算层对应的计算结果,存储到对应的物理地址上。2.根据权利要求1所述的数据处理装置,其特征在于,所述神经网络处理模块,用于:获取根据所述预设神经网络中计算层的执行顺序设定的执行指令;按照所述执行指令,依次执行所述预设神经网络中每个计算层,得到每个计算层对应的计算结果。3.根据权利要求1所述的数据处理装置,其特征在于,还包括:地址映射模块,所述地址映射模块,与所述神经网络处理模块、所述存储模块,以及所述内存分配模块连接;所述神经网络处理模块,用于将所述预设神经网络中每个计算层对应的标识和计算结果传输至所述地址映射模块;所述内存分配模块,用于将所述地址映射信息,以及所述预设神经网络中,每个计算层对应的虚拟地址空间的虚拟地址传输至所述地址映射模块;所述地址映射模块,用于针对所述预设神经网络中每个计算层,根据对应的标识和对应的虚拟地址空间的虚拟地址,结合所述地址映射信息,确定对应的物理地址,并将对应的计算结果传输至对应的物理地址上。4.根据权利要求1所述的数据处理装置,其特征在于,所述内存分配模块,还用于:获取所述预设神经网络中计算层的执行顺序,以及每个计算层需求的存储大小;按照所述执行顺序,依次为每个计算层分配与需求的存储大小匹配的虚拟地址空间。5.根据权利要求4所述的数据处理装置,其特征在于,所述内存分配模块,用于:在初始时刻,将所述存储模块中当前存在的空闲的物理地址以链表...
【专利技术属性】
技术研发人员:祝叶华,孙炜,
申请(专利权)人:哲库科技上海有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。