【技术实现步骤摘要】
本专利技术属于芯粒模拟器设计,具体涉及一种面向芯粒的主协处理器协作计算模拟器设计方法和装置。
技术介绍
1、深度学习作为当今解决复杂的现实世界问题的关键技术,其使用深度神经网络的方法得到了快速普及,广泛应用于包括图像识别、目标检测、语言翻译、自然语言翻译、音频合成和自动驾驶等多个领域。随着技术的不断进步,深度神经网络得到更广泛的开发和使用,为了提高效率,深度神经网络的规模也在不断增长,如今最先进的深度神经网络有数十到数百层,需要数十亿次操作和数百兆字节来存储激活数据和权重。这种网络越来越大、越来越深的趋势,随之而来的调度方案搜索空间的大小也呈指数级增长。如何有效地管理和优化这些网络的运行,提高其性能和效率,成为了当前深度学习领域亟待解决的问题,芯粒技术的出现为这个问题提供了新的解决方案。
2、近年来,随着芯片技术的发展,神经网络加速器正在从芯片升级至芯粒。芯粒是一种将多个小芯片单元集成封装为满足特定功能的单元芯片的技术。与传统的普通芯片相比,芯粒具有更高的灵活度和性能,同时也降低了成本。这对于神经网络加速器这种专用领域架构的
...【技术保护点】
1.一种面向芯粒的主协处理器协作计算模拟器设计方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的面向芯粒的主协处理器协作计算模拟器设计方法,其特征在于,所述模拟器的系统架构包括:
3.根据权利要求1所述的面向芯粒的主协处理器协作计算模拟器设计方法,其特征在于,所述芯粒物理架构信息,包括:芯粒拓扑结构、内存层级、各层内存大小和芯粒中协处理器架构,根据芯粒物理架构信息对模拟器进行设置的过程包括:
4.根据权利要求1所述的面向芯粒的主协处理器协作计算模拟器设计方法,其特征在于,所述将神经网络编译为包含协处理器指令集的可执行文件,包
5...
【技术特征摘要】
1.一种面向芯粒的主协处理器协作计算模拟器设计方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的面向芯粒的主协处理器协作计算模拟器设计方法,其特征在于,所述模拟器的系统架构包括:
3.根据权利要求1所述的面向芯粒的主协处理器协作计算模拟器设计方法,其特征在于,所述芯粒物理架构信息,包括:芯粒拓扑结构、内存层级、各层内存大小和芯粒中协处理器架构,根据芯粒物理架构信息对模拟器进行设置的过程包括:
4.根据权利要求1所述的面向芯粒的主协处理器协作计算模拟器设计方法,其特征在于,所述将神经网络编译为包含协处理器指令集的可执行文件,包括:
5.根据权利要求1或4所述的面向芯粒的主协处理器协作计算模拟器设计方法,其特征在于,所述协处理器指令集,包括:
6.根据权利要求5所述的面向芯粒的主协处理器协作计算模拟器设计方法,其特征在于,所述模拟器的主处理器接收可执行文件并依次执行每条指令,通过协处理器写指令构造消息通过rocc交互接口发送给协处理器,包括:...
【专利技术属性】
技术研发人员:潘秋红,魏肖彤,赵准,杨弢,毛旷,
申请(专利权)人:之江实验室,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。