当前位置: 首页 > 专利查询>之江实验室专利>正文

面向芯粒的主协处理器协作计算模拟器设计方法和装置制造方法及图纸

技术编号:40550091 阅读:26 留言:0更新日期:2024-03-05 19:08
本发明专利技术公开了一种面向芯粒的主协处理器协作计算模拟器设计方法和装置,方法包括:构建由主协处理器协作计算的模拟器,主处理器为乱序执行CPU,协处理器包含功能模拟模块和性能模拟模块,主协处理器用RoCC交互接口连接;获取芯粒物理架构信息对模拟器进行设置;将神经网络编译为包含协处理器指令集的可执行文件;主处理器接收可执行文件,通过协处理器写指令构造消息发送给协处理器;协处理器根据消息类型进行处理并发送计算完成消息至主处理器;主处理器接收消息后通过协处理器读指令告知程序继续执行,最终获得神经网络的模拟运行结果和性能评估结果。本发明专利技术方法能够有效指导芯粒设计,降低芯粒设计过程中的经济开销和时间开销。

【技术实现步骤摘要】

本专利技术属于芯粒模拟器设计,具体涉及一种面向芯粒的主协处理器协作计算模拟器设计方法和装置


技术介绍

1、深度学习作为当今解决复杂的现实世界问题的关键技术,其使用深度神经网络的方法得到了快速普及,广泛应用于包括图像识别、目标检测、语言翻译、自然语言翻译、音频合成和自动驾驶等多个领域。随着技术的不断进步,深度神经网络得到更广泛的开发和使用,为了提高效率,深度神经网络的规模也在不断增长,如今最先进的深度神经网络有数十到数百层,需要数十亿次操作和数百兆字节来存储激活数据和权重。这种网络越来越大、越来越深的趋势,随之而来的调度方案搜索空间的大小也呈指数级增长。如何有效地管理和优化这些网络的运行,提高其性能和效率,成为了当前深度学习领域亟待解决的问题,芯粒技术的出现为这个问题提供了新的解决方案。

2、近年来,随着芯片技术的发展,神经网络加速器正在从芯片升级至芯粒。芯粒是一种将多个小芯片单元集成封装为满足特定功能的单元芯片的技术。与传统的普通芯片相比,芯粒具有更高的灵活度和性能,同时也降低了成本。这对于神经网络加速器这种专用领域架构的发展起到了积极的推动本文档来自技高网...

【技术保护点】

1.一种面向芯粒的主协处理器协作计算模拟器设计方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的面向芯粒的主协处理器协作计算模拟器设计方法,其特征在于,所述模拟器的系统架构包括:

3.根据权利要求1所述的面向芯粒的主协处理器协作计算模拟器设计方法,其特征在于,所述芯粒物理架构信息,包括:芯粒拓扑结构、内存层级、各层内存大小和芯粒中协处理器架构,根据芯粒物理架构信息对模拟器进行设置的过程包括:

4.根据权利要求1所述的面向芯粒的主协处理器协作计算模拟器设计方法,其特征在于,所述将神经网络编译为包含协处理器指令集的可执行文件,包括:

5...

【技术特征摘要】

1.一种面向芯粒的主协处理器协作计算模拟器设计方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的面向芯粒的主协处理器协作计算模拟器设计方法,其特征在于,所述模拟器的系统架构包括:

3.根据权利要求1所述的面向芯粒的主协处理器协作计算模拟器设计方法,其特征在于,所述芯粒物理架构信息,包括:芯粒拓扑结构、内存层级、各层内存大小和芯粒中协处理器架构,根据芯粒物理架构信息对模拟器进行设置的过程包括:

4.根据权利要求1所述的面向芯粒的主协处理器协作计算模拟器设计方法,其特征在于,所述将神经网络编译为包含协处理器指令集的可执行文件,包括:

5.根据权利要求1或4所述的面向芯粒的主协处理器协作计算模拟器设计方法,其特征在于,所述协处理器指令集,包括:

6.根据权利要求5所述的面向芯粒的主协处理器协作计算模拟器设计方法,其特征在于,所述模拟器的主处理器接收可执行文件并依次执行每条指令,通过协处理器写指令构造消息通过rocc交互接口发送给协处理器,包括:...

【专利技术属性】
技术研发人员:潘秋红魏肖彤赵准杨弢毛旷
申请(专利权)人:之江实验室
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1