一种基于RISC-V架构的神经网络搜索芯片制造技术

技术编号:38993067 阅读:19 留言:0更新日期:2023-10-07 10:23
本发明专利技术提供了一种基于RISC

【技术实现步骤摘要】
一种基于RISC

V架构的神经网络搜索芯片


[0001]本专利技术涉及神经网络芯片
,特别是涉及一种基于RISC

V架构的神经网络搜索芯片。

技术介绍

[0002]近些年来,随着社会发展,人工智能(Artificial Intelligence,AI)广泛应用于云端数据中心,智能端设备和边缘端设备。同时,神经网络在各种AI任务中展现出强大的能力,包括但不限于图像识别、人脸识别、关键词检测和文本处理等场景。人工神经网络性能不断提升,包含大量参数和运算的深度神经网络得到了广泛的使用。AI在计算过程中,由于卷积、池化以及激活等操作,会产生大量的中间数据并需要大量的数据搬移,这对AI芯片的性能和功耗提出了更高的要求。
[0003]在传统的存算分离的冯诺依曼架构上训练神经网络时,存在诸多局限:处理器和存储器之间搬运数据的总线带宽有限;在分级的存储器结构下,远离处理器的存储级容量大,但带宽低延迟高;神经网络的计算的数据量大,并行度高,需要大量的数据搬移等。在训练时大量的时间和能量消耗在数据的搬运和存储器的读写上,算力提升需要高带宽的存储器以及新型的计算架构。并且随着电路工艺的不断进步,处理器和存储器之间的性能沟壑越来越大,系统性能主要受到存储器性能的限制。此外,冯诺依曼架构下神经网络算法中会发生频繁的数据搬移,产生的高功耗远远高于计算产生功耗,该神经网络架构下较多数据占用CPU资源带宽,使得CPU计算效率较低、功耗较高。
[0004]存算一体芯片提供了一种新型神经网络加速器的方法:存算一体芯片将计算操作嵌入存储单元中,消除了存储器和处理单元的边界。相较于传统冯诺依曼架构下串行处理数据,处理器和片外存储器不断增大的性能差异,导致处理器访存计算性能极大的影响了系统性能。此外存算一体芯片会对数据并行处理,在计算过程中,减少了中间数据的搬运,有着较少的片外存储访问次数,因此存算一体架构的计算效率远高于冯诺依曼计算架构的计算效率,在卷积计算和大数据处理场景中尤其明显。
[0005]现阶段神经网络模型层出不穷,各种模型在图像处理、机器翻译等深度学习任务都扮演着举足轻重的角色,其中模型中网络结构是一种特殊的超参数,例如Transfomer、ResNet等网络结构都需要能够更加精确设计才能够实现深度学习的模型性能,神经网络结构搜索(Neural Architecture Search,NAS)即代表将传统的手工网络结构设计转变为自动化设计。现阶段Google等已有通过强化学习进行神经网络结构搜索,在图像分类和语言建模任务上都超越了此前手工设计的网络。
[0006]但目前的神经网络类型较多,依靠经验模型往往达不到理想的结果。

技术实现思路

[0007]为了克服现有技术的不足,本专利技术的目的是提供一种基于RISC

V架构的神经网络搜索芯片。
[0008]为实现上述目的,本专利技术提供了如下方案:一种基于RISC

V架构的神经网络搜索芯片,包括:CPU控制器模块,与Memory存储单元通信连接,用于基于上位机的Resnet神经网络搜索任务,对输入数据和模型参数进行处理,得到搜索完成的神经网络结构;其中,所述CPU控制器模块使用RISC

V精简指令集架构控制数据流和数据缓冲;DMA单元,分别与所述CPU控制器模块、Memory存储单元和片上存储模块通信连接;数字存算一体核模块,与所述片上存储模块通信连接,用于根据数据指令对搜索完成的神经网络结构进行训练。
[0009]优选的,所述根据数据指令对搜索完成的神经网络结构进行训练,包括:利用任务调度器通过DMA单元直接访存数据指令,并保存在片上存储模块的buffer中,利用CPU控制器模块通过机器码编译具体指令位,识别指令需求并发出控制信号,并通过数据转换将所述控制信号转换为8bit位一组数据传输给所述数字存算一体核模块,以配置数字存算一体核模块对搜索完成的神经网络结构进行训练。
[0010]优选的,在神经网络搜索过程中,利用流水线的方式对神经网络结构进行搜索训练。
[0011]优选的,所述数字存算一体核模块包括ALU单元。
[0012]优选的,所述ALU单元包括加法器、乘法器和移位累加器;在进行运算流程时,利用所述乘法器实现数据和地址的乘法运算,再利用所述加法器对乘法运算后的数据和地址进行加法运算,最后通过移位累加器对加法运算后的数据和地址进行处理得到运算结果。
[0013]优选的,所述片上存储模块含有多层数据缓冲区,且每一层数据缓冲区通过FIFO进行缓冲。
[0014]优选的,所述数字存算一体核模块,通过片上总线接口与所述片上存储模块通信连接。
[0015]优选的,所述Memory存储单元为SRAM存储器。
[0016]根据本专利技术提供的具体实施例,本专利技术公开了以下技术效果:本专利技术提供了一种基于RISC

V架构的神经网络搜索芯片,包括:CPU控制器模块,与Memory存储单元通信连接,用于基于上位机的Resnet神经网络搜索任务,对输入数据和模型参数进行处理,得到搜索完成的神经网络结构;其中,所述CPU控制器模块使用RISC

V精简指令集架构控制数据流和数据缓冲;DMA单元,分别与所述CPU控制器模块、Memory存储单元和片上存储模块通信连接;数字存算一体核模块,与所述片上存储模块通信连接,用于根据数据指令对搜索完成的神经网络结构进行训练。本专利技术通过利用数字存算一体核与RISC

V架构的CPU完成神经网络的训练和搜索,能够提升总线传输数据的调度效率,同时该架构下数字存算一体核能够充分利用算力资源实现网络推理任务,克服传统存储运算算力的限制,实现速度更快、精度更高的神经网络搜索。
附图说明
[0017]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图
获得其他的附图。
[0018]图1为本专利技术实施例提供的神经网络结构搜索架构图;图2为本专利技术实施例提供的神经网络搜索硬件通道设计原理图;图3为本专利技术实施例提供的基于RISC

V数字存算处理器逻辑架构示意图;图4为本专利技术实施例提供的RISC

V控制的数字存算一体的神经网络搜索整体结构图;图5为本专利技术实施例提供的数字存算一体运算流程图;图6为本专利技术实施例提供的数字存算单元结构示意图;图7为本专利技术实施例提供的搜索空间内硬件流水线结构示意图。
具体实施方式
[0019]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于RISC

V架构的神经网络搜索芯片,其特征在于,包括:CPU控制器模块,与Memory存储单元通信连接,用于基于上位机的Resnet神经网络搜索任务,对输入数据和模型参数进行处理,得到搜索完成的神经网络结构;其中,所述CPU控制器模块使用RISC

V精简指令集架构控制数据流和数据缓冲;DMA单元,分别与所述CPU控制器模块、Memory存储单元和片上存储模块通信连接;数字存算一体核模块,与所述片上存储模块通信连接,用于根据数据指令对搜索完成的神经网络结构进行训练。2.根据权利要求1所述的基于RISC

V架构的神经网络搜索芯片,其特征在于,所述根据数据指令对搜索完成的神经网络结构进行训练,包括:利用任务调度器通过DMA单元直接访存数据指令,并保存在片上存储模块的buffer中,利用CPU控制器模块通过机器码编译具体指令位,识别指令需求并发出控制信号,并通过数据转换将所述控制信号转换为8bit位一组数据传输给所述数字存算一体核模块,以配置数字存算一体核模块对搜索完成的神经网络结构进行训练。3.根据权利要求1所述的基于RISC

V架构的神经...

【专利技术属性】
技术研发人员:刘斌袁梓涵潘彪康旺
申请(专利权)人:北京京瀚禹电子工程技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1