无锡江南计算技术研究所专利技术

无锡江南计算技术研究所共有755项专利

  • 本发明提供一种支持多种不同精度运算的脉动阵列硬件实现方法及装置,属于高性能微处理器设计技术领域。该方法包括如下步骤:S1:建立神经网络的阶段和运算配置相关联的关联表;S2:获取神经网络的阶段,从关联表中获取与该阶段对应的运算配置;S3:...
  • 本发明公开了一种支持非线性函数扩展功能的并行查表方法及装置,涉及人工智能技术领域,包括:将非线性函数分割成若干区间,每个区间内函数值由线性函数表示,其中线性函数系数存放在查找表内,查找表位于局部存储内;进行多格式数据转换,根据函数种类指...
  • 本发明公开了一种支持数据在线重组的DMA访存方法及装置,涉及数据处理技术领域,包括:DMA引擎收到DMA传输指令时,判断DMA传输指令中是否有数据重组指示,若是则获取数据传输方向以及数据重组参数信息;DMA引擎将收到的DMA指令解析并拆...
  • 本发明提供一种支持工作区和结果区切换的累加器双缓冲方法及装置,属于高性能微处理器设计技术领域。该方法包括如下步骤:S1:在未确定两个缓冲分别为何区时将处于空闲状态的一个缓冲作为工作区、将处于卸载状态的另一个缓冲作为结果区,在确定两个缓冲...
  • 一种神经网络处理器,属于高性能计算技术领域。本发明包括:控制核心,用于控制各个功能单元上的运算和处理;张量/向量/标量处理阵列,集成有n*m个张量/向量/标量处理单元,用于进行张量/向量/标量计算;内存单元,包括共享内存和若干个私有内存...
  • 本发明涉及计算机数据计算领域,具体涉及处理器对虚拟内存读取过程中的优化方式。本发明是通过以下技术方案得以实现的:一种适用于多核心处理器的TLB配置方式,包含如下步骤:S01、TLB布置步骤;将所述TLB安装在访存通路的公共部分的位置上;...
  • 本发明涉及计算机数据计算领域,具体处理器多核处理的加速方法。本发明是通过以下技术方案得以实现的:一种支持cache更新的一致性加速处理方法,包含如下步骤:S01、生产核心数据生产步骤;生产核心生产出批量数据;S02、完成通知即时发送步骤...
  • 本发明涉及累加器缓冲技术领域,具体为一种累加器缓冲结构及其数据累加卸载方法。一种累加器缓冲结构,包括一累加器缓冲控制逻辑;以及多个累加器缓冲模块,每一所述累加器缓冲模块均包括双缓冲单元,包括第一缓冲和第二缓冲,当所述第一缓冲处于第一工作...
  • 本发明提供一种支持处理功能扩展的指令构建方法及装置,属于高性能微处理器设计技术领域。该方法包括如下步骤:S1:从处理器中获取目标源操作数;S2:将目标功能描述符存储于目标源操作数;S3:控制加速器对目标源操作数中的目标功能描述符进行解析...
  • 本发明涉及累加器缓冲技术领域,具体为一种累加器缓冲的数据累加卸载系统及方法。一种累加器缓冲的数据累加卸载系统,包括一累加器缓冲控制逻辑和多个累加器缓冲模块;每一所述累加器缓冲模块均包括一控制寄存器,与所述累加器缓冲控制逻辑电性连接,用于...
  • 本发明涉及累加器缓冲技术领域,具体为一种累加器缓冲的数据累加卸载的控制结构及方法。一种累加器缓冲的数据累加卸载的控制结构,包括累加器缓冲控制逻辑,包括用于生成累加结果缓存信号的第一控制逻辑单元和用于生成累加结果卸载信号的第二控制逻辑单元...
  • 本发明提供一种支持并发处理多个计算加速引擎的异步计算方法及装置,属于高性能微处理器设计技术领域。该方法包括如下步骤:S1:在加速核心内部集成多个用以处理不同的加速需求的异步计算引擎;S2:控制主流水线接收异步计算指令并基于异步计算指令获...
  • 一种面向量子加速设备的混合式编译方法,属于量子计算技术领域。本发明包括如下步骤:步骤S1,通过标准化的量子代码编程接口,对混合代码中的经典代码与量子代码进行识别;步骤S2,对经典代码进行编译,生成可执行码;步骤S3,运行经典代码的可执行...
  • 一种超级计算机与量子计算机协同的软件栈及工作方法,属于量子计算技术领域。本发明的软件栈包括:经典与量子协同编程框架:在经典编程模型框架中新增量子语言要素的扩展;异构融合编译环境:能够通过要素分析识别出经典与量子混合应用程序中的经典程序部...
  • 一种基于操作系统内核的量子计算资源管理方法,属于量子计算技术领域。本发明包括如下步骤:步骤1,解析当前量子计算任务所需的量子计算资源;步骤2,根据量子计算资源和当前系统中可用计算资源,给当前量子任务分配并映射相应的量子比特;步骤3,检测...
  • 一种用于脉动阵列的数据调度方法,属于神经网络技术领域。本发明包括:步骤1,令待卷积/待矩阵乘的数据A分布在m个核心上;步骤2,将数据B广播给m个核心,m个核心每轮得到相同的b进行计算;步骤3,当每个核心上的分布式数据A与所有的b计算完成...
  • 一种张量、向量、标量计算加速和数据调度系统,属于高性能计算技术领域。本发明包括:标量处理单元:用于取指和译码,以及发送指令;向量处理单元:用于接收来自标量处理单元的向量指令,完成向量类型数据的调度和计算;张量处理单元:用于接收来自标量处...
  • 本发明公开一种面向异构众核处理器的AI框架两级并行加速方法,包括以下步骤:AI框架调用模型优化模块优化深度学习模型或者预训练好的模型,将其组织成更具可并行性的树形计算图;AI框架将优化后的树形计算图转换成由计算任务组成的线程池;线程管理...
  • 本发明公开一种面向国产异构众核加速计算核心局部存储的管理方法,包括以下步骤:控制核心在内核申请内存空间用作LDM管理结构,并将LDM被使用情况进行标记;控制核心将该管理结构拷贝到各个运算核心的LDM中;运算核心在申请和释放空间时均根据自...
  • 本发明公开一种在Qemu模拟器中支持异构CPU共存的方法,针对X86+申威AI的异构模型,基于以下配置:在模拟器实现时定义一个超CPU类型,使得该超类型定义中包含X86CPU、申威AI主核CPU、申威AI从核CPU三种属性,同时把对应的...