无锡江南计算技术研究所专利技术

无锡江南计算技术研究所共有741项专利

  • 本发明公开一种异构众核架构上基于算子融合的数据复用方法,将DNN算子库中依次调用的至少两个算子A、B进行功能融合,获得融合算子C,执行以下操作:S1、融合算子C从主存中读取数据到局存中,并将读取的数据作为算子A的输入;S2、算子A将获取...
  • 本发明公开一种面向云IDE的动态调度和用户认证方法,包括以下步骤:S1、用户在浏览器中输入统一登录地址和指定服务端口,输入用户名和口令;S2、Nginx服务将接收自S1的用户名和口令作为认证信息,对认证信息进行认证;S3、开发服务器上的...
  • 本发明公开一种分布式存储系统的内存池管理方法,包括以下步骤:S1、分布式存储系统初始化开始,打开网卡设备;S2、分配内存,注册分布式存储系统内存池,记录内存池的首地址和内存大小;S3、将分布式存储系统内存池的首地址作为输入参数,注册网卡...
  • 本发明公开一种异构众核架构上的矩阵转置方法,针对大规模矩阵M*N,其中,M%8=0,N%8=0;包括以下步骤:S1、将大规模矩阵M*N以8
  • 本发明公开一种异构众核软件调试装置及调试方法,包括以下配置:从核调试代理线程sdbth:sdbth由主核OS创建,运行在被跟踪进程tracee的地址空间内,循环执行一个低优先级的睡眠;在调试器进程debug中增加一套从核架构数据和一个切...
  • 本发明公开一种基于国产众核架构的POM海洋模式众核优化方法,S1、分析源码,确定循环层数和每层循环量大小,并通过将小循环合并为大循环或者判断外移的方法将源代码修改成更适合众核化的代码;S2、更改众核代码;S3、用魔方旋转算法化多维ste...
  • 本发明公开一种针对百量子级方形量子网格随机电路模拟方法,在利用张量网络方法对量子随机电路进行模拟的过程中,于是将张量网络切割成较小的张量片,存在不同的节点上;包括以下步骤:S1、将张量网络沿中线切割m次,以降低张量收缩路径中产生的最大张...
  • 本发明公开一种异构众核架构上CPU共享数组引导维选取策略,对矩阵引导维进行如下调整,并存储于CPU共享空间中:S1、申请CPU共享空间时,控制申请空间的首地址即src 128B对界,使得从核DMA取时源地址始终128B对界;S2选取ld...
  • 本发明公开一种缓冲受限的数据分块全交换通信实现方法,包括以下步骤:S1、申请用于全交换通信的缓冲空间,具体为:参与全交换通信的节点数为N,每个节点上全交换的数据量为A,起始地址为src,全交换通信块的大小为A/N,记为block;根据内...
  • 本发明公开一种半精度浮点矩阵乘累加误差的优化方法,针对半精度浮点矩阵乘的分块运算,在进行分块结果累加计算时,先进行各分块内部累加,再进行分块间累加,具体包括以下步骤:S1、两个形状为M*K和K*N的矩阵进行半精度矩阵乘法时,如果K大于6...
  • 本发明公开一种计算核心加速的通信优化方法,包括以下步骤:S1、控制核心通过检查运算核心的状态参数,感知运算核心是否处于空闲状态;S2、若运算核心处于空闲状态,则利用运算核心的聚合访存能力加速通信中的数据传输或者利用运算核心的计算能力加速...
  • 本发明公开一种众核处理器上从核局存空间动态管理方法,主核进程在每个从核上启动一个守护线程,并根据程序执行流程,请求从核守护线程执行指定的从核子函数,包括建立新的数据环境、执行加速段子函数、撤销当前的数据环境,或请求从核线程终止运行。本发...
  • 本发明公开一种基于时空特性数据的调试调优方法,包括以下步骤:S1、采样控制模块配置所需采集的指标并启动采集;S2、性能指标采集模块采集性能指标,通过时间采集模块、空间采集模块分别采集当前性能指标所处的时间和代码空间,其中时间指标通常用处...
  • 本发明公开一种分布式存储系统数据管理方法,包括及时任务模式、定时任务模式和策略模式,所述策略模式下的数据管理方法包括以下步骤:S31、发起数据管理请求;S32、接收到数据管理请求;S33、将数据管理请求分发到组成存储系统的每一个服务器上...
  • 本发明公开一种针对深度学习半精度算子数据访存对界处理方法,针对深度学习中算子的计算特点和张量空间分布,对多维张量的特定维度做4B对界处理,将四维张量的输入数据按照实际参与计算的维度分为不同的类,分别使用不同的半精度数据对界处理方法;具体...
  • 本发明公开一种基于国产异构众核平台的高精度浮点数模拟方法,包括以下步骤:S1、初始数据类型的转换与表示:利用数据类型转换函数实现源数据类型到高精度浮点数的转换;S2、根据具体功能,对符号位、指数位以及尾数分别进行相应的运算,并用指令进行...
  • 本发明公开一种面向IO转发系统的IO处理框架,包括以下作业粒度的IO调度单元,用于在IO转发节点上,根据作业的job ID将所有的IO请求进行分类;文件粒度的IO调度单元,用于将来自同一作业的IO请求按照文件进行分配,并以文件为单位进行...
  • 本发明公开一种异构众核程序动态调用树分析装置及分析方法,所述分析方法包括以下步骤:S1、增加一个编译选项;S2、使用新增加的编译选项编译程序;S3、运行S2中生成的程序;S4、程序运行至InitFunc时,InitFunc进行空间申请,...
  • 本发明公开一种冗余cache淘汰操作消除方法,包括以下步骤:S1、分析程序代码,直至找到第一个cache淘汰操作;S2、继续分析程序代码,若发现函数调用语句,则执行S3,否则执行S4;S3、依次分析并记录子函数调用链中语句的操作;S4、...
  • 本发明公开一种神经网络的针对模型并行的动态负载均衡方法,根据不同的模型和系统的相应参数给出切分策略,并在训练过程中进一步迭代更新;根据不同的模型和系统的相应参数,给出对模型网络的切分策略,在训练过程中进一步迭代更新。本发明能够根据不同的...