无锡江南计算技术研究所专利技术

无锡江南计算技术研究所共有755项专利

  • 本发明公开一种针对大规模系统深度学习数据并行的分级通信优化方法,S1、根据所需计算节点总数,从若干个超节点中选择相同数量的计算节点,将计算节点按超节点进行分组;S2、每个计算节点计算出模型参数的梯度后,在分组内部进行MPI_Allred...
  • 本发明公开一种基于国产异构平台的C++向量编程方法,所述编程方法包括以下步骤:S1、通过引入头文件simd.h的形式获得向量数据类型和向量编程接口的支持;S2、编译器对C++向量程序进行前端处理,生成中间表示代码;S3、编译器中端对S2...
  • 本发明公开一种异构众核架构上基于膨胀取数的卷积运算方法,包括以下步骤:S1、输入input、权重weight、跨步stride,其中input为Hi*Wi,weight为K*K,根据input和weight的形状计算输出output的形...
  • 本发明公开一种基于遗传算法的极端测试用例生成方法,包括以下步骤:S1、种群生成器生成初始种群;S2、适应值计算器对S1中获得的初始种群中每个个体进行适应值计算;S3、适应值收集模块收集所有个体的适应值,并反馈给遗传算法核心;S4、遗传算...
  • 本发明公开一种异构众核处理器的轻量级并行测试用例生成方法,包括以下步骤:构建配置文件;利用配置分析器模块分析构建的配置文件,将配置文件中的配置信息转换成代码生成器模块可以识别的格式(该格式为字典),并加上配置文件名和测试用例名;代码生成...
  • 本发明公开一种测试程序批量变种方法,包括以下步骤:S1、对测试程序源码进行分析,确定核心代码段区间;S2、得到核心段代码调用的函数代码;S3、对于改变程序执行路径的测试程序,将其核心代码段进行复制并使用if/else结构对两段相同的核心...
  • 本发明公开一种数据cache属性细粒度切换的方法,包括以下步骤:S1:编译选项识别:从程序的编译命令中识别
  • 本发明公开一种无横向一致性的众核精简Cache协议实现方法,包括以下步骤:S1、对Cache行内数据更新情况进行分析,标记出被更新的数据;S2、如果Cache行内所有数据都没有被更新,或者Cache行内所有数据都被更新,跳转至S5,如果...
  • 本发明公开一种编程语言指针类型Cache属性扩展方法,基于以下配置:扩展指针类型的Cache属性,Cache属性具有cached和uncached两个值,Cache属性初始化,允许在指针变量申明时为指针变量的Cache属性设置初始值;C...
  • 本发明公开一种异构众核上基于主
  • 本发明公开一种片上存储空间动态配置方法,包括以下步骤:S1、读取输入参数;S2、读取硬件的LDM配置寄存器;S3、获取计算核栈空间大小及计算核的栈指针;S4、对new_cache_size和old_cache_size进行比较;S5、将...
  • 本发明公开一种通信支撑环境的初始化方法,包括以下步骤:S1、调用作业管理接口,解析本道作业的资源总数tasksize、各进程在作业中的初始资源序号Sid、资源名列表nodeidlist、资源片内唯一标识mpeidlist、pid列表pi...
  • 本发明公开一种PCIE接口正确性测试方法,包括以下步骤:S1、A方在发送数据前,对发送缓冲区进行填充,填充消息描述符;S2、A方开始向B方发送数据;S3、B方等待接收数据;S4、A方等待接收B方发来的数据,在收到B方发送的数据后,进行数...
  • 本发明公开一种面向高性能计算的存储服务资源管理方法,包括运算节点到存储服务资源映射查询、存储服务资源到运算节点的映射查询和存储服务资源调度;所述管理节点,用于将查询任务指派到指定的CE节点,还用于选择调度策略并计算映射关系,将调度任务派...
  • 本发明公开一种网格化流水的全收集方法,包括以下步骤:S1、将每个超节点内的进程组织为一个分组,每个分组不必具备同样多的进程;S2、每个分组选出任意一个进程作为代表进程,参与到组间的通信中,由此构成二级网格化通信结构,并将二级网格化通信结...
  • 本发明公开一种面向国产异构众核处理器的TensorFlow框架核心计算加速引擎,独立设置于TensorFlow框架与多个众核计算加速库之间,包括以下功能模块:算子接口模块,用于将运行流程转入核心计算加速引擎;分析调度模块,用于分析算子类...
  • 本发明公开一种基于异构众核架构的直接内存访问编译优化方法,包括以下步骤:S1、通过调度原语cache_read,将张量数据由主存搬移到局存;S2、通过调度原语pragma,将S11中的数据搬移操作改写为DMA GET操作;S3、通过调度...
  • 本发明公开一种基于异构处理器的Fork内存支撑方法,当父进程写被Fork页面、进入内核的缺页处理时,不走核心标准的缺页处理,对页面的缺页处理旁路,具体如下:S11、检查产生缺页的原因是否为写权限导致的;S12、获取页表项对应的物理页面管...
  • 本发明公开一种基于任务循环划分策略的负载平衡方法,包括以下步骤:S1、根据任务实际需求和线程的任务处理能力,将任务池中的每个任务划分为线程们可高效并行处理的若干子任务;S2、对S1中得到若干子任务编号,将任务池中的任务编号为taskid...
  • 本发明公开一种异步通信优化方法,S1、判断物理资源是否满足大于等于用户程序所需进程数2倍的条件;S2、为用户程序的各个进程间隔分配控制核心作为进程控制核心,并在每个用户进程之间启用一个空闲的控制核心作为专用控制核心,所述进程控制核心与所...