无锡江南计算技术研究所专利技术

无锡江南计算技术研究所共有741项专利

  • 本发明公开一种网格化流水的全收集方法,包括以下步骤:S1、将每个超节点内的进程组织为一个分组,每个分组不必具备同样多的进程;S2、每个分组选出任意一个进程作为代表进程,参与到组间的通信中,由此构成二级网格化通信结构,并将二级网格化通信结...
  • 本发明公开一种面向国产异构众核处理器的TensorFlow框架核心计算加速引擎,独立设置于TensorFlow框架与多个众核计算加速库之间,包括以下功能模块:算子接口模块,用于将运行流程转入核心计算加速引擎;分析调度模块,用于分析算子类...
  • 本发明公开一种基于异构众核架构的直接内存访问编译优化方法,包括以下步骤:S1、通过调度原语cache_read,将张量数据由主存搬移到局存;S2、通过调度原语pragma,将S11中的数据搬移操作改写为DMA GET操作;S3、通过调度...
  • 本发明公开一种基于异构处理器的Fork内存支撑方法,当父进程写被Fork页面、进入内核的缺页处理时,不走核心标准的缺页处理,对页面的缺页处理旁路,具体如下:S11、检查产生缺页的原因是否为写权限导致的;S12、获取页表项对应的物理页面管...
  • 本发明公开一种基于任务循环划分策略的负载平衡方法,包括以下步骤:S1、根据任务实际需求和线程的任务处理能力,将任务池中的每个任务划分为线程们可高效并行处理的若干子任务;S2、对S1中得到若干子任务编号,将任务池中的任务编号为taskid...
  • 本发明公开一种异步通信优化方法,S1、判断物理资源是否满足大于等于用户程序所需进程数2倍的条件;S2、为用户程序的各个进程间隔分配控制核心作为进程控制核心,并在每个用户进程之间启用一个空闲的控制核心作为专用控制核心,所述进程控制核心与所...
  • 本发明公开一种面向异构众核平台的Im2col加速方法,C*H*W的张量经过Im2col变换后的矩阵形状为(C*Kh*Kw)*(Ho*Wo),其中C是通道数,H和W分别为输入的高度和宽度,Kh和Kw为卷积核大小,Ho和Wo为输出张量的高度...
  • 本发明公开一种动态内存管理方法,包括以下步骤:S1、在运行课题时指定x属性内存空间的总大小;S2、开辟相应大小的x属性内存空间;S3将目标码中的静态x属性内存空间映射到S2中所开辟的x属性内存空间的前半部分,剩余的后半部分x属性内存空间...
  • 本发明公开一种缓解假共享问题的编译器支持方法,包括以下步骤:S1、用户在程序中,对多线程Cache之间可能存在假共享的变量声明分别使用__attribute__((cacheline))接口;S2、编译器将声明树节点的基类tree_de...
  • 本发明公开一种基于握手协议的多核间缓存刷新方法,包括以下步骤:发起核通过核间中断向其他核发起缓存刷新请求;发起核死等轮询其他核是否完成缓存刷新操作并计时;其他核接受到来自发起核的缓存刷新请求后,中断进入缓存刷新函数入口,完成缓存刷新;其...
  • 本发明公开一种基于RNIC的多核处理器上消息性能故障定位方法,包括以下步骤:S1:在存控K上申请两片内存空间;S2:按K递增的顺序,通过RNIC串行将存控K中的发送数据发送到存控K中的接收数据中,进行第K+1轮测试;S3:得到测试性能数...
  • 本发明公开一种基于cache写暗示机制的编译优化方法,自动识别对连续主存进行写操作的指令序列,并通过指令插桩,对这些指令序列的访存行为进行优化,包括以下步骤:S1:对代码中所有写操作进行识别,并通过插桩的方式进行标记;S2:对S1中识别...
  • 本发明公开一种编译自调优方法,包括以下步骤:S1、对代码进行插桩;S2、收集代码运行时的信息数据;S3、根据访存密集程度和计算密集程度,将目标代码分为四类;S4、将S3中的分类信息传递给S11;S5、对系统环境参数进行配置;S6、对通用...
  • 本发明公开一种测试记录自动登记方法,S1、测试结果确认模块通过查询测试课题目录下是否存在标志性的正确结束文件,确认测试结果是否正确;S2、错误阶段识别模块通过查询目录结构下每一个测试课题目录中的编译输出日志文件和运行输出日志文件,确定错...
  • 本发明公开一种异构众核架构下的任务动态分配异步管理方法,包括以下步骤:S1、运算核心向控制核心发送任务请求;S2、初始化任务池;S3、判断任务请求类型是计算任务还是控制代理任务;S4、控制核心响应运算核心请求,分配任务至运算核心;S5、...
  • 本发明公开一种基于异构众核架构的C++融合编程方法,包括以下步骤:S1、主核以头文件“athreadcxx.h”的形式提供athreadcxx类的对象;S2、athreadcxx类的对象通过构造函数进行从核资源的初始化,通过析构函数进行...
  • 本发明公开一种面向大规模并行机的快速作业调度方法,包括以下步骤:S1、设置系统作业等待时间阈值;S2、从作业池中获得所有待调度作业的基本信息;S3、将所有待调度作业按照计算得到的优先级由大到小进行排序;S4、各队列根据S3获得的作业排序...
  • 本发明公开一种基于众核处理器的系统功耗动态控制方法,包括以下步骤:S1、提交课题前,设置Pu,并设置S
  • 本发明公开一种超级计算机计算资源故障预测方法,包括以下步骤:S1、每隔s秒采集一个计算节点的特征信息,记为x1s;N个s秒为时间窗口T;S2、经过m个时间窗口T的数据积累,得到m个总特征X作为输入样本;S3、将S2中经数据处理后的m个总...
  • 本发明公开一种大规模互连网络的管理包收发方法,包括以下步骤:S1、初始设置;S2、自动控制,具体如下:S21、命令发送线程在发送时,判断curr_send_package是否小于max_send_package,若小于,则启动一个定时器...