【技术实现步骤摘要】
【国外来华专利技术】用于执行并行计算的方法和系统相关申请的交叉引用本公开要求2018年8月29日提交的美国临时申请号62/724,539和2019年7月30日提交的美国专利申请号16/526,597的优先权的权益,这些申请通过引用整体地并入本文中。
技术介绍
卷积神经网络(CNN)是广泛地应用在机器学习上的一种类型的神经网络。CNN被用在包括图像处理、语音识别、玩游戏、机器人等的各种应用中。用于CNN运算的高效架构并将CNN运算映射到架构中的设计可能是非常重要的。
技术实现思路
本公开的实施例提供一种用于执行并行计算的系统。该系统可包括:任务管理器;和多个核心,该多个核心与任务管理器耦合并被配置成基于来自任务管理器的指令分别地执行并行计算任务集,其中多个核心中的每一个还包括:处理单元,该处理单元被配置成生成与并行计算任务集当中的第一计算任务相对应的第一输出特征图;接口,该接口被配置成从任务管理器接收一个或多个指令以从多个核心中的其他核心收集与并行计算任务集相对应的外部输出特征图;约简单元,该约简单元被配置成基于第一输出特征图和接收到的外部输出特征图生成约简特征图。本公开的实施例还提供一种用于在与任务管理器耦合的多个核心中的一核心处执行并行计算任务集的方法。该方法可包括:由核心的处理单元生成与并行计算任务集当中的第一计算任务相对应的第一输出特征图;由核心的接口从任务管理器接收一个或多个指令以从多个核心中的其他核心收集与并行计算任务集相对应的外部输出特征图;由核心的约简单元基于第一输出特征图和接收到的外部输出特征图生成约简特征 ...
【技术保护点】
1.一种用于执行并行计算的系统,包括:/n任务管理器;和/n多个核心,所述多个核心与所述任务管理器耦合并被配置成基于来自所述任务管理器的指令分别地执行并行计算任务集,其中所述多个核心中的每一个还包括:/n处理单元,所述处理单元被配置成生成与所述并行计算任务集当中的第一计算任务相对应的第一输出特征图;/n接口,所述接口被配置成从所述任务管理器接收一个或多个指令以从所述多个核心中的其他核心收集与所述并行计算任务集相对应的外部输出特征图;/n约简单元,所述约简单元被配置成基于所述第一输出特征图和接收到的外部输出特征图生成约简特征图。/n
【技术特征摘要】
【国外来华专利技术】20180829 US 62/724,539;20190730 US 16/526,5971.一种用于执行并行计算的系统,包括:
任务管理器;和
多个核心,所述多个核心与所述任务管理器耦合并被配置成基于来自所述任务管理器的指令分别地执行并行计算任务集,其中所述多个核心中的每一个还包括:
处理单元,所述处理单元被配置成生成与所述并行计算任务集当中的第一计算任务相对应的第一输出特征图;
接口,所述接口被配置成从所述任务管理器接收一个或多个指令以从所述多个核心中的其他核心收集与所述并行计算任务集相对应的外部输出特征图;
约简单元,所述约简单元被配置成基于所述第一输出特征图和接收到的外部输出特征图生成约简特征图。
2.根据权利要求1所述的系统,其中所述任务管理器被配置成指示所述核心同时地执行与第二计算任务相对应的第二输出特征图的生成和所述约简特征图的生成。
3.根据权利要求2所述的系统,其中当所述第一输出特征图被生成时,所述处理单元还被配置成向所述任务管理器发出屏障指令,并且停止所述第二输出特征图的生成。
4.根据权利要求3所述的系统,其中所述任务管理器还被配置成从所述多个核心中的每一个接收所述屏障指令。
5.根据权利要求4所述的系统,其中响应于确定从所述多个核心中的每一个接收到所述屏障指令,所述任务管理器被配置成向所述核心发送恢复指令以恢复所述第二输出特征图的产生。
6.根据权利要求2所述的系统,其中所述任务管理器还被配置成在所述多个核心当中选择约简核心以接收所述外部输出特征图并且与所述第二输出特征图的生成并行地生成所述约简特征图。
7.根据权利要求6所述的系统,其中所述第一输出特征图是通过对矩阵集中的第一矩阵执行卷积处理而生成的。
8.根据权利要求7所述的系统,其中所述核心的数目是N,所述矩阵集的数目是K,并且对于第k次迭代,所述约简核心是所述多个核心当中的第(k%N)个核心,其中k是小于或等于K的正整数。
9.根据权利要求1所述的系统,其中,在所述多个核心当中,第一核心生成第一约简输出特征图,第二核心生成第二约简输出特征图,第三核心生成第三约简输出特征图,并且第四核心生成第四约简输出特征图,并且所述第一约简输出特征图、所述第二约简输出特征图、所述第三约简输出特征图和所述第四约简输出特征图被以交错方式组合成约简输出特征图集。
10.根据权利要求1所述的系统,其中所述存储单元包括用于生成所述第二输出特征图的第一端口和用于生成所述约简输出特征图的第二端口。
11.一种用于在与任务管理器耦合的多个核心中的一核心处执行并行计算任务集的方法,包括:
由所述核...
【专利技术属性】
技术研发人员:韩亮,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛;KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。