【技术实现步骤摘要】
【国外来华专利技术】利用特定数检测的多流水线架构相关申请的交叉引用本公开要求2017年12月22日提交的美国临时申请No.62/610,077和2018年12月10日提交的美国专利申请No.16/215,553的优先权权益,上述申请的全部内容通过引用合并于此。
技术介绍
开发神经网络处理器以加速基于神经网络的深度学习应用已在许多业务领域获得了重大关注,包括成熟的芯片制造商、初创公司以及大型互联网公司。单指令多数据(SIMD)架构能应用于芯片以加速深度学习应用的操作。随着基于神经网络的深度学习应用(例如图像识别、语言/语音识别和机器翻译)呈指数增长,希望保持并提高系统的计算强度。
技术实现思路
本公开涉及用于具有特定数检测能力以简化操作并提高计算强度的多管道流水线(pipeline)的方法和系统。与公开的一些实施例一致,提供了一种计算方法,用于在利用多流水线架构的计算设备中、并带有特定数检测。所述计算设备包括用于存储指令的存储器和用于执行所述指令以执行所述方法的处理单元。所述方法包括针对来自所述存储器的数据并发地运行第一流水线和第二流水线。所述第一流水线被配置为从所述存储器接收第一操作数,所述第二流水线被配置为从所述存储器接收第二操作数。所述第一流水线比所述第二流水线提前至少一个周期操作。所述方法还包括针对所述第一操作数在所述存储器中生成存储器地址,并在所述第一流水线上从生成的存储器地址读取所述第一操作数。所述方法还包括:通过检测器检测所述第一操作数是否为特定数,其中,特定数是产生预定或可预测操作结果的数值。 ...
【技术保护点】
1.一种计算方法,用于在具有利用多流水线架构的核的计算设备中、并带有特定数检测,所述方法包括:/n针对来自存储器的数据,并行地运行第一流水线和第二流水线,其中,所述第一流水线被配置为从所述存储器接收第一操作数,所述第二流水线被配置为从所述存储器接收第二操作数,并且其中,所述第一流水线比所述第二流水线提前至少一个周期操作;/n针对所述第一操作数在所述存储器中生成存储器地址;/n在所述第一流水线上从生成的存储器地址读取所述第一操作数;和/n检测所述第一操作数是否为特定数,其中,特定数是产生可预测操作结果的数值;和/n基于所述第一操作数是否为特定数的检测,将结果存储在所述存储器中。/n
【技术特征摘要】
【国外来华专利技术】20171222 US 62/610,077;20181210 US 16/215,5531.一种计算方法,用于在具有利用多流水线架构的核的计算设备中、并带有特定数检测,所述方法包括:
针对来自存储器的数据,并行地运行第一流水线和第二流水线,其中,所述第一流水线被配置为从所述存储器接收第一操作数,所述第二流水线被配置为从所述存储器接收第二操作数,并且其中,所述第一流水线比所述第二流水线提前至少一个周期操作;
针对所述第一操作数在所述存储器中生成存储器地址;
在所述第一流水线上从生成的存储器地址读取所述第一操作数;和
检测所述第一操作数是否为特定数,其中,特定数是产生可预测操作结果的数值;和
基于所述第一操作数是否为特定数的检测,将结果存储在所述存储器中。
2.根据权利要求1所述的方法,其中,一旦确定所述第一操作数是特定数:
检索与检测到的特定数相关联的结果;并且
将检索到的结果存储在针对所述第一流水线和所述第二流水线的所述存储器中。
3.根据权利要求2所述的方法,其中,所述多流水线架构被配置为执行乘法运算,并且其中,所述第一操作数被检测为是包括数值0的特定数,所述方法还包括:
防止针对所述第二操作数生成存储器地址。
4.根据权利要求2所述的方法,其中,所述多流水线架构被配置为执行乘法运算,并且其中,所述第一操作数被检测为是包括数值1的特定数,所述方法还包括:
针对所述第二操作数生成存储器地址;
在所述第二流水线上从生成的存储器地址读取所述第二操作数;和
将所述结果的值分配为等于所述第二操作数的值。
5.根据权利要求1所述的方法,其中,一旦确定所述第一操作数不是特定数:
针对所述第二操作数在所述存储器中生成存储器地址;
在所述第二流水线上从生成的存储器地址读取所述第二操作数;
对所述第一操作数和所述第二操作数执行操作;并且
将执行的操作的结果存储在针对所述第一流水线和所述第二流水线的所述存储器中。
6.一种计算设备,用于执行特定数检测操作,所述计算设备包括:
核,所述核具有被配置为执行操作的多个处理单元,所述核包括:
存储器,被配置为存储操作数;
第一流水线,被配置为基于针对第一操作数生成的存储器地址从所述存储器读取所述第一操作数;
第二流水线,被配置为从所述存储器接收第二操作数,其中,所述第一流水线比所述第二流水线提前至少一个周期操作;
检测器,被配置为检测所述第一操作数是否为特定数,其中,所述特定数是产生可预测操作结果的数值,并且其中,所述核还被配置为基于所述第一操作数是否为特定数的检测将结果存储在所述存储器中。
7.根据权利要求6所述的计算设备,其中,如果所述第一操作数是特定数,则:
所述核还被配置为检索与检测到的特定数相关联的可预测操作结果;并且
所述核还被配置为将检索到的结果存储在针对所述第一流水线和所述第二流水线的所述存储器中。
8.根据权利要求7所述的计算设备,其中,所述计算是乘法运算,并且其中,所述第一操作数被检测为是包括数值0的特定数:
所述核还被配置为停止针对所述第二操作数生成存储器地址。
9.根据权利要求7所述的计算设备,其中,所述计算是乘法运算,并且其中,所述第一操作数被检测为是包括数值1的特定数:
所述核还被配置为针对所述第二操作数生成存储器地址;
所述第二流水线被配置为从...
【专利技术属性】
技术研发人员:韩亮,蒋晓维,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛;KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。