【技术实现步骤摘要】
用于向量广播的系统、方法和装置
技术介绍
机器学习和其它领域中的许多应用涉及许多常量的使用。例如,在ML中,卷积和其它算法的权重可以被视为出于性能原因将在向量操作中使用的常量。附图说明将参考附图来描述依照本公开的各种实施例,在附图中:图1图示了用于处理单个广播和计算指令的处理器的所选部分的实施例;图2图示了用于处理单个广播和计算指令的处理器的所选部分的实施例;图3图示了处理器为了处理单个广播和计算指令而执行的方法的实施例;图4图示了处理器为了处理单个广播和计算指令而执行的方法的实施例;图5图示了用于处理诸如广播和计算指令之类的指令的硬件的实施例;图6A是图示根据本专利技术的实施例的通用向量友好指令格式及其A类指令模板的框图;图6B是图示根据本专利技术的实施例的通用向量友好指令格式及其B类指令模板的框图;图7A是图示根据本专利技术的实施例的示例性特定向量友好指令格式的框图;图7B是图示根据本专利技术的一个实施例的组成全操作码字段674的特定向量友好指令格式700的字段的框图;图7C是图示根据本专利技术的一个实施例的组成寄存器索引字段644的特定向量友好指令格式700的字段 ...
【技术保护点】
1.一种处理器,包括:解码部件,用于对指令进行解码,所述指令具有用于操作码、至少两个打包数据源操作数标识符、打包数据目的地操作数标识符和立即数的字段;以及执行部件,用于执行经解码的指令以:广播来自被标识的第一打包数据源操作数的打包数据元素,其中基于立即数的值来选择要广播的打包数据元素位置,根据操作码对所广播的来自被标识的第一打包数据源操作数的打包数据元素和被标识的第二打包数据源操作数的打包数据元素执行操作,以及将操作的结果存储在被标识的打包数据目的地操作数中与被标识的第二打包数据源操作数的打包数据元素位置对应的位置中。
【技术特征摘要】
2017.12.29 US 15/8582781.一种处理器,包括:解码部件,用于对指令进行解码,所述指令具有用于操作码、至少两个打包数据源操作数标识符、打包数据目的地操作数标识符和立即数的字段;以及执行部件,用于执行经解码的指令以:广播来自被标识的第一打包数据源操作数的打包数据元素,其中基于立即数的值来选择要广播的打包数据元素位置,根据操作码对所广播的来自被标识的第一打包数据源操作数的打包数据元素和被标识的第二打包数据源操作数的打包数据元素执行操作,以及将操作的结果存储在被标识的打包数据目的地操作数中与被标识的第二打包数据源操作数的打包数据元素位置对应的位置中。2.根据权利要求1所述的处理器,其中操作是计算。3.根据权利要求2所述的处理器,其中立即数是8位值。4.根据权利要求1-3中任一项所述的处理器,其中指数分量被存储在被标识的打包数据目的地操作数的最低有效打包数据元素位置中。5.根据权利要求1-3中任一项所述的处理器,其中被标识的打包数据源操作数中的一个和目的地操作数相同。6.根据权利要求1-4中任一项所述的处理器,其中被标识的第二打包数据源操作数是存储器位置。7.一种方法,包括:对指令进行解码,所述指令具有用于操作码、至少两个打包数据源操作数标识符、打包数据目的地操作数标识符和立即数的字段;以及执行经解码的指令以:广播来自被标识的第一打包数据源操作数的打包数据元素,其中基于立即数的值来选择要广播的打包数据元素位置,根据操作码对所广播的来自被标识的第一打包数据源操作数的打包数据元素和被标识的第二打包数据源操作数的打包数据元素执行操作,以及将操作的结果存储在被标识的打包数据目的地操作数中与被标识的第二打包数据源操作数的打包...
【专利技术属性】
技术研发人员:M乌尔班斯基,E奥尔德艾哈迈德瓦尔,
申请(专利权)人:英特尔公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。