用于在矢量处理器中进行去同步化执行的方法和设备技术

技术编号:39496546 阅读:11 留言:0更新日期:2023-11-24 11:24
在一个实施方式中,矢量处理器单元具有矢量长度

【技术实现步骤摘要】
【国外来华专利技术】用于在矢量处理器中进行去同步化执行的方法和设备
[0001]相关申请
[0002]本专利申请要求由相同专利技术人于
2021
年4月
27
日提交的名称为“用于可编程机器学习和推理的方法和设备
(Method and Apparatus for Programmable Machine Learning and Inference)”的待审美国专利申请序列号
63/180,634
的优先权,该专利申请以引用方式并入本文

本专利申请要求由相同专利技术人于
2021
年4月
27
日提交的名称为“用于矢量处理器中的聚集
/
散射操作的方法和设备
(Method and Apparatus for Gather/Scatter Operations in a Vector Processor)”的待审美国专利申请序列号
63/180,562
的优先权,该专利申请以引用方式并入本文

本专利申请要求由相同专利技术人于
2022
年2月
11
日提交的名称为“用于矢量处理器中的聚集
/
散射操作的方法和设备
(Method and Apparatus for Gather/Scatter Operations in a Vector Processor)”的待审美国专利申请序列号
17/669,995
的优先权,该专利申请以引用方式并入本文

本专利申请要求由相同专利技术人于
2021
年4月
27
日提交的名称为“缺少有效地址生成器的处理器中的多堆栈系统
(System of Multiple Stacks in a Processor Devoid of an Effective Address Generator)”的待审美国专利申请序列号
63/180,601
的优先权,该专利申请以引用方式并入本文

本专利申请要求由相同专利技术人于
2021
年9月7日提交的名称为“缺少有效地址生成器的处理器中的多堆栈系统
(System of Multiple Stacks in a Processor Devoid of an Effective Address Generator)”的待审美国专利申请序列号
17/468,574
的优先权,该专利申请以引用方式并入本文

本专利申请要求由相同专利技术人于
2022
年3月
22
日提交的名称为“用于在矢量处理器中进行去同步化执行的方法和设备
(Method and Apparatus for Desynchronizing Execution in a Vector Processor)”的待审美国专利申请序列号
17/701,582
的优先权,该专利申请以引用方式并入本文



[0003]本专利技术方法和设备涉及矢量处理器

更具体地,本专利技术方法和设备涉及用于在矢量处理器中进行去同步化执行的方法和设备


技术介绍

[0004]为了提高吞吐量,矢量处理单元
(VPU)
访问存储器中的矢量并以连续方式以高速率执行矢量运算

由于矢量处理器是为超高速而构建的,因此,出于任何原因
(
诸如,例如,为了处理串行或标量运算或内务指令
)
中断矢量流水线均以降低性能的方式以高成本出现

[0005]这提出了一个技术问题,该技术问题需要使用技术手段的技术解决方案


技术实现思路

[0006]矢量处理器单元设置有用于矢量长度

矢量常数

矢量地址和矢量步幅的预加载寄存器,每个预加载寄存器具有输入和输出

所有预加载寄存器输入被耦合以接收新的矢
量参数

预加载寄存器中的每一者的输出被耦合到相应的多路复用器的第一输入,并且所有相应的多路复用器的第二输入被耦合以接收新的矢量参数

附图说明
[0007]本专利技术所公开的技术在附图的各图中以示例而非限制的方式示出

相同编号的项目不必相同

[0008]附图示出了本专利技术所公开的技术的各种非排他性示例

[0009]图1在
100
处整体示出了根据示例的解码单元的框图概述

[0010]图2在
200
处整体示出了用于对存储器访问控制进行寻址的矢量寄存器的框图概述

[0011]图3在
300
处整体示出了包括存储器访问控制预加载寄存器的矢量处理器单元的一部分的框图概述

[0012]图4在
400
处整体示出了示出指令的去同步执行和指令的同步执行的流程图

[0013]图5在
500
处整体示出了示出指令的异步

去同步化和同步执行的流程图

[0014]图6在
600
处整体示出了示出矢量指令的执行的流程图

[0015]图7在
700
处整体示出了示出除了非去同步化指令之外的去同步化矢量指令的执行的流程图

具体实施方式
[0016]本专利技术公开了一种用于在矢量处理器中进行去同步化执行的方法和设备

[0017]定义和注解
[0018]各种术语用于描述本文所公开的技术

申请人是词典编纂者并且如下定义这些术语

术语在它们的最初使用时引用如下

[0019]“并发”与“并行”相同,并且被定义为至少部分地一次进行两件事情

这并不意指关于它们彼此关系如何的任何事情
——
它们可以是“同步化”或“去同步化”的

[0020]“同步化”执行是控制指令操作的每个方面的流水线控制的动作

[0021]“去同步化”执行是独立于流水线控制执行其操作的实质组成部分的指令的动作

因此,流水线控制可以在完成去同步化执行之前控制经历去同步化执行的指令之后的一个或多个指令的执行和完成

[0022]注意,如果对在处理器上执行的程序的结果作出不可接受的改变,则认为在去同步化指令之后的指令执行修改关键处理器状态

不可接受的改变是给定程序的所有处理的最终结果,其不同于所有指令以串行方式执行的情况,即,每个指令在下一指令开始本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.
一种矢量处理器单元,包括:多个存储器访问控制预加载寄存器,每个存储器访问控制预加载寄存器具有输入和输出,所有所述存储器访问控制预加载寄存器输入被耦合以接收新的矢量参数;多个多路复用器,每个多路复用器具有第一输入

第二输入

切换输入和输出,所述存储器访问控制预加载寄存器输出中的每一者均耦合到相应的多路复用器的所述第一输入,所述相应的多路复用器的所述第二输入中的每一者被耦合以接收所述新的矢量参数;多路复用器控制,所述多路复用器中的每一者响应于所述多路复用器控制而切换输入;多个存储器访问控制寄存器,每个存储器访问控制寄存器具有输入和输出,所述存储器访问控制寄存器输入中的每一者均耦合到所述相应的多路复用器输出;和存储器访问控制,所述存储器访问控制具有多个输入,所述多个存储器访问控制寄存器输出耦合到所述相应的存储器访问控制输入
。2.
根据权利要求1所述的矢量处理单元,其中所述多个存储器访问控制预加载寄存器选自由以下组成的组:矢量长度预加载寄存器

矢量常数预加载寄存器

矢量地址预加载寄存器和矢量步幅预加载寄存器;并且其中所述多个存储器访问控制寄存器选自由以下组成的组:矢量长度寄存器

矢量常数寄存器

矢量地址寄存器和矢量步幅寄存器
。3.
根据权利要求1所述的矢量处理单元,其中:所述多个存储器访问控制预加载寄存器包括矢量长度预加载寄存器

矢量常数预加载寄存器

矢量地址预加载寄存器和矢量步幅预加载寄存器;并且其中所述多个存储器访问控制寄存器包括矢量长度寄存器

矢量常数寄存器

矢量地址寄存器和矢量步幅寄存器
。4.
一种方法,包括:
(a)
获取下一指令;
(b)
确定是否存在与所述下一指令的去同步化争用;
(c)
当存在与所述下一指令的所述去同步化争用时,则等待任何去同步化操作完成;
(h)
确定所述下一指令是否能够去同步地执行;
(i)
当所述下一指令能够去同步地执行时,则启动去同步执行,然后返回到
(a)
;并且
(j)
当所述下一指令不能够去同步地执行时,则启动同步执行,然后返回到
(a)。5.
根据权利要求4所述的方法,包括以字母顺序插入:
(d)
确定是否存在与所述下一指令的异步争用;
(e)
当存在与所述下一指令的所述异步争用时,则等待任何异步操作完成;
(f)
确定所述下一指令是否能够异步地执行;
(g)
当所述下一指令能够异步地执行时,则启动异步执行,然后返回到
(a)。6.
一种方法,包括:
(a)
确定第一矢量指令当前是否正在执行;
(b)
当所述第一矢量指令当前未正在执行...

【专利技术属性】
技术研发人员:C
申请(专利权)人:微芯片技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1