System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 将有效位通道作为矢量断言暴露于CPU制造技术_技高网

将有效位通道作为矢量断言暴露于CPU制造技术

技术编号:40545888 阅读:5 留言:0更新日期:2024-03-05 19:03
本申请题为“将有效位通道作为矢量断言暴露于CPU”。数字数据处理器(100)中采用的流引擎(125、2800)指定固定的只读数据流。一旦被提取,数据流中的数据元素就以固定的顺序设置在流头寄存器(2818、2828)中的通道(2100、2200)中。一些通道(2100、2200)例如在剩余数据元素的数量小于流头寄存器(2818、2828)中的通道(2100、2200)的数量时可能是无效的。流引擎(125、2800)自动产生存储在流有效寄存器(2819、2829)中的指示通道保持有效数据的有效数据字。流有效寄存器(2819、2829)中的数据可以被自动存储在断言寄存器(P0、P1)中或以其他方式使其可用。该数据可以用于控制矢量SIMD操作或者可以与其他断言寄存器数据结合。

【技术实现步骤摘要】

本专利技术的是数字数据处理,并且更具体是用于操作数提取的流引擎的控制。


技术介绍

1、现代的数字信号处理器(dsp)面对多重挑战。工作量不断增加需要增加带宽。芯片上系统(soc)在尺寸和复杂性上不断增长。存储器系统延迟严重影响某些类型的算法。随着晶体管变小,存储器和寄存器变得更不可靠。随着软件堆栈变大,可能的交互和误差的数量变得更大。

2、对于操作实时数据的数字信号处理器,存储器带宽和调度是一个问题。操作实时数据的数字信号处理器通常接收输入数据流、对数据流执行滤波功能(诸如编码或解码)并且输出经转换的数据流。该系统被称为实时的是因为如果经转换的数据流在被调度时对于输出不可用则应用失败。典型的视频编码需要可预测的但非时序的输入数据模式。通常相应的存储器访问难以在可用的地址生成和存储器访问资源内实现。典型的应用需要存储器访问加载数据寄存器文件(rf)中的数据寄存器,然后供应给执行数据处理的功能单元。


技术实现思路

1、本专利技术是具有流引擎的数字数据处理器,该流引擎从存储器调用预定数量的数据元素的指令指定序列的流以便由数据处理功能单元按顺序使用。每个数据元素具有预定尺寸和数据类型。数据元素被打包在矢量流头寄存器中的限定数据宽度的通道中。

2、数据被多个矢量功能单元中的一个采用。指令的操作数字段可以被编码以作为功能单元的操作数对流头寄存器进行读取。操作数字段的不同编码读取流头数据并且将该流提前到打包在流头寄存器中的下一组数据元素。

3、有时不是所有的通道都包括有效数据。在流的末端处或者在内部环路的末端处,可能存在比最后一个矢量中的通道数量更少的剩余数据元素。超出数据元素数量的通道不能包括有效数据。如果发生这种情况,则流引擎将全部0存储在过量通道中。在本专利技术中,流引擎还产生标量,该标量针对矢量流头寄存器中的每个最小数据尺寸具有一个位。在所描述的实施例中,功能单元以8位的最小流引擎数据尺寸对512位数据进行操作。这意味着有效数据字是64位。

4、可以以两种替代方式访问流有效数据。在第一替代方案中,每次流头寄存器被读取时,流有效数据被自动写入到预定数据寄存器。在第二替代方案中,至少一个功能单元可以经由指令的操作数字段的特殊编码来读取该有效数据。

5、在优选的实施例中,流有效数据被存储在标量数据寄存器文件中,该标量数据寄存器文件可以被断言功能单元访问。矢量simd比较指令基于比较的结果对标量断言寄存器进行填写(populate)。矢量simd条件指令可以基于指定的标量断言寄存器的状态执行替代数据处理操作。断言功能单元可以在允许复合数据处理操作的一个或两个断言数据寄存器上执行各种指令。

本文档来自技高网...

【技术保护点】

1.一种设备,其包括:

2.根据权利要求1所述的设备,其中:

3.根据权利要求2所述的设备,其中所述存储器控制器被配置为使与所述零元素相关联的相应有效位指示所述零元素是无效的。

4.根据权利要求2所述的设备,其中所述处理器的所述矢量长度基于与所述功能单元相关联的若干通道。

5.根据权利要求4所述的设备,其中所述存储器控制器被配置为基于在将相应元素分配给与所述功能单元相关联的所述若干通道中的每个通道之前达到所述第一数据矢量的末端而确定所述处理器的所述矢量长度是否大于所述第一数据矢量的所述矢量长度。

6.根据权利要求2所述的设备,其中所述存储器控制器被配置为接收流模板,所述流模板指定是否基于所述处理器的所述矢量长度大于所述第一数据矢量的所述矢量长度而利用所述组重复单元复制所述第一数据矢量的元素或增补零元素以产生所述第二数据矢量。

7.根据权利要求1所述的设备,其中:

8.根据权利要求1所述的设备,其中所述处理器进一步包括断言单元,所述断言单元耦合到所述断言寄存器文件并被配置为基于存储在所述断言寄存器文件中的所述有效位来确定所述第二数据矢量中的有效元素的数量。

9.根据权利要求1所述的设备,其中所述存储器是缓存器架构的二级(L2)缓存器。

10.根据权利要求9所述的设备,其中所述存储器控制器被配置为从所述二级缓存器检索所述第一数据矢量并且经由不包含所述缓存器架构的一级(L1)缓存器的数据路径将所述第二数据矢量提供给所述处理器。

11.一种设备,其包括:

12.根据权利要求11所述的设备,其中:

13.根据权利要求11所述的设备,其中所述处理器进一步包括断言单元,所述断言单元耦合到所述断言寄存器文件并被配置为基于存储在所述断言寄存器文件中的所述有效性指示符来确定所述第二数据矢量中的有效元素的数量。

14.根据权利要求11所述的设备,其中所述存储器是缓存器架构的二级(L2)缓存器。

15.根据权利要求14所述的设备,其中所述存储器控制器被配置为从所述二级缓存器检索所述第一数据矢量并且经由不包含所述缓存器架构的一级(L1)缓存器的数据路径将所述第二数据矢量提供给所述处理器。

16.一种方法,其包括:

17.根据权利要求16所述的方法,其中:

18.根据权利要求16所述的方法,其进一步包括基于存储在所述断言寄存器文件中的所述有效性指示符来确定所述第二数据矢量中的有效元素的数量。

19.根据权利要求16所述的方法,其中所述存储器是缓存器架构的二级(L2)缓存器。

20.根据权利要求16所述的方法,其中:

...

【技术特征摘要】

1.一种设备,其包括:

2.根据权利要求1所述的设备,其中:

3.根据权利要求2所述的设备,其中所述存储器控制器被配置为使与所述零元素相关联的相应有效位指示所述零元素是无效的。

4.根据权利要求2所述的设备,其中所述处理器的所述矢量长度基于与所述功能单元相关联的若干通道。

5.根据权利要求4所述的设备,其中所述存储器控制器被配置为基于在将相应元素分配给与所述功能单元相关联的所述若干通道中的每个通道之前达到所述第一数据矢量的末端而确定所述处理器的所述矢量长度是否大于所述第一数据矢量的所述矢量长度。

6.根据权利要求2所述的设备,其中所述存储器控制器被配置为接收流模板,所述流模板指定是否基于所述处理器的所述矢量长度大于所述第一数据矢量的所述矢量长度而利用所述组重复单元复制所述第一数据矢量的元素或增补零元素以产生所述第二数据矢量。

7.根据权利要求1所述的设备,其中:

8.根据权利要求1所述的设备,其中所述处理器进一步包括断言单元,所述断言单元耦合到所述断言寄存器文件并被配置为基于存储在所述断言寄存器文件中的所述有效位来确定所述第二数据矢量中的有效元素的数量。

9.根据权利要求1所述的设备,其中所述存储器是缓存器架构的二级(l2)缓存器。

10.根据权利要求...

【专利技术属性】
技术研发人员:J·茨比亚克S·H·特兰
申请(专利权)人:德克萨斯仪器股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1