具有单独可选元素及成组复制的流式传输引擎制造技术

技术编号：38375758 阅读：16 留言：0更新日期：2023-08-05 17:36

本申请涉及具有单独可选元素及成组复制的流式传输引擎。一种在数字数据处理器中使用的流式传输引擎(2800)指定由多个嵌套循环限定的固定只读数据流。地址产生器(2811、2821)产生数据元素的地址。流磁头寄存器(2818、2828)存储接着将供应到功能单元的数据元素以用作操作数。元素复制单元以指令指定次数任选地复制数据元素。向量掩模单元将从所述元素复制单元接收到的数据元素限于指令指定的向量长度内的最低有效位。如果所述向量长度小于流磁头寄存器大小，那么所述向量掩模单元将所有0存储于所述流磁头寄存器的过量通路中(停用成组复制)或将所述最低有效位的复制副本存储于所述流磁头寄存器(2818、2828)的过量通路中。中。中。

全部详细技术资料下载

【技术实现步骤摘要】
具有单独可选元素及成组复制的流式传输引擎
[0001]分案申请的相关信息
[0002]本案是分案申请。该分案的母案是申请日为2017年12月29日、申请号为201780070308.5、专利技术名称为“具有单独可选元素及成组复制的流式传输引擎”的专利技术专利申请案。

[0003]本专利技术大体上涉及数字数据处理，且更确切地说，涉及对用于提取操作数的流式传输引擎的控制。

技术介绍

[0004]现代数字信号处理器(DSP)面临多种挑战。工作负载持续增加，需要增加带宽。片上系统(SOC)的大小及复杂性持续增长。存储器系统时延严重影响某些类别的算法。随着晶体管变小，存储器及寄存器变得较不可靠。随着软体堆叠变大，潜在的相互作用及误差的数目变大。
[0005]存储器带宽及调度为对实时数据进行操作的数字信号处理器的问题。对实时数据进行操作的数字信号处理器通常接收输入数据流、对数据流执行滤波函数(例如编码或解码)，及输出经变换数据流。由于应用程序在经变换数据流在调度时不可用于输出的情况下失效，系统被称作实时。典型视频编码需要可预测但非依序的输入数据模式。通常，对应存储器存取在可用的地址产生及存储器存取资源内难以实现。典型应用要求存储器存取数据寄存器文件中的负载数据寄存器且接着供应到执行数据处理的功能单元。

技术实现思路

[0006]本专利技术为一种数字信号处理器中采用的流式传输引擎。通过将对应参数存储于控制寄存器中来指定固定数据流序列。数据流包含多个嵌套循环。一旦开始，数据流为只读的且不能写入...

【技术保护点】

【技术特征摘要】
1.一种方法，其包括：从计算系统的存储器接收存储在所述存储器中的多个数据元素；基于元素复制因子将复制应用于所述多个数据元素中的每个数据元素，以产生一组复制的数据元素；及将所述一组复制的数据元素作为数据流的至少一部分提供给所述计算系统的处理核心的功能单元。2.根据权利要求1所述的方法，其中通过访问经配置以存储流定义模板的寄存器来确定所述元素复制因子，所述流定义模板包括含有所述元素重复因子的字段。3.根据权利要求2所述的方法，其中所述元素复制因子是2的整数幂。4.根据权利要求3所述的方法，其中所述元素重复因子可选择为因子2、4、8、16、32和64中的一个。5.根据权利要求1所述的方法，其中所述存储器是所述计算系统的分层存储器系统的第一存储器，且其中所述第一存储器在层级上不是最靠近所述处理核心的。6.根据权利要求5所述的方法，其中所述分层存储器系统包括作为一级L1高速缓存的第二存储器，且其中所述第一存储器在层级上高于所述L1高速缓存。7.根据权利要求6所述的方法，其中，所述第一存储器是二级L2高速缓存。8.一种数据处理设备，包括：存储器；处理核心，其具有经配置以基于与提供给所述处理核心的指令相对应的操作数来执行数据处理操作的功能单元；及流数据处理逻辑，其经配置以接收存储在所述存储器中的第一组数据元素，并将基于所述第一组数据元素的第二组数据元素作为数据流提供给所述处理核心，其中所述流数据处理逻辑包括：地址产生器，其经配置以生成与所述存储器中的位置相对应的地址；缓冲器，其经配置以存储从所述存储器中的与生成的所述地址相对应的所述位置接收的所述第一组数据元素；向量长度掩模单元，其经配置以根据向量长度将所述第一组数据元素限制为多个最低有效位以产生所述第二组数据元素；第一寄存器，其经配置以存储从所述向量长度掩模单元接收的所述第二组数据元素；及输出，其将存储在所述第一寄存器中的所述第二组数据元素作为所述数据流的至少一部分提供给所述处理核心。9.根据权利要求8所述的数据处理设备，其进一步包括第二寄存器，所述第二寄存器可被所述流数据处理逻辑访问且经配置以存储流定义模板，所述流定义模板包括指定所述第二组数据元素的元素大小的元素大小字段和指定所述向量长度的向量长度字段。10.根据权利要求9所述的数据处理设备，其中所述第一寄存器基于所述元素大小可划分为多个通路，且所述第一寄存器经配置以每通路存储一个数据元素。11.根据权利要求10所述的数据处理设备，其中：与提供给所述处理核心的所述指令相对应的所述操作数具有与所述功能单元的功能
单元数据大小相对应的大小；所述第一寄存器具有与所述功能单元数据大小相对应的大小；和所述向量长度掩模单元经配置以当所述向量长度小于所述功能单元数据大小时，将零值存储在所述第一寄存器的多余通路中。12.根据权利要求10所述的数据处理设备，其中：与提供给所述处理核心的所述指令相对应的所述操作数具有与所述功能单元的功能单元数据大小相对应的大小；所述第一寄存器具有与所述功能单元数据大小相对应的大小；所述向量长度掩模单元经配置以当所述向量长度小于所述功能单元数据大小且所述向量长度掩模单元的成组复制状态被禁用时，将零值存储在所述第一寄存器的多余通路中；及所述向量长度掩模单元经配置以当所述向量长度小于所述功能单元数据大小且所述向量长度掩模单元的成组复制状态被启用时，将所述第一组数据元素的最低有效位的复制拷贝存储在所述第一寄存器的所述多余通路中。13.根据权利要求12所述的数据处理设备，其中所述流定义模板进一步包括成组复制字段以指定所述向量长度掩模单元的所述成组复制状态是被启用的还是被禁用的。14.根据权利要求8所述的数据处理设备，其包括数据总线，所述数据总线耦合到所述流数据处理逻辑的所述输出且耦合到所述处理核心，其中所述数据流经由所述数据总线提供到所述处理核心，且所述数据总线可划分为多个大小相等的通路。15.根据权利要求8所述的数据处理设备，其包括分层存储器系统，所述分层存储器系统包括一级L1高速缓存和二级L2高速缓存，其中所述存储器是所述L2高速缓存。16.根据权利要求15所述的数据处理设备，其中所述流数据处理逻辑经配置以提供经由数据路径的所述数据流的所述第二组数据元素从所述L2高速缓存到所述处理核心的传输，所述数据路径不包括所述L1高速缓存。17.一种电路装置，其包括：处理器，其包括向量数据路径；控制器，其耦合到所述处理器的所述向量数据路径；及存储器，其耦合到所述控制器且经配置以存储一组数据元素，其中所述控制器包括：第一寄存器，其经耦合以从所述存储器接收所述一组数据元素；一组多路复用器，其中的每一者包括：耦合到所述第一寄存器的相应的一组数据输入；相应的控制输入；以及相应的输出；多路复用器控制器，其包括经耦合以接收元素复制因子的输入和耦合到所述一组多路复用器的所述控制输入的一组输出，其中所述多路复用器控制器经配置以基于所述元素复制因子确定是否致使所述一组多路复用器复制所述一组数据元素中的元素或是提供未复制的所述一组数据元素以产生向量；及第二寄存器，其耦合到所述一组多路复用器以接收所述向量且耦合到所述向量数据路径以将所述向量提...

【专利技术属性】
技术研发人员：J，
申请(专利权)人：德州仪器公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人