采用抽头延迟线用于滤波器向量处理操作的向量处理引擎(VPE)以及相关的向量处理系统和方法技术方案

技术编号:13330962 阅读:54 留言:0更新日期:2016-07-11 22:12
公开了采用抽头延迟线用于以减少了的样本重新取回和功耗提供精确滤波器向量处理操作的向量处理引擎(VPE)。还公开了相关的向量处理器、系统和方法。VPE被配置成提供滤波器向量处理操作。为了使从存储器重新取回输入向量数据样本最小化以降低功耗,在VPE中的向量数据文件与执行单元之间的数据流路径中包括抽头延迟线。该抽头延迟线被配置成接收输入向量数据样本集并将其提供给执行单元以用于执行滤波器向量处理操作。抽头延迟线还被配置成针对滤波器延迟抽头移位输入向量数据样本集并且将经移位的输入向量数据样本集提供给执行单元,从而经移位的输入向量数据样本集在滤波器向量处理操作期间不必被重新取回。

【技术实现步骤摘要】
【国外来华专利技术】相关申请本申请涉及2013年3月13日提交的、题为“VECTORPROCESSINGENGINESHAVINGPROGRAMMABLEDATAPATHCONFIGURATIONSFORPROVIDINGMULTI-MODEVECTORPROCESSING,ANDRELATEDVECTORPROCESSORS,SYSTEMS,ANDMETHODS”(具有用于提供多模式向量处理的可编程数据路径配置的向量处理引擎以及相关的向量处理器、系统和方法)的美国专利申请号13/798,641,123249,该申请通过引用整体上被结合于此。本申请涉及2013年3月13日提交的、题为“VECTORPROCESSINGCARRY-SAVEACCUMULATORSEMPLOYINGREDUNDANTCARRY-SAVEFORMATTOREDUCECARRYPROPAGATION,ANDRELATEDVECTORPROCESSORS,SYSTEMS,ANDMETHODS”(采用冗余进位保留格式以减少进位传播的向量处理进位保留累加器以及相关的向量处理器、系统和方法)的美国专利申请号13/798,618,123248,该申请通过引用整体上被结合于此。本申请还涉及2013年11月15日提交的、题为“VECTORPROCESSINGENGINES(VPES)EMPLOYINGTAPPED-DELAYLINE(S)FORPROVIDINGPRECISIONCORRELATION/COVARIANCEVECTORPROCESSINGOPERATIONSWITHREDUCEDSAMPLERE-FETCHINGANDPOWERCONSUMPTION,ANDRELATEDVECTORPROCESSORSYSTEMSANDMETHODS”(采用抽头延迟线用于以减少了的样本重新取回和功耗提供精确的相关/协方差向量处理操作的向量处理引擎(VPE)以及相关的向量处理系统和方法)的美国专利申请序列号14/082,079,124364,该申请通过引用整体上被结合于此。本申请还涉及2013年11月15日提交的、题为“VECTORPROCESSINGENGINES(VPEs)EMPLOYINGFORMATCONVERSIONCIRCUITRYINDATAFLOWPATHSBETWEENVECTORDATAMEMORYANDEXECUTIONUNITSTOPROVIDEIN-FLIGHTFORMAT-CONVERTINGOFINPUTVECTORDATATOEXECUTIONUNITSFORVECTORPROCESSINGOPERATIONS,ANDRELATEDVECTORPROCESSORSYSTEMSANDMETHODS”(在向量数据存储器与执行单元之间的数据流路径中采用格式转换电路系统以向执行单元提供输入向量数据的进行中格式转换以便进行向量处理操作的向量处理引擎(VPE)以及相关的向量处理系统和方法)的美国专利申请序列号14/082,088,124365,该申请通过引用整体上被结合于此。本申请还涉及2013年11月15日提交的、题为“VECTORPROCESSINGENGINES(VPES)EMPLOYINGREORDERINGCIRCUITRYINDATAFLOWPATHSBETWEENEXECUTIONUNITSANDVECTORDATAMEMORYTOPROVIDEIN-FLIGHTREORDERINGOFOUTPUTVECTORDATASTOREDTOVECTORDATAMEMORY,ANDRELATEDVECTORPROCESSORSYSTEMSANDMETHODS”(在执行单元与向量数据存储器之间的数据流路径中采用重排序电路系统以提供存储到向量数据存储器的输出向量数据的进行中重排序的向量处理引擎(VPE)以及相关的向量处理系统和方法)的美国专利申请序列号14/082,081,124450,该申请通过引用整体上被结合于此。本申请还涉及2013年11月15日提交的、题为“VECTORPROCESSINGENGINES(VPES)EMPLOYINGMERGINGCIRCUITRYINDATAFLOWPATHSBETWEENEXECUTIONUNITSANDVECTORDATAMEMORYTOPROVIDEIN-FLIGHTMERGINGOFOUTPUTVECTORDATASTOREDTOVECTORDATAMEMORY,ANDRELATEDVECTORPROCESSINGINSTRUCTIONS,SYSTEMS,ANDMETHODS(在执行单元与向量数据存储器之间的数据流路径中采用合并电路系统以提供存储到向量数据存储器的输出向量数据的进行中合并的向量处理引擎(VPE)以及相关的向量处理指令、系统和方法)”的美国专利申请序列号14/082,073,124363U1,该申请通过引用整体上被结合于此。本申请还涉及2013年11月15日提交的、题为“VECTORPROCESSINGENGINES(VPES)EMPLOYINGDESPREADINGCIRCUITRYINDATAFLOWPATHSBETWEENEXECUTIONUNITSANDVECTORDATAMEMORYTOPROVIDEIN-FLIGHTDESPREADINGOFSPREAD-SPECTRUMSEQUENCES,ANDRELATEDVECTORPROCESSINGINSTRUCTIONS,SYSTEMS,ANDMETHODS”(在执行单元与向量数据存储器之间的数据流路径中采用解扩电路系统以提供扩频序列的进行中解扩的向量处理引擎(VPE)以及相关的向量处理指令、系统和方法)的美国专利申请序列号14/082,067,124363U2,该申请通过引用整体上被结合于此。II.背景无线计算系统正迅速成为数字信息领域中最流行的技术之一。技术进步已导致更小且更强大的无线通信设备。例如,无线计算设备通常包括小、轻量且易于由用户携带的便携式无线电话、个人数字助理(PDA)和寻呼设备。更具体地,便携式无线电话(诸如蜂窝电话和网际协议(IP)电话)可通过无线网络传达话音和数据分组。此外,许多这样的无线通信设备包括其它类型的设备。例如,无线电话可包括数码相机、数码摄像机、数字记录器、和/或音频文件播放器。无线电话还可包括可用于接入因特网的web接口。此外,无线通信设备可包括用于根据所设计的无线通信技术标准(例如,码分多址(CDMA)、宽带CDMA(WCDMA)以及长期演进(LTE))来处理高速无线通信数据的复杂处理资源。因此,这些无线通本文档来自技高网...

【技术保护点】
一种被配置成提供滤波器向量处理操作的向量处理引擎(VPE),包括:至少一个向量数据文件,所述至少一个向量数据文件被配置成:在至少一个输入数据流路径中提供输入向量数据样本集以用于滤波器向量处理操作;以及从至少一个输出数据流路径接收结果经滤波的输出向量数据样本集;以及存储所述结果经滤波的输出向量数据样本集;在所述至少一个输入数据流路径中的所述至少一个向量数据文件与至少一个执行单元之间的至少一个抽头延迟线,所述至少一个抽头延迟线被配置成针对等于所述滤波器向量处理操作中的滤波器抽头数量的多个处理级当中的每一个处理级在多个流水线寄存器中将所述输入向量数据样本集移位向量数据样本宽度,以针对所述多个处理级当中的每一个处理级提供经移位的输入向量数据样本集;以及在所述至少一个输入数据流路径中提供的至少一个执行单元,包括:至少一个乘法器,其被配置成针对所述多个处理级当中的每一个处理级对经移位的输入向量数据样本集应用滤波器抽头操作,以生成用于所述滤波器向量处理操作的每个滤波器抽头的滤波器抽头输出向量数据样本集;以及至少一个累加器,其被配置成针对所述多个处理级当中的每一个处理级在所述至少一个累加器中累加所述滤波器抽头输出向量数据样本集;所述至少一个执行单元被配置成在所述至少一个输出数据流路径上提供所述结果经滤波的输出向量数据样本集。...

【技术特征摘要】
【国外来华专利技术】2013.11.15 US 14/082,0751.一种被配置成提供滤波器向量处理操作的向量处理引擎(VPE),包括:
至少一个向量数据文件,所述至少一个向量数据文件被配置成:
在至少一个输入数据流路径中提供输入向量数据样本集以用于滤波器向量处理操作;
以及
从至少一个输出数据流路径接收结果经滤波的输出向量数据样本集;以及
存储所述结果经滤波的输出向量数据样本集;
在所述至少一个输入数据流路径中的所述至少一个向量数据文件与至少一个执行单
元之间的至少一个抽头延迟线,所述至少一个抽头延迟线被配置成针对等于所述滤波器向
量处理操作中的滤波器抽头数量的多个处理级当中的每一个处理级在多个流水线寄存器
中将所述输入向量数据样本集移位向量数据样本宽度,以针对所述多个处理级当中的每一
个处理级提供经移位的输入向量数据样本集;以及
在所述至少一个输入数据流路径中提供的至少一个执行单元,包括:
至少一个乘法器,其被配置成针对所述多个处理级当中的每一个处理级对经移位的输
入向量数据样本集应用滤波器抽头操作,以生成用于所述滤波器向量处理操作的每个滤波
器抽头的滤波器抽头输出向量数据样本集;以及
至少一个累加器,其被配置成针对所述多个处理级当中的每一个处理级在所述至少一
个累加器中累加所述滤波器抽头输出向量数据样本集;
所述至少一个执行单元被配置成在所述至少一个输出数据流路径上提供所述结果经
滤波的输出向量数据样本集。
2.如权利要求1所述的VPE,其特征在于,所述至少一个累加器被配置成针对所述多个
处理级当中的每一个处理级累加所述滤波器抽头输出向量数据样本集,而无需从所述至少
一个向量数据文件中重新取回所述输入向量数据样本集。
3.如权利要求1所述的VPE,其特征在于,所述至少一个累加器被配置成在所述输入向
量数据样本集中的输入向量数据样本的数量小于所述滤波器向量处理操作中的滤波器抽
头的数量的情况下,针对所述多个处理级当中的每一个处理级累加所述滤波器抽头输出向
量数据样本集,而无需从所述至少一个向量数据文件中重新取回所述输入向量数据样本
集。
4.如权利要求1所述的VPE,其特征在于,所述至少一个抽头延迟线被进一步配置成在
所述滤波器向量处理操作中的滤波器抽头的数量大于所述输入向量数据样本集中的输入
向量数据样本的数量的情况下,在所述至少一个输入数据流路径上从所述至少一个向量数
据文件接收附加输入向量数据样本集的另一取回。
5.如权利要求1所述的VPE,其特征在于,所述至少一个向量数据文件被配置成:
在所述至少一个输入数据流路径中提供具有所述至少一个向量数据文件的宽度的所
述输入向量数据样本集以用于所述滤波器向量处理操作;以及
从所述至少一个输出数据流路径接收具有所述至少一个向量数据文件的宽度的结果
经滤波的输出向量数据样本集以便被存储。
6.如权利要求1所述的VPE,其特征在于,
所述至少一个抽头延迟线被进一步配置成:
在所述至少一个输入数据流路径中将来自所述至少一个向量数据文件的所述输入向
量数据样本集接收到所述多个流水线寄存器中;以及
针对所述多个处理级当中的每一个处理级,在所述至少一个输入数据流路径中将所述
经移位的输入向量数据样本集中的每一者提供给所述至少一个执行单元;以及
所述至少一个执行单元被进一步配置成针对所述多个处理级当中的每一个处理级在
所述至少一个输入数据流路径中从所述至少一个抽头延迟线接收所述经移位的输入向量
数据样本集。
7.如权利要求6所述的VPE,其特征在于,
所述至少一个抽头延迟线被配置成:
在所述多个处理级当中的第一处理级中在所述至少一个输入数据流路径中将第一输
入向量数据样本提供给所述至少一个执行单元;以及
在所述多个处理级当中的后续处理级中在所述至少一个输入数据流路径中将所述经
移位的输入向量数据样本集提供给所述至少一个执行单元;
所述至少一个乘法器被配置成在所述第一处理级中将第一滤波器系数与所述第一输
入向量数据样本集相乘以生成第一滤波器抽头操作输出向量数据样本集;以及
在后续处理级中将后续滤波器抽头系数乘以所述经移位的输入向量数据样本集以生
成后续滤波器输出向量数据样本集;以及
所述至少一个累加器被配置成在所述至少一个累加器中累加所述第一滤波器抽头输
出向量数据样本集和所述后续滤波器抽头输出向量数据样本集以提供所述结果经滤波的
输出向量数据样本集。
8.如权利要求6所述的VPE,其特征在于,
所述至少一个向量数据文件被进一步配置成:
在所述至少一个输入数据流路径中提供所述输入向量数据样本集作为所述至少一个
抽头延迟线输入上的输入向量数据样本集;以及
在所述至少一个输出数据流路径中在至少一个执行单元输出上接收所述结果输出向
量数据样本集;
所述至少一个抽头延迟线被进一步配置成:
在所述至少一个输入数据流路径中在所述至少一个抽头延迟线输入上接收来自所述
至少一个向量数据文件的所述输入向量数据样本集;以及
针对所述多个处理级当中的每一个处理级,在所述至少一个输入数据流路径中在至少
一个执行单元输入上将所述经移位的输入向量数据样本集中的每一者提供给所述至少一
个执行单元;以及
所述至少一个执行单元被进一步配置成:
针对所述多个处理级当中的每一个处理级,在所述至少一个输入数据流路径中在所述
至少一个执行单元输入上从所述至少一个抽头延迟线接收所述经移位的输入向量数据样
本集;以及
在所述至少一个执行单元输出中在所述至少一个输出数据流路径上提供所述结果经
滤波的输出向量数据样本集。
9.如权利要求1所述的VPE,其特征在于,所述至少一个抽头延迟线包括:
影子抽头延迟线,其被配置成:
在所述至少一个输入数据流路径中将来自所述至少一个向量数据文件的下一输入向
量数据样本集接收到多个影子流水线寄存器中;以及
在所述多个影子流水线寄存器中针对每一个处理级将所述下一输入向量数据样本集
移位所述向量数据样本宽度进入主抽头延迟线,以提供经移位的输入向量数据样本集;以

所述主抽头延迟线被配置成针对所述多个处理级中的每一个处理级在所述至少一个
输入数据流路径中将所述经移位的输入向量数据样本集提供给所述至少一个执行单元。
10.如权利要求1所述的VPE,其特征在于,进一步包括多个输入向量数据样本选择器,
所述多个输入向量数据样本选择器中的每一者被指派给所述至少一个抽头延迟线中的所
述多个流水线寄存器中的一流水线寄存器;
所述多个输入向量数据样本选择器各自被配置成在来自所述至少一个向量数据文件
的所述输入向量数据样本集中的输入向量数据样本与存储在毗邻流水线寄存器中的输入
向量数据样本之间进行选择,以在所指派的流水线寄存器中存储经移位的输入向量数据样
本。
11.如权利要求1所述的VPE,其特征在于,所述至少一个抽头延迟线根据要由所述至少
一个执行单元执行的向量指令、基于用于所述至少一个抽头延迟线的可编程输入数据路径
配置是能配置的,以便被选择性地提供在所述至少一个向量数据文件与所述至少一个执行
单元之间的所述至少一个输入数据流路径中。
12.如权利要求11所述的VPE,其特征在于,所述至少一个抽头延迟线被配置成根据要
由所述至少一个执行单元执行的下一向量指令、基于用于所述至少一个抽头延迟线的所述
可编程输入数据路径配置而被重新配置成选择性地提供在所述至少一个输入数据流路径
中。
13.如权利要求12所述的VPE,其特征在于,所述至少一个抽头延迟线被配置成在所述
VPE的要由所述至少一个执行单元执行的每个时钟循环上被重新配置成选择性地提供在所
述至少一个输入数据流路径中。
14.如权利要求1所述的VPE,其特征在于,所述至少一个执行单元基于用于所述至少一
个执行单元的可编程输入数据流路径配置是能配置的,以便处理来自所述输入向量数据样
本集的不同位宽的输入向量数据样本。
15.如权利要求1所述的VPE,其特征在于,所述至少一个执行单元被配置成:
在所述至少一个输出数据流路径中提供所述结果经滤波的输出向量数据样本集的实
数结果经滤波的输出向量数据样本以便在所述至少一个向量数据文件中存储在一起;以及
在所述至少一个输出数据流路径中提供所述结果经滤波的输出向量数据样本集的虚
数结果经滤波的输出向量数据样本以便在与所述实数结果经滤波的输出向量数据样本分
开的至少一个向量数据文件中存储在一起。
16.如权利要求1所述的VPE,其特征在于,所述至少一个执行单元被配置成:
在所述至少一个输出数据流路径中提供所述结果经滤波的输出向量数据样本集的偶
数结果经滤波的输出向量数据样本以便在所述至少一个向量数据文件中存储在一起;以及
在所述至少一个输...

【专利技术属性】
技术研发人员:R·汗F·A·穆加希德A·施拉维
申请(专利权)人:高通股份有限公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1