用于具有数据流管理器的处理器中的数据流的方法和装置制造方法及图纸

技术编号:25598618 阅读:23 留言:0更新日期:2020-09-11 23:56
本申请涉及用于具有数据流管理器的处理器中的数据流的方法和装置。本文描述了用于在处理器中实现数据流的方法、装置和系统。数据流管理器可以被配置为基于所述处理器的多个处理元件的状态信息生成用于计算操作的配置分组。因此,处理器的多个处理元件可以基于所述配置分组并发地处理数据流。例如,所述多个处理元件可以实现处理元件到存储器的映射,同时还实现针对所述数据流的通过所述处理器的识别路径。在所述处理器的某些处理元件上执行所述计算操作之后,可以提供处理结果。在语音信号处理操作中,可以将所述处理结果与音素进行比较以识别所述处理结果中人类语音的此类组成部分。一旦被动态地识别,所述处理元件就可以继续比较人类语音的附加组成部分以例如促进音频录制的处理。

【技术实现步骤摘要】
用于具有数据流管理器的处理器中的数据流的方法和装置
本申请一般涉及数据处理和存储器设备。
技术介绍
可以使用一些硬件(例如,硅)计算平台来实现用于无线通信的数字信号处理,诸如数字基带处理或数字前端实现方案。例如,多媒体处理和数字射频(RF)处理可以在无线收发器的数字前端实现方案中完成,如由专用集成电路(ASIC)所实现的那样。各种硬件平台均可以实现这种数字信号处理,诸如ASIC、作为现场可编程门阵列(FPGA)的一部分实现的数字信号处理器(DSP)或片上系统(SoC)。然而,这些解决方案中的每个通常都需要实现特定于硬件实现方案的定制信号处理方法。例如,数字信号处理器可以在蜂窝基站处实现数字处理的特定部分,其中单个硬件部件(例如,处理器)被配置为实现特定功能。例如,所执行的整个信号处理的每个部分可以由不同的、专门设计的硬件来实现,从而使得较为复杂。此外,对于将无线通信转移到“第五代”(5G)系统感兴趣。5G有望带来更高的速度和普遍性,但是尚未建立处理5G无线通信的方法论。在5G无线通信的一些实现方案中,可以比传统无线通信设备更低的功率要求操作的“物联网”(IoT)设备可以利用窄带无线通信标准,所述窄带无线通信标准可以称为窄带IoT(NB-IoT)。例如,3GPP规范的版本13描述了窄带无线通信标准。同时,高速存储器访问和降低的功耗是半导体设备所要求的特征。近年来,已经采用多核处理器来执行应用程序的系统已经导致了对用作主存储器(例如,动态随机存取存储器(DRAM))的存储器设备的更快访问模式以及更多的随机访问模式。例如,对DRAM的典型访问模式按顺序重复存储体激活、读取访问或写入访问以及存储体预充电。需要数据流往返于存储器设备以进行更快访问。计算设备的效率和性能可能受到不同的存储器设备和/或处理器架构的影响。因此,例如,需要快速且有效的访问模式以促进多核处理器中的数据流。
技术实现思路
在本公开中,提供了一种方法。所述方法包括:接收与多个处理元件相关联的状态信息,所述状态信息包括每个处理元件的可用性状态和每个处理元件的相对位置,每个处理元件包括至少一个操作数处理单元和缓冲器;基于所述状态信息来为计算操作选择所述多个处理元件的子集;基于对所述处理元件的所述子集的选择,识别到所述子集中的每个处理元件的多个数据流,所述多个数据流被配置为实现所述计算操作;将所述子集中的每个处理元件映射到一或多个存储器地址以生成配置分组,所述配置分组包含指示所述映射和所述多个数据流的数据;以及将所述配置分组提供给所述多个处理元件。在本公开中,提供了一种装置。所述装置包括:多个处理元件,其可配置为处理计算操作;和数据流管理器,其耦合到所述多个处理元件并且被配置为:接收与所述多个处理元件相关联的状态信息;基于所述状态信息来为计算操作选择所述处理元件的子集;以及将配置分组提供给所述多个处理元件,所述配置分组包含指示用于所述多个处理元件的存储器地址的映射和多个数据流的数据,所述多个数据流被布置为实现所述计算操作。在本公开中,提供了一种方法。所述方法包括:在处理元件处读取与计算操作相关联的配置分组;读取存储在缓冲器中的数据,所述数据与从所述配置分组中读取的至少一个存储器地址相关联;在所述处理元件处对与所述配置分组相关联的数据流执行所述计算操作的一部分以生成处理结果;将所述处理结果与存储在存储器中的数据进行比较;以及基于所述比较,将所述处理结果提供给所述存储器或另一个处理元件。附图说明图1是根据本文描述的示例布置的计算系统的框图。图2是根据图1的示例布置的处理器的框图。图3是根据本文描述的示例布置的方法的流程图。图4是根据本文描述的示例布置的方法的流程图。图5A至5B是根据本文描述的示例实现的处理器的示意图。图6是根据本文描述的示例布置的计算系统的框图。图7示出了根据本公开的各方面的系统的示例。具体实施方式本文描述了用于在处理器中实现数据流的方法、装置和系统。处理器的多个处理元件可以并发地处理数据流。例如,多个处理元件可以实现处理元件到存储器单元和/或共享本地存储器的映射,同时还实现针对数据流的通过处理器的识别路径。可以包括共享存储器空间的数据流管理器可以被配置为基于处理器的多个处理元件的状态信息生成用于计算操作的配置分组。配置分组包含指示处理元件的映射和所识别的数据流的数据。在将此类配置分组提供给处理器的某些处理元件时,与硬件实现方案特定的常规方案相比,处理器中的数据流可以被更快地实现(例如,更快访问存储器)并且可以利用更少功率。例如,在执行其中数据流管理器已经将配置分组提供给某些处理元件的计算操作中,处理器可以根据配置分组的所识别的数据流来访问物理上更接近处理器的存储器单元。或者,作为另一个示例,在执行计算操作时,处理器可以利用数据流管理器的共享存储器空间来存储中间处理结果和/或将中间处理结果提供给某些处理元件;而不是例如将中间处理结果存储在外部存储器单元中,后者可能需要更多功率或更多时间来访问。作为计算操作的示例,在本文描述的处理器中实现的数据流可以包含用于语音信号处理应用(诸如用于在子集的每个相应处理元件中处理话语的单个音素)的数据流。如本文所述,有利地,在处理器或计算设备的某些处理元件中执行或实现的计算操作可以包含将包含指示映射和数据流的数据的配置分组提供给那些处理元件。在将配置分组提供给某些处理元件时,处理器和/或计算设备可以有效地利用可用的处理元件和/或数量减少的处理元件。因此,与可以分配某些处理元件以执行特定功能的常规硬件方案相反,本文描述的系统和方法可以基于某些处理元件的可用性和物理位置来促进对计算操作的高效且灵活处理。另外地或可选地,此类系统和方法可以促进对IoT设备的处理,所述IoT可以比传统计算/通信设备更低的功率要求来操作。例如,在数据流管理器已经选择了特定数量的处理元件时,相较于向并非实现所述特定操作所需的处理元件供电的常规处理器,利用选定的处理元件实现计算操作的处理器和/或计算设备可以利用更少的功率。图1是根据本文中描述的实例布置的计算系统100的示意图。计算系统100包含耦合到存储器单元140a、140b的处理器105。处理器可以实现包含共享存储器空间130的数据流管理器120。例如,共享存储器空间130可以是SRAM存储器单元。数据流管理器120经由控制总线133将配置分组127提供给处理元件115。处理元件115可以经由存储器接口135a、135b耦合到存储器单元140a、140b。例如,可以经由处理器105的数据总线来实现这种耦合。处理器105可以实现从各种数据源接收的计算操作或在处理器105上执行的程序。计算操作可以是任何操作数处理操作,诸如在数字信号处理操作(例如,语音信号处理操作)中经常出现的那些操作数处理操作。例如,计算操作可能需要操作数处理单元处理某些操作数,以生成计算操作的处理结果。作为一个示例,计算操作可以包含操作数乘法和/或操作数加法。多个这种操作数运算可以级联在一起本文档来自技高网
...

【技术保护点】
1.一种方法,其包括:/n接收与多个处理元件相关联的状态信息,所述状态信息包括每个处理元件的可用性状态和每个处理元件的相对位置,每个处理元件包括至少一个操作数处理单元和缓冲器;/n基于所述状态信息来为计算操作选择所述多个处理元件的子集;/n基于对所述处理元件的所述子集的选择,识别到所述子集中的每个处理元件的多个数据流,所述多个数据流被配置为实现所述计算操作;/n将所述子集中的每个处理元件映射到一或多个存储器地址以生成配置分组,所述配置分组包含指示所述映射和所述多个数据流的数据;以及/n将所述配置分组提供给所述多个处理元件。/n

【技术特征摘要】
20190304 US 16/292,0911.一种方法,其包括:
接收与多个处理元件相关联的状态信息,所述状态信息包括每个处理元件的可用性状态和每个处理元件的相对位置,每个处理元件包括至少一个操作数处理单元和缓冲器;
基于所述状态信息来为计算操作选择所述多个处理元件的子集;
基于对所述处理元件的所述子集的选择,识别到所述子集中的每个处理元件的多个数据流,所述多个数据流被配置为实现所述计算操作;
将所述子集中的每个处理元件映射到一或多个存储器地址以生成配置分组,所述配置分组包含指示所述映射和所述多个数据流的数据;以及
将所述配置分组提供给所述多个处理元件。


2.根据权利要求1所述的方法,其还包括:
参照存储用于所述计算操作的数据的至少一个存储器单元识别所述多个处理元件中的每个处理元件的所述相对位置;
识别所述多个处理元件中的每个处理元件的可用性状态;以及
部分地基于每个处理元件的所识别的相对位置和可用性状态来为所述计算操作选择所述处理元件的所述子集。


3.根据权利要求2所述的方法,其中每个处理元件的所述可用性状态包括可用状态、预留状态、部分可用性状态或非功能性状态中的一个。


4.根据权利要求2所述的方法,其还包括:确定从所述多个处理元件中的每个处理元件到所述至少一个存储器单元的物理距离。


5.根据权利要求1所述的方法,其还包括:
在所述多个处理元件的所述子集处,根据所述配置分组执行所述计算操作;和
基于所述计算操作的所述执行来生成多个处理结果,每个相应的处理结果存储在所述多个处理元件的所述子集中的所述相应处理元件的相应缓冲器中。


6.根据权利要求1所述的方法,其还包括:
计算从至少一个存储器单元到所述子集中的每个处理元件的多个传输时间;
确定使用所述多个传输时间的特定部分减少所述计算操作的计算时间;以及
识别所述多个数据流中的每个数据流,每个数据流与所述多个传输时间中的对应传输时间相关联。


7.根据权利要求2所述的方法,其还包括:
将每个处理元件的地址映射到所述至少一个存储器单元的相应存储器地址;和
在所述配置分组中存储所述至少一个存储器单元的所述相应的存储器地址。


8.根据权利要求7所述的方法,其中所述至少一个存储器单元对应于DRAM、SRAM、NAND或3DXPoint存储器中的至少一个。


9.根据权利要求1所述的方法,其中将所述配置分组提供给所述多个处理元件包括仅将所述配置分组提供给所述多个处理元件的所述子集中的每个处理元件。


10.根据权利要求1所述的方法,其中所述至少一个操作数处理单元对应于算术逻辑单元ALU、位操作单元、乘法单元、累加单元、加法器单元、查找表单元、存储器查找单元或其任意组合中的至少一个。


11.一种装置,其包括:
多个处理元件,其可配置为处理计算操作;和
数据流管理器,其耦合到所述多个处理元件并且被配置为:
接收与所述多个处理元件相关联的状态信息;
基于所述状态信息来为计算操作选择所述处理元件的子集;以及
将配置分组提供给所述多个处理元件,所述配置...

【专利技术属性】
技术研发人员:J·赫里茨T·施米茨罗法隆D·赫尔顿
申请(专利权)人:美光科技公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1