当前位置: 首页 > 专利查询>英特尔公司专利>正文

用于选择数据元素的硬件加速器制造技术

技术编号:19240299 阅读:20 留言:0更新日期:2018-10-24 03:53
本申请公开了用于选择数据元素的硬件加速器。处理器可以包括多个处理元件以及用于选择数据元素的硬件加速器。所述硬件加速器可以:访问包括数据元素集的输入数据集,每个数据元素具有分数值;基于所述数据元素集的所述分数值将箱计数器递增,每个箱计数器用于对具有相关联分数值的多个数据元素进行计数;确定一系列箱计数器的计数值的累计和,所述序列从所述多个箱计数器中的第一箱计数器开始;标识所述一系列箱计数器中的第二箱计数器,在所述第二箱计数器处所述累计和达到选择数量N;以及基于所述数据元素集与同所述第二箱计数器相关联的阈值分数的比较来生成输出数据集。

【技术实现步骤摘要】
用于选择数据元素的硬件加速器
实施例涉及计算机处理器,并且更具体地涉及计算机处理器中的数据选择。
技术介绍
计算设备可以包括中央处理器和主存储器(例如,处理器外部的随机存取存储器)。中央处理器可以执行软件应用的指令。例如,可以执行一些软件应用以从更大的数据源(例如,数据库、数据流等)中选择一些数据元素或记录。附图说明图1是根据本专利技术的实施例的系统的一部分的框图。图2是根据本专利技术的实施例的处理器的框图。图3是根据本专利技术的另一实施例的多域处理器的框图。图4是包括多个核的处理器的实施例。图5是根据本专利技术的一个实施例的处理器核的微架构的框图。图6是根据另一实施例的处理器核的微架构的框图。图7是根据又一实施例的处理器核的微架构的框图。图8是根据又进一步实施例的处理器核的微架构的框图。图9是根据本专利技术的另一实施例的处理器的框图。图10是根据本专利技术的实施例的代表性SoC的框图。图11是根据本专利技术的实施例的另一示例SoC的框图。图12是其中可以使用实施例的示例系统的框图。图13是其中可以使用实施例的另一示例系统的框图。图14是代表性计算机系统的框图。图15是根据本专利技术的实施例的系统的框图。图16是框图,示出根据实施例的用于制造集成电路以执行操作的IP核开发系统。图17是根据一个或多个实施例的用于数据选择的示例系统的图。图18是根据一个或多个实施例的示例选择加速器的图。图19A-19C是根据一个或多个实施例的示例数据选择操作的框图。图20是根据一个或多个实施例的用于数据选择的示例方法的流程图。图21是根据一个或多个实施例的用于数据选择的示例方法的流程图。具体实施方式一些计算应用包括从较大数据集中选择N个数据元素。可以根据数据元素的分数值进行这种选择。例如,假设视频应用接收表示各个像素的数据元素流。进一步假设每个像素与视频参数(例如,颜色、亮度、运动等)的分数值相关联。视频应用可以基于分数值来选择前N个像素(例如,基于亮度分数的前200个像素)。在另一个示例中,网络路由器可以从各种设备接收数据分组,每个分组具有相关联的优先级分数。网络路由器可以根据优先级分数来选择待在其他分组之前处理的前N个分组。为了执行这种数据选择,一些应用可以对整个输入数据集进行分类,并且然后可以从已分类的数据集中选择前N个数据元素。然而,这种分类可能涉及大量的硬件资源和计算时间。根据一些实施例,选择加速器可以从数据集中选择N个数据元素。元素的数量N在本文中可以称为选择加速器的“选择数量”。选择加速器可以基于数据集中的所有数据元素的分数值来将箱(bin)计数器递增。每个箱计数器可以对与特定分数值或与分数值范围相关联的多个数据元素进行计数。在一些实施例中,箱计数器可以根据降序分数值来排序。选择加速器可以确定一系列箱计数器的计数值的累计和。在一些实施例中,选择加速器可以标识序列中累计和达到选择数量N的特定箱计数器。选择加速器可以存储或指定与所述特定箱计数器相关联的分数值作为阈值分数。选择加速器可以基于数据元素与阈值分数的比较来生成输出数据集。选择加速器的示例实现在下面参考图17-21进一步描述。尽管以下实施例是参考特定集成电路,诸如在计算平台或处理器中来描述的,但其他实施例也适用于其他类型的集成电路和逻辑设备。本文描述的实施例的类似技术和教导可以应用于其他类型的电路或半导体器件。例如,所公开的实施例不限于任何特定类型的计算机系统。也就是说,所公开的实施例可以用于许多不同的系统类型,范围从服务器计算机(例如,塔式服务器、机架式服务器、刀片式服务器、微服务器等),通信系统,存储系统,任何配置的台式计算机、膝上型计算机、笔记本计算机、平板计算机(包括2:1平板计算机、平板手机等),也可用于其他设备,诸如手持设备、片上系统(SoC)和嵌入式应用。手持设备的一些示例包括诸如智能手机之类的蜂窝电话、互联网协议设备、数码相机、个人数字助理(PDA)和手持式PC。嵌入式应用通常可以包括微控制器、数字信号处理器(DSP)、网络计算机(NetPC)、机顶盒、网络集线器、广域网(WAN)交换机,可穿戴设备或任何其他可执行下文教导的功能和操作的系统。另外,实施例可以在具有标准语音功能的移动终端,诸如移动电话、智能手机和平板手机中,和/或在没有标准无线语音功能通信能力的非移动终端,诸如许多可穿戴设备、平板计算机、笔记本、台式机、微服务器、服务器等之中实现。另外,本文描述的装置、方法和系统不限于物理计算设备,而是还可以涉及软件实现。现在参考图1,示出了根据本专利技术实施例的系统的一部分的框图。如图1所示,系统100可以包括各种部件,包括处理器110,如所示的是多核处理器。处理器110可以经由外部电压调节器160耦合到电源150,外部电压调节器160可以执行第一电压转换以向处理器110提供主调节电压Vreg。如所看到的,处理器110可以是包括多个核120a-120n的单管芯处理器。此外,每个核可以与集成电压调节器(IVR)125a-125n相关联,所述集成电压调节器(IVR)接收主调节电压并生成将被提供给与IVR相关联的处理器的一个或多个代理的运行电压。因此,可以提供IVR实现以允许对每个单独核的电压进而对其功率和性能进行细粒度控制。这样,每个核可以在独立的电压和频率下运行,从而实现了很强的灵活性并为使功耗与性能平衡提供了很大可能。在一些实施例中,多个IVR的使用使得能够将部件分组成单独的电源层,使得功率由IVR调节并仅供应给组中的那些部件。在功率管理期间,当处理器处于某种低功耗状态时,一个IVR的给定电源层可能供电下降或停电,而另一个IVR的另一个电源层保持活动或完全供电。类似地,核120可以包括诸如一个或多个锁相环(PLL)之类的独立时钟生成电路系统或与其相关联,以独立地控制每个核120的运行频率。仍然参考图1,处理器内可以存在附加部件,包括输入/输出接口(IF)132、另一接口134和集成存储器控制器(IMC)136。如所看到的,这些部件中的每一个都可以由另一个集成电压调节器125x供电。在一个实施例中,接口132可以实现用于快速路径互连(QPI)互连的操作,所述QPI互连提供高速缓存一致性协议中的点对点(PtP)链路,所述高速缓存一致性协议包括多个层,包括物理层、链路层和协议层。接口134进而可以经由外围部件互连高速(PCIeTM)协议进行通信。还示出了功率控制单元(PCU)138,其可以包括包含用于执行关于处理器110的功率管理操作的硬件、软件和/或固件的电路系统。如所看到的,PCU138经由数字接口162向外部电压调节器160提供控制信息,以使电压调节器生成适当的调节电压。PCU138还经由另一数字接口163向IVR125提供控制信息,以控制所生成的运行电压(或导致在低功率模式下禁用对应的IVR)。在各种实施例中,PCU138可以包括各种功率管理逻辑单元以执行基于硬件的功率管理。这种功率管理可以整体由处理器控制(例如,通过各种处理器硬件,并且可以由工作负荷和/或功率、热或其他处理器约束条件来触发),和/或功率管理可以响应于外部源(诸如平台或功率管理源或系统软件)来执行。在图1中,PCU138示出为作为处理器的单独逻辑而存在。在其他情况下,PCU138可以在给本文档来自技高网...

【技术保护点】
1.一种用于数据选择的处理器,所述处理器包括:多个处理元件;以及用于选择数据元素的硬件加速器,所述硬件加速器用于:访问包括多个数据元素的输入数据集,每个数据元素具有分数值;基于所述多个数据元素的所述分数值将多个箱计数器递增,每个箱计数器用于对具有相关联分数值的数据元素的数量进行计数;使用累加器确定箱计数器序列的计数值的累计和,所述序列从所述多个箱计数器中的第一箱计数器开始;使用第一比较器标识所述箱计数器序列中的第二箱计数器,在所述第二箱计数器处所述累计和达到选择数量N;以及使用第二比较器基于所述多个数据元素与同所述第二箱计数器相关联的阈值分数的比较来生成输出数据集。

【技术特征摘要】
2017.03.31 US 15/475,2381.一种用于数据选择的处理器,所述处理器包括:多个处理元件;以及用于选择数据元素的硬件加速器,所述硬件加速器用于:访问包括多个数据元素的输入数据集,每个数据元素具有分数值;基于所述多个数据元素的所述分数值将多个箱计数器递增,每个箱计数器用于对具有相关联分数值的数据元素的数量进行计数;使用累加器确定箱计数器序列的计数值的累计和,所述序列从所述多个箱计数器中的第一箱计数器开始;使用第一比较器标识所述箱计数器序列中的第二箱计数器,在所述第二箱计数器处所述累计和达到选择数量N;以及使用第二比较器基于所述多个数据元素与同所述第二箱计数器相关联的阈值分数的比较来生成输出数据集。2.如权利要求1所述的处理器,其特征在于,所述硬件加速器进一步用于:将与所述第二箱计数器相关联的所述阈值分数存储在所述硬件加速器的第一寄存器中;以及将与所述第二箱计数器相关联的阈值计数存储在所述硬件加速器的第二寄存器中。3.如权利要求1所述的处理器,其特征在于,所述硬件加速器进一步用于:将所述多个数据元素的分数值与所述阈值分数进行比较;以及过滤掉分数值小于所述阈值分数的数据元素。4.如权利要求3所述的处理器,其特征在于,所述硬件加速器进一步用于针对分数值大于所述阈值分数的每个数据元素执行以下操作:将输出计数加1;以及传递要包括在所述输出数据集中的所述数据元素。5.如权利要求3所述的处理器,其特征在于,所述硬件加速器进一步用于针对分数值等于所述阈值分数的每个数据元素执行以下操作:判定匹配计数是否小于所述阈值计数;响应于确定所述匹配计数小于所述阈值计数:将所述匹配计数加1;将输出计数加1;以及传递要包括在所述输出数据集中的所述数据元素。6.如权利要求5所述的处理器,其特征在于,所述硬件加速器进一步用于:响应于确定所述匹配计数不小于所述阈值计数,过滤掉所述数据元素。7.如权利要求1所述的处理器,其特征在于,所述多个箱计数器根据降序分数值来排序。8.如权利要求1所述的处理器,其特征在于,所述硬件加速器进一步用于:并行地访问所述输入数据集中的多个数据元素。9.一种用于数据选择的方法,所述方法包括:由选择加速器基于输入数据集中的多个数据元素的分数值将多个箱计数器递增;确定箱计数器序列的计数值的累计和,所述序列从所述多个箱计数器中的第一箱计数器开始;在所述箱计数器序列中确定第二箱计数器,在所述第二箱计数器处所述累计和达到选择数量N;将与所述第二箱计数器相关联的分数值标识为阈值分数;将所述多个数据元素的分数值与所述阈值分数进行比较;以及由所述选择加速器基于所述多个数据元素的所述分数值与所述阈值分数的比较来生成输出数据集。10.如权利要求9所述的方法,其特征在于,进一步包括:将与所述第二箱计数器相关联的计数值标识为阈值计数。11.如权利要求10所述的方法,其特征在于,进一步包括:将所述阈值分...

【专利技术属性】
技术研发人员:M·马米迪帕卡S·詹德亚拉A·恩凯N·R·斯S·舒巴拉莫内
申请(专利权)人:英特尔公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1