当前位置: 首页 > 专利查询>英特尔公司专利>正文

数据中心中的共享存储器控制器制造技术

技术编号:21714243 阅读:25 留言:0更新日期:2019-07-27 19:10
描述了用于存储器控制器的技术。存储器控制器可以从数据中心中的数据消费者节点接收针对训练数据的请求。在该请求中指示的训练数据对应于在数据消费者节点上运行的模型的模型标识符(ID)。存储器控制器可以识别数据中心中的数据提供者节点,该数据提供者节点存储被数据消费者节点请求的训练数据。可以使用在存储器控制器处维护的跟踪表来识别数据提供者节点。存储器控制器可以向数据提供者节点发送指令,该指令指示数据提供者节点将训练数据发送到数据消费者节点,以实现对在数据消费者节点上运行的模型的训练。

Shared Memory Controller in Data Center

【技术实现步骤摘要】
数据中心中的共享存储器控制器
技术介绍
人工智能(AI)可以涉及发现输入数据中的模式,使用所发现的输入数据中的模式来构建AI模型,以及使用AI模型对随后接收到的数据进行预测。在一个示例中,构建AI模型可以涉及收集用于生成AI模型的输入数据。可以从数据提供者接收输入数据。输入数据可以用作训练数据以训练AI模型。例如,可以使用训练数据来训练AI模型以识别输入数据中的模式并关于输入数据进行推断。在一个示例中,建立和训练AI模型可以涉及处理相对大的输入数据集,这可能消耗相对大量的计算资源。因此,通常在云环境中使用专用图形处理单元(GPU)和现场可编程门阵列(FPGA)硬件来执行AI。附图说明根据下面的详细描述,结合附图考虑,本专利技术实施例的特征和优点将变得显而易见,附图和详细描述通过示例的方式一起示出了专利技术特征;并且,其中:图1示出了根据示例实施例的用于使用分布式共享存储器(DSM)控制器来执行数据操作的系统和相关操作;图2示出了根据示例实施例的分布式共享存储器(DSM)控制器;图3示出了根据示例实施例的包括(多个)处理器、存储设备以及(多个)AI硬件平台的抽屉;图4示出了根据示例实施例的存储器控制器;图5示出了根据示例实施例的用于在存储设备上执行数据操作的系统;图6是示出根据示例实施例的用于辅助数据中心中的数据传送的操作的流程图;以及图7示出了根据示例实施例的包括数据存储设备的计算系统。现在将参考所示出的示例性实施例,并且本文将使用特定语言来描述所示出的示例性实施例。然而应理解,不会由此预期对专利技术范围的任何限制。具体实施方式在描述所公开的专利技术实施例之前,应理解本公开不限于本文公开的特定结构、过程步骤或材料,而是如相关领域普通技术人员所认识到的扩展到其等同物。还应理解,本文采用的术语仅用于描述特定示例或实施例的目的,而不旨在是限制性的。不同附图中的相同附图标记表示相同元素。提供在流程图和过程中提供的数字是为了清楚地说明步骤和操作,而并不一定指示特定的次序或序列。此外,所描述的特征、结构或特性可以在一个或多个实施例中以任何合适的方式组合。在以下描述中,提供了许多具体细节,例如,布局、距离、网络示例等的示例,以提供对各种专利技术实施例的透彻理解。然而,相关领域技术人员将认识到,这些详细实施例不限制本文所阐述的总体专利技术构思,而仅仅作为其代表。如在本说明书和所附权利要求书中所使用的,单数形式的“一(a)”、“一(an)”和“该(the)”包括复数指示物,除非上下文另有明确规定。因此,例如,对“位线”的引用包括多个这样的位线。贯穿本说明书对“示例”的引用意味着结合该示例描述的特定特征、结构或特性包括在本专利技术的至少一个实施例中。因此,贯穿本说明书在各个地方出现的短语“在示例中”或“实施例”不一定都指代相同的实施例。如本文所使用的,为方便起见,可以在公共列表中呈现多个项目、结构元素、组成元素和/或材料。然而,这些列表应该被解释为如同列表中的每个成员都被单独标识为单独且唯一的成员。因此,此类列表中的任何个体成员不应仅仅基于其在公共组中的呈现而没有相反的指示,被解释为相同列表中的任何其他成员的实际等同物。另外,可以在本文中对本专利技术的各种实施例和示例连同其各种组件的替代物一起进行参考。应理解,这些实施例、示例和替代物不应被解释为彼此的实际等同物,而是被视为本公开下的单独且自主的表示。此外,所描述的特征、结构或特性可以在一个或多个实施例中以任何合适的方式组合。在以下描述中,提供了许多具体细节,例如,布局、距离、网络示例等的示例,以提供对专利技术实施例的透彻理解。然而,相关领域技术人员将认识到,可以在没有具体细节中的一个或多个具体细节的情况下或者利用其他方法、组件、布局等来实践该技术。在其他实例中,公知的结构、材料或操作可以不详细示出或描述,以避免模糊公开内容的方面。在本公开中,“包括”、“包括有”、“含有”和“具有”等可以具有美国专利法中赋予它们的含义,并且可以表示“包含”、“包含有”等,并且通常被解释为开放式术语。术语“由……组成”或“由……构成”是封闭的术语,并且仅包括结合这些术语特别列出的组件、结构、步骤等,并且其符合美国专利法。“基本上由……组成”或“基本上由……构成”具有美国专利法通常赋予它们的含义。特别是,这些术语通常是封闭的术语,除了允许包含附加项目、材料、组件、步骤或元素,这些附加项目、材料、组件、步骤或元素不会实质性影响与其结合使用的(多个)项目的基本和新颖特性或功能。例如,如果存在于组合物中,但不影响组合物性质或特性的微量元素如果以“基本上由……组成”的语境存在是允许的,即使没有明确列举在这样的术语之后的项目列表中。当在本说明书中使用开放式术语如“包括”或“包含”时,应理解为也应该对“基本上由……组成”语言以及“由……组成”语言提供直接支持,如同明确指出的那样,反之亦然。如果存在,说明书和权利要求中的术语“第一”、“第二”、“第三”、“第四”等用于在类似的元素之间进行区分,而不一定用于描述特定的顺序或时间次序。应当理解,如此使用的术语在适当的情况下是可互换的,使得本文描述的实施例例如能够以不同于本文所示出或以其他方式描述的顺序操作。类似地,如果本文描述方法包括一系列步骤,则本文呈现的这些步骤的次序不一定是可以执行这些步骤的唯一次序,并且某些所陈述的步骤可能被省略和/或本文中未描述的某些其他步骤可能被添加到该方法中。如本文所使用的,诸如“增加的”、“减少的”、“更好的”、“更差的”、“更高的”、“更低的”、“增强的”等之类的比较术语是指设备、组件或活动的这种属性:与在周围或相邻区域中、在单个设备或多个可比较设备中、在组或类中、在多组或多类中的其他设备、组件或活动可测量地不同,或与已知现有技术相比可测量地不同。例如,具有“增加的”损坏风险的数据区域可以指代存储器设备的这样的区域:该区域比相同存储器设备中的其他区域更可能具有写入错误。许多因素可能导致这种增加的风险,包括位置、制造工艺、施加于该区域的程序脉冲数等。如本文所使用的,术语“基本上”是指动作、特性、属性、状态、结构、项目或结果的完全或接近完全的范围或程度。例如,“基本上”封闭的对象意味着该对象或者完全封闭,或者接近完全封闭。在某些情况下,偏离绝对完全度的确切允许程度可能取决于特定上下文。然而,一般而言,完全的接近度将会达到相同的总体结果,就好像获得了绝对完全和总体完全一样。当在负面含义中使用时,“基本上”的使用同样适用于指代完全或接近完全缺乏动作、特性、属性、状态、结构、项目或结果。例如,“基本上不含”颗粒的组合物将完全不含颗粒,或接近完全不含颗粒,其效果与完全不含颗粒相同。换言之,“基本上不含”成分或元素的组合物仍可能实际上包含这样的项目,只要没有其可测量的影响。如本文所使用的,术语“约”用于通过提供可能“稍高”或“稍低”于端点的给定值来为数值范围端点提供灵活性。然而,应该理解的是,即使当在本说明书中与特定数值结合使用术语“约”时,也提供对除了“约”术语之外所引用的确切数值的支持。数字量和其他数字数据可以在本文中以范围格式表达或呈现。应理解,这种范围格式仅仅为了方便和简洁而使用,并且因此应该被灵活地解释为不仅包括作为范围限值明确列举的数值,而且还包括包含本文档来自技高网...

【技术保护点】
1.一种存储器控制器,包括用于以下操作的逻辑:在所述存储器控制器处,从数据中心中的数据消费者节点接收针对训练数据的请求,其中,在所述请求中指示的所述训练数据对应于在所述数据消费者节点上运行的模型的模型标识符(ID);在所述存储器控制器处,识别所述数据中心中的数据提供者节点,所述数据提供者节点存储被所述数据消费者节点请求的所述训练数据,其中,所述数据提供者节点是使用在所述存储器控制器处维护的跟踪表来识别的;以及从所述存储器控制器向所述数据提供者节点发送指令,所述指令指示所述数据提供者节点将所述训练数据发送到所述数据消费者节点,以实现对在所述数据消费者节点上运行的所述模型的训练。

【技术特征摘要】
2017.12.28 US 15/857,3371.一种存储器控制器,包括用于以下操作的逻辑:在所述存储器控制器处,从数据中心中的数据消费者节点接收针对训练数据的请求,其中,在所述请求中指示的所述训练数据对应于在所述数据消费者节点上运行的模型的模型标识符(ID);在所述存储器控制器处,识别所述数据中心中的数据提供者节点,所述数据提供者节点存储被所述数据消费者节点请求的所述训练数据,其中,所述数据提供者节点是使用在所述存储器控制器处维护的跟踪表来识别的;以及从所述存储器控制器向所述数据提供者节点发送指令,所述指令指示所述数据提供者节点将所述训练数据发送到所述数据消费者节点,以实现对在所述数据消费者节点上运行的所述模型的训练。2.根据权利要求1所述的存储器控制器,还包括用于以下操作的逻辑:在所述数据消费者节点处从所述数据提供者节点接收所述训练数据之后,从所述数据消费者节点接收确认。3.根据权利要求1所述的存储器控制器,还包括用于以下操作的逻辑:指示所述数据提供者节点在所述训练数据被提供给所述数据消费者节点之后从所述数据提供者节点删除所述训练数据。4.根据权利要求1所述的存储器控制器,其中,所述跟踪表基于每个模型ID来跟踪跨所述数据中心中的不同数据提供者节点对训练数据的存储。5.根据权利要求1所述的存储器控制器,还包括用于以下操作的逻辑:发现存储在所述数据中心中的多个数据提供者节点中的与特定模型ID相关联的训练数据;以及注册与所述模型ID相关联的所述训练数据,其中,对所述训练数据的注册涉及将对所述训练数据、存储所述训练数据的数据提供者节点以及相关联的模型ID的指示添加到在所述存储器控制器处维护的所述跟踪表。6.根据权利要求1所述的存储器控制器,还包括用于以下操作的逻辑:促进训练数据在所述数据中心中在所述数据消费者节点与所述数据提供者节点之间的分布和共享。7.根据权利要求1所述的存储器控制器,还包括用于以下操作的逻辑:管理用于与所述模型ID相关联的所述模型的服务质量(QoS)或服务水平协议(SLA)中的一个或多个;以及将QoS信息或SLA信息中的一个或多个存储在所述跟踪表中,其中,所述QoS信息或所述SLA信息定义用于从所述数据提供者节点读取与所述模型ID相关联的训练数据或者将与所述模型ID相关联的训练数据存储到所述数据提供者节点的带宽量。8.根据权利要求1所述的存储器控制器,还包括用于以下操作的逻辑:处理从所述数据消费者节点接收的多个请求,其中,所述存储器控制器被配置为:当响应于所述多个请求而指示所述数据中心中的一个或多个数据提供者节点向所述数据消费者节点提供训练数据时,应用负载均衡。9.根据权利要求1所述的存储器控制器,还包括用于以下操作的逻辑:从所述数据消费者节点接收多个请求,其中,每个请求是针对与单独的模型ID相关联的训练数据的;使用所述跟踪表来确定与从所述数据消费者节点接收的所述多个请求相关联的所述模型ID中的每个模型ID的优先级级别;以及基于与从所述数据消费者节点接收的所述多个请求相关联的所述模型ID中的每个模型ID的所述优先级级别,按优先级次序处理所述请求。10.根据权利要求1所述的存储器控制器,其中,所述存储器控制器是被包括在所述数据中心的每个存储机架中的分布式共享存储器控制器,或者所述存储器控制器是被包括在每个数据中心中的集中式共享存储器控制器。11.一种可操作以在存储设备上执行数据操作的系统,所述系统包括:计算元件;存储设备;以及存储器控制器,其包括用于以下操作的逻辑:从数据中心中的所述计算元件接收用于执行关于模型标识符(ID)的数据操作的请求,其中,所述模型ID对应于在所述数据中心中运行的模型;在所述存储器控制器处,确定所述数据中心中的所述存储设备要被用于执行关于所述模型ID的所述数据操作;以及在所述存储器控制器处,针对所述计算元件在所述存储设备上执行关于所述模型ID的所述数据操作。12.根据权利要求11所述的系统,其中,所...

【专利技术属性】
技术研发人员:F·甘博纳特M·A·施密瑟尔K·库马尔T·维尔哈姆
申请(专利权)人:英特尔公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1