【技术实现步骤摘要】
数据中心中的共享存储器控制器
技术介绍
人工智能(AI)可以涉及发现输入数据中的模式,使用所发现的输入数据中的模式来构建AI模型,以及使用AI模型对随后接收到的数据进行预测。在一个示例中,构建AI模型可以涉及收集用于生成AI模型的输入数据。可以从数据提供者接收输入数据。输入数据可以用作训练数据以训练AI模型。例如,可以使用训练数据来训练AI模型以识别输入数据中的模式并关于输入数据进行推断。在一个示例中,建立和训练AI模型可以涉及处理相对大的输入数据集,这可能消耗相对大量的计算资源。因此,通常在云环境中使用专用图形处理单元(GPU)和现场可编程门阵列(FPGA)硬件来执行AI。附图说明根据下面的详细描述,结合附图考虑,本专利技术实施例的特征和优点将变得显而易见,附图和详细描述通过示例的方式一起示出了专利技术特征;并且,其中:图1示出了根据示例实施例的用于使用分布式共享存储器(DSM)控制器来执行数据操作的系统和相关操作;图2示出了根据示例实施例的分布式共享存储器(DSM)控制器;图3示出了根据示例实施例的包括(多个)处理器、存储设备以及(多个)AI硬件平台的抽屉;图4示出了根据示例实施例的存储器控制器;图5示出了根据示例实施例的用于在存储设备上执行数据操作的系统;图6是示出根据示例实施例的用于辅助数据中心中的数据传送的操作的流程图;以及图7示出了根据示例实施例的包括数据存储设备的计算系统。现在将参考所示出的示例性实施例,并且本文将使用特定语言来描述所示出的示例性实施例。然而应理解,不会由此预期对专利技术范围的任何限制。具体实施方式在描述所公开的专利技术实施例之前, ...
【技术保护点】
1.一种存储器控制器,包括用于以下操作的逻辑:在所述存储器控制器处,从数据中心中的数据消费者节点接收针对训练数据的请求,其中,在所述请求中指示的所述训练数据对应于在所述数据消费者节点上运行的模型的模型标识符(ID);在所述存储器控制器处,识别所述数据中心中的数据提供者节点,所述数据提供者节点存储被所述数据消费者节点请求的所述训练数据,其中,所述数据提供者节点是使用在所述存储器控制器处维护的跟踪表来识别的;以及从所述存储器控制器向所述数据提供者节点发送指令,所述指令指示所述数据提供者节点将所述训练数据发送到所述数据消费者节点,以实现对在所述数据消费者节点上运行的所述模型的训练。
【技术特征摘要】
2017.12.28 US 15/857,3371.一种存储器控制器,包括用于以下操作的逻辑:在所述存储器控制器处,从数据中心中的数据消费者节点接收针对训练数据的请求,其中,在所述请求中指示的所述训练数据对应于在所述数据消费者节点上运行的模型的模型标识符(ID);在所述存储器控制器处,识别所述数据中心中的数据提供者节点,所述数据提供者节点存储被所述数据消费者节点请求的所述训练数据,其中,所述数据提供者节点是使用在所述存储器控制器处维护的跟踪表来识别的;以及从所述存储器控制器向所述数据提供者节点发送指令,所述指令指示所述数据提供者节点将所述训练数据发送到所述数据消费者节点,以实现对在所述数据消费者节点上运行的所述模型的训练。2.根据权利要求1所述的存储器控制器,还包括用于以下操作的逻辑:在所述数据消费者节点处从所述数据提供者节点接收所述训练数据之后,从所述数据消费者节点接收确认。3.根据权利要求1所述的存储器控制器,还包括用于以下操作的逻辑:指示所述数据提供者节点在所述训练数据被提供给所述数据消费者节点之后从所述数据提供者节点删除所述训练数据。4.根据权利要求1所述的存储器控制器,其中,所述跟踪表基于每个模型ID来跟踪跨所述数据中心中的不同数据提供者节点对训练数据的存储。5.根据权利要求1所述的存储器控制器,还包括用于以下操作的逻辑:发现存储在所述数据中心中的多个数据提供者节点中的与特定模型ID相关联的训练数据;以及注册与所述模型ID相关联的所述训练数据,其中,对所述训练数据的注册涉及将对所述训练数据、存储所述训练数据的数据提供者节点以及相关联的模型ID的指示添加到在所述存储器控制器处维护的所述跟踪表。6.根据权利要求1所述的存储器控制器,还包括用于以下操作的逻辑:促进训练数据在所述数据中心中在所述数据消费者节点与所述数据提供者节点之间的分布和共享。7.根据权利要求1所述的存储器控制器,还包括用于以下操作的逻辑:管理用于与所述模型ID相关联的所述模型的服务质量(QoS)或服务水平协议(SLA)中的一个或多个;以及将QoS信息或SLA信息中的一个或多个存储在所述跟踪表中,其中,所述QoS信息或所述SLA信息定义用于从所述数据提供者节点读取与所述模型ID相关联的训练数据或者将与所述模型ID相关联的训练数据存储到所述数据提供者节点的带宽量。8.根据权利要求1所述的存储器控制器,还包括用于以下操作的逻辑:处理从所述数据消费者节点接收的多个请求,其中,所述存储器控制器被配置为:当响应于所述多个请求而指示所述数据中心中的一个或多个数据提供者节点向所述数据消费者节点提供训练数据时,应用负载均衡。9.根据权利要求1所述的存储器控制器,还包括用于以下操作的逻辑:从所述数据消费者节点接收多个请求,其中,每个请求是针对与单独的模型ID相关联的训练数据的;使用所述跟踪表来确定与从所述数据消费者节点接收的所述多个请求相关联的所述模型ID中的每个模型ID的优先级级别;以及基于与从所述数据消费者节点接收的所述多个请求相关联的所述模型ID中的每个模型ID的所述优先级级别,按优先级次序处理所述请求。10.根据权利要求1所述的存储器控制器,其中,所述存储器控制器是被包括在所述数据中心的每个存储机架中的分布式共享存储器控制器,或者所述存储器控制器是被包括在每个数据中心中的集中式共享存储器控制器。11.一种可操作以在存储设备上执行数据操作的系统,所述系统包括:计算元件;存储设备;以及存储器控制器,其包括用于以下操作的逻辑:从数据中心中的所述计算元件接收用于执行关于模型标识符(ID)的数据操作的请求,其中,所述模型ID对应于在所述数据中心中运行的模型;在所述存储器控制器处,确定所述数据中心中的所述存储设备要被用于执行关于所述模型ID的所述数据操作;以及在所述存储器控制器处,针对所述计算元件在所述存储设备上执行关于所述模型ID的所述数据操作。12.根据权利要求11所述的系统,其中,所...
【专利技术属性】
技术研发人员:F·甘博纳特,M·A·施密瑟尔,K·库马尔,T·维尔哈姆,
申请(专利权)人:英特尔公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。