基于动态划分的数据处理集群的数据保护方法技术

技术编号:31456033 阅读:15 留言:0更新日期:2021-12-18 11:22
本公开公开了基于动态划分的数据处理集群的数据保护方法,涉及人工智能,尤其涉及信息流领域。具体实现方案为:公开了数据处理加速器(DPA)的集群中的数据保护的系统和方法,其使用使DPA加入或离开集群中的一个或多个DPA群组的动态划分。主机设备指示集群中的每个DPA与集群中的一个或多个DPA建立链接或断开链接,以在集群中建立DPA群组。没有链接到任何DPA的DPA被设置为低功率模式。一旦分组,主机设备和DPA可以访问该DPA的所有资源。在与第一DPA相同的群组中的DPA可以访问第一DPA的非保护资源,但不可以访问保护资源。在与第一DPA不同的群组中的DPA不可以访问第一DPA的任何资源。主机设备中的调度器将针对一个应用程序或用户的处理任务分配给群组。或用户的处理任务分配给群组。或用户的处理任务分配给群组。

【技术实现步骤摘要】
基于动态划分的数据处理集群的数据保护方法


[0001]本公开大体上涉及在集群中配置的数据处理加速器。更具体地,本公开涉及诸如可用于执行人工智能模型训练和推断的数据处理加速器集群中的数据保护。

技术介绍

[0002]随着AI技术部署在诸如图像分类、医学诊断或自主驾驶的各种领域中,人工智能(AI)模型(也称为“机器学习模型”)最近已被广泛地使用。与软件应用的可执行映像或二进制映像类似,AI模型在被训练时可以基于一组属性执行推断以分类为特征。AI模型的训练可能需要在收集、整理和过滤数据上进行大量投资,以生成产生有用预测的AI模型。此外,使用AI模型所产生的预测可以包含用户想要保护的个人敏感数据。
[0003]从AI模型生成预测可以是计算密集型处理。为了为一个或多个用户提供足够的计算能力,可以在集群中提供数据处理加速器(DPA)的集群。数据处理加速器与一个或多个通信链路互连。存在一种风险,即,包括通信链路和/或集群中的一个或多个数据处理加速器可能使得AI模型或由AI模型产生的推断可能被泄漏、被盗和/或被篡改。
[0004]为了处理计算密集型任务,可以设计数据处理加速器的集群来处理最大工作负荷。针对最大工作负荷选择的数据处理加速器的数量可以产生大量的热量和能量消耗。
[0005]建立具有满足最大工作负荷的多个数据处理加速器的集群系统可能代价高昂。成本可以促使灰色市场制造商生产在视觉上看起来与合法的名牌数据处理加速器相同的数据处理加速器。系统构建者或集成者可能无法验证数据处理加速器是否是由品牌制造商制造的。因此,系统构建者无法确保在集群中使用的数据处理加速器与构建者打算在集群中使用的名牌数据处理加速器一样安全。

技术实现思路

[0006]本申请的一个方面提供了一种配置通信地联接到主机设备的多个数据处理加速器的计算机实现的方法,该方法可包括:由数据处理加速器集群中的数据处理加速器从主机设备的驱动器接收专用于数据处理加速器的配置指令,以将数据处理加速器配置为加入集群中的数据处理加速器子群组中或离开集群中的数据处理加速器子群组。根据配置指令配置数据处理加速器可包括:响应于指示数据处理加速器加入数据处理加速器子群组的指令,由数据处理加速器生成到子群组中的至少一个数据处理加速器的通信链路,以及响应于指示数据处理加速器离开数据处理加速器子群组的指令,断开数据处理加速器和子群组中的所有数据处理加速器之间的通信链路。
[0007]本申请的另一方面提供了一种数据处理加速器,其包括链路配置模块,链路配置模块可用于:从主机设备的驱动器接收专用于数据处理加速器的配置指令,以将数据处理加速器配置为加入集群中的数据处理加速器子群组中或离开集群中的数据处理加速器子群组,其中,数据处理加速器是集群中的数据处理加速器中的一个。根据配置指令配置数据处理加速器可包括:响应于指示数据处理加速器加入数据处理加速器子群组的指令,由数
据处理加速器生成到子群组中的至少一个数据处理加速器的通信链路,以及响应于指示数据处理加速器离开数据处理加速器子群组的指令,断开数据处理加速器和子群组中的所有数据处理加速器之间的通信链路。
[0008]本申请的又一方面提供了一种具有至少一个硬件处理器的处理系统,硬件处理器联接到用可执行指令编程的存储器,可执行指令在由至少一个硬件处理器执行时使至少一个硬件处理器执行配置通信地联接到主机设备的多个数据处理加速器的操作,该操作可包括:由数据处理加速器集群中的每个数据处理加速器从主机设备的驱动器接收专用于数据处理加速器的配置指令,以将数据处理加速器配置为加入集群中的数据处理加速器子群组中或离开集群中的数据处理加速器子群组。数据处理加速器根据配置指令配置每个数据处理加速器可包括:响应于指示数据处理加速器加入数据处理加速器子群组的指令,由数据处理加速器生成到子群组中的至少一个数据处理加速器的通信链路,以及响应于指示数据处理加速器离开数据处理加速器子群组的指令,断开数据处理加速器和子群组中的所有数据处理加速器之间的通信链路。
[0009]本申请的又一方面提供了存储有计算机指令的非瞬时计算机可读存储介质,计算机指令可使计算机执行操作:由数据处理加速器集群中的数据处理加速器从主机设备的驱动器接收专用于数据处理加速器的配置指令,以将数据处理加速器配置为加入集群中的数据处理加速器子群组中或离开集群中的数据处理加速器子群组。根据配置指令配置数据处理加速器可包括:响应于指示数据处理加速器加入数据处理加速器子群组的指令,由数据处理加速器生成到子群组中的至少一个数据处理加速器的通信链路,以及响应于指示数据处理加速器离开数据处理加速器子群组的指令,断开数据处理加速器和子群组中的所有数据处理加速器之间的通信链路。
[0010]本申请的又一方面提供了一种计算机程序产品,其上存储有计算机程序,其中,当上述计算机程序在被处理器执行时,使得处理器:由数据处理加速器集群中的数据处理加速器从主机设备的驱动器接收专用于数据处理加速器的配置指令,以将数据处理加速器配置为加入集群中的数据处理加速器子群组中或离开集群中的数据处理加速器子群组。根据配置指令配置数据处理加速器可包括:响应于指示数据处理加速器加入数据处理加速器子群组的指令,由数据处理加速器生成到子群组中的至少一个数据处理加速器的通信链路,以及响应于指示数据处理加速器离开数据处理加速器子群组的指令,断开数据处理加速器和子群组中的所有数据处理加速器之间的通信链路。
附图说明
[0011]本公开的实施例在附图的各个图中以示例的方式而不是限制的方式示出,其中,在附图中相同的附图标记表示类似的元件。
[0012]图1是示出根据一个实施例的安全处理系统的框图。
[0013]图2A和图2B是示出根据一个实施例的一个或多个主机与一个或多个数据处理加速器之间的安全计算环境的框图。
[0014]图3是示出根据实施例的控制数据处理加速器集群的主机的框图,每个数据处理加速器具有保护资源和非保护资源。
[0015]图4是示出根据实施例的保护根据策略划分的数据处理加速器集群中的数据的方
法的框图。
[0016]图5A和图5B是示出根据实施例的保护根据策略划分的数据处理加速器集群中的数据的方法的框图。
[0017]图6是示出根据实施例的使用针对加速器的资源划分来保护数据处理加速器集群中的数据的方法的框图。
[0018]图7A和图7B是示出根据实施例的使用加速器的动态划分来保护数据处理加速器集群中的数据的方法的框图。
[0019]图8是示出根据实施例的使用数据处理加速器的认证来保护数据处理加速器集群中的数据的方法的框图。
[0020]图9是示出根据实施例的认证数据处理加速器的方法的框图。
具体实施方式
[0021]将参考以下讨论的细节来描述本公开的各种实施例和方面,并且附图将示出各种实施例。以下描述和附图是本公开的示例,而不应被解释为限制本公开。描述了许多具体细节以提供对本公开的各种实施例的透彻理解。然而,在某本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种配置通信地联接到主机设备的多个数据处理加速器的计算机实现的方法,所述方法包括:由数据处理加速器集群中的数据处理加速器从所述主机设备的驱动器接收专用于所述数据处理加速器的配置指令,以将所述数据处理加速器配置为加入所述集群中的数据处理加速器子群组中或离开所述集群中的数据处理加速器子群组;根据所述配置指令配置所述数据处理加速器,包括:响应于指示所述数据处理加速器加入所述数据处理加速器子群组的指令,由所述数据处理加速器生成到所述子群组中的至少一个数据处理加速器的通信链路,以及响应于指示所述数据处理加速器离开所述数据处理加速器子群组的指令,断开所述数据处理加速器和所述子群组中的所有数据处理加速器之间的通信链路。2.根据权利要求1所述的方法,其中,当完成对所述集群中的所有数据处理加速器的配置时,所述数据处理加速器通信地链接到所述集群中的多个数据处理加速器子群组中的一个子群组,或者所述数据处理加速器不通信地链接到子群组。3.根据权利要求2所述的方法,其中,响应于确定所述数据处理加速器不通信地链接到子群组,将所述数据处理加速器设置为低功率状态。4.根据权利要求2所述的方法,其中,每个子群组被分配成针对特定用户执行一个或多个计算任务。5.根据权利要求2所述的方法,其中,所述子群组是非重叠的。6.根据权利要求2所述的方法,还包括:响应于确定所述数据处理加速器被指示加入不同的子群组,断开与先前子群组的通信链路,并生成到所述不同的子群组的数据处理加速器的通信链路;以及响应于确定所述数据处理加速器处于低功率状态并且所述数据处理加速器被指示加入子群组,所述数据处理加速器被加电以脱离所述低功率状态,并且生成到所述子群组中的至少一个数据处理加速器的通信链路。7.根据权利要求6所述的方法,还包括:响应于确定先前被分配到子群组的所述数据处理加速器不再分配到所述子群组,断开与所述集群中的其它数据处理加速器的所有通信链路并将所述数据处理加速器设置成所述低功率状态。8.一种数据处理加速器,包括链路配置模块,所述链路配置模块用于:从主机设备的驱动器接收专用于所述数据处理加速器的配置指令,以将所述数据处理加速器配置为加入集群中的数据处理加速器子群组中或离开所述集群中的数据处理加速器子群组,其中,所述数据处理加速器是所述集群中的数据处理加速器中的一个;根据所述配置指令配置所述数据处理加速器,包括:响应于指示所述数据处理加速器加入数据处理加速器子群组的指令,由所述数据处理加速器生成到所述子群组中的至少一个数据处理加速器的通信链路,以及响应于指示所述数据处理加速器离开数据处理加速器子群组的指令,断开所述数据处理加速器和所述子群组中的所有数据处理加速器之间的通信链路。9.根据权利要求8所述的数据处理加速器,其中,当完成对所述集群中的所有数据处理加速器的配置时,所述数据处理加速器通信地链接到所述集群中的多个数据处理加速器子
群组中的一个子群组,或者所述数据处理加速器不通信地链接到子群组。10.根据权利要求9所述的数据处理加速器,其中,响应于确定所述数据处理加速器不通信地链接到子群组,将所述数据处理加速器设置为低功率状态。11.根据权利要求9所述的数据处理加速器,其中,每个子群组被分配成针对特定...

【专利技术属性】
技术研发人员:程越强朱贺飞
申请(专利权)人:昆仑芯北京科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1