人工智能训练卡、人工智能服务器和专用处理卡制造技术

技术编号:24327560 阅读:105 留言:0更新日期:2020-05-29 18:33
本申请提供一种人工智能训练卡、人工智能服务器和专用处理卡。人工智能训练卡包括互联芯片、人工智能芯片和网络芯片。人工智能芯片与互联芯片连接,通过互联芯片接受训练任务,并执行训练任务。网络芯片通过互联芯片与人工智能芯片连接。

AI training card, AI server and special processing card

【技术实现步骤摘要】
人工智能训练卡、人工智能服务器和专用处理卡
本申请涉及人工智能,尤其涉及一种人工智能训练卡、人工智能服务器和专用处理卡。
技术介绍
人工智能(ArtificialIntelligence,简称AI)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能的过程包括感知、决策、反馈三个阶段,任何一个阶段的短板都直接限制着人工智能技术的普及应用。随着人工智能技术的发展,人工智能技术逐渐被应用于各种领域。
技术实现思路
本申请提供一种人工智能训练卡、人工智能服务器和专用处理卡,可以实现大规模模型的训练。本申请的一个方面提供一种人工智能训练卡,包括:互联芯片;人工智能芯片,与所述互联芯片连接,通过所述互联芯片接受训练任务,并执行训练任务;及网络芯片,通过所述互联芯片与所述人工智能芯片连接。进一步地,互联芯片包括PCIE交换芯片。进一步地,所述人工智能训练卡包括与所述互联芯片连接的主接口,所述主接口包括PCIE接口,接收训练任务。进一步地,所述人工智能训练卡包括电源接口和与所述电源接口连接的电源转换模块,所述电源转换模块连接所述人工智能芯片、所述互联芯片和所述网络芯片,对通过所述电源接口输入的电进行转换,提供所述人工智能芯片、所述互联芯片和所述网络芯片所需的工作电压。进一步地,所述电源转换模块包括第一电源转换器,所述第一电源转换器连接所述电源接口和所述人工智能芯片,给所述人工智能芯片供电。进一步地,所述电源转换模块包括第二电源转换器,所述第二电源转换器连接所述电源接口,且连接所述互联芯片和所述网络芯片,给所述互联芯片和所述网络芯片供电。进一步地,所述人工智能训练卡包括主接口和与主接口连接的选路模块,所述选路模块连接所述人工智能芯片、所述互联芯片和所述网络芯片。进一步地,所述选路模块包括I2C接口和UART接口中的至少一种。进一步地,所述人工智能训练卡包括温度传感器、模数转换模块和信息存储模块中的至少一个。本申请另一个方面提供一种人工智能服务器,包括:人工智能训练卡;及主板,设置有控制器,所述控制器与所述人工智能训练卡连接,下发训练任务。本申请另一个方面提供一种专用处理卡,包括:互联芯片;处理芯片,与所述互联芯片连接,通过所述互联芯片接受处理任务,并执行处理任务;及网络芯片,通过所述互联芯片与所述处理芯片连接。本申请人工智能芯片通过互联芯片接收训练任务,并通过网络芯片与其他人工智能单元通信,以实现集群式训练,使采用人工智能训练卡的人工智能服务器可以实现大规模模型的训练。附图说明图1所示为本申请人工智能服务器的一个实施例的通信模块示意图;图2所示为图1所示的人工智能服务器的人工智能训练卡的一个实施例的供电示意图;图3所示为图1所示的人工智能训练卡的一个实施例的管理监控逻辑示意图;图4所示为本申请人工智能训练卡的一个实施例的结构示意图;图5所示为本申请人工智能训练卡的一个实施例的系统集群组网示意图;图6所示为本申请专用处理卡的一个实施例的示意图。具体实施方式这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置的例子。在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。除非另作定义,本申请使用的技术术语或者科学术语应当为本专利技术所属领域内具有一般技能的人士所理解的通常意义。本申请说明书以及权利要求书中使用的“第一”“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。同样,“一个”或者“一”等类似词语也不表示数量限制,而是表示存在至少一个。“多个”或者“若干”等类似词语表示两个及两个以上。“包括”或者“包含”等类似词语意指出现在“包括”或者“包含”前面的元件或者物件涵盖出现在“包括”或者“包含”后面列举的元件或者物件及其等同,并不排除其他元件或者物件。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接,而且可以包括电性的连接,不管是直接的还是间接的。在本申请说明书和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。本申请实施例的人工智能训练卡包括互联芯片、人工智能芯片和网络芯片。人工智能芯片与互联芯片连接,通过互联芯片接受训练任务,并执行训练任务。网络芯片通过互联芯片与人工智能芯片连接。人工智能芯片通过互联芯片接收训练任务,并通过网络芯片与其他人工智能单元通信,例如另一张人工智能训练卡、人工智能服务器的其他人工智能单元或其他人工智能服务器等,以实现集群式训练,可以使采用人工智能训练卡的人工智能服务器能够实现大规模模型的训练。人工智能服务器可以利用多张人工智能训练卡,分别进行多个训练任务的训练,如此利用足够数量的人工智能训练卡,可以实现大规模模型的训练,完成并发的海量训练任务,实现快速迭代演进,提高人工智能计算能力。图1所示为人工智能服务器100的一个实施例的通信模块示意图。人工智能服务器100包括人工智能训练卡200和主板300。人工智能服务器100包括一张或多张人工智能训练卡200。图中仅示意性地示出一张人工智能训练卡200。人工智能训练卡200可以实现模型训练。主板300设置有控制器301,控制器301与人工智能训练卡200连接,下发训练任务。控制器301可以包括中央处理器。在需要大规模模型训练的应用中,人工智能服务器100包括多张人工智能训练卡200,甚至可以包括数量较大的人工智能训练卡200,以满足大规模模型训练的需求。控制器201并发大量的训练任务,可以分配给足够数量的人工智能训练卡200,分别执行训练任务。人工智能训练卡200包括互联芯片201、人工智能芯片202和网络芯片203。人工智能芯片202与互联芯片201连接,通过互联芯片201接受训练任务,并执行训练任务。网络芯片203通过互联芯片201与人工智能芯片202连接。人工智能芯片202通过互联芯片201接收训练任务,并通过网络芯片203与其他人工智能单元通信,例如人工智能服务器的其他人工智能单元、另一张人工智能训练卡、或其他人工智能服务器等,以实现集群式训练,可以使采用人工智能训练卡200的人工智能服务器100能够实现大规模模型的训练。在一个实施例中,人工智能芯片202训练后的数据可以发送到下一级的人工智能训练卡,多级人工智能训练卡可组成人工智能训练集群。在一些实施例中,人工智能服务器100可以利用多张人工智能训练卡200,分别进行多个训练任务的训练,如此利用足够数本文档来自技高网...

【技术保护点】
1.一种人工智能训练卡,包括:/n互联芯片;/n人工智能芯片,与所述互联芯片连接,通过所述互联芯片接受训练任务,并执行训练任务;及/n网络芯片,通过所述互联芯片与所述人工智能芯片连接。/n

【技术特征摘要】
1.一种人工智能训练卡,包括:
互联芯片;
人工智能芯片,与所述互联芯片连接,通过所述互联芯片接受训练任务,并执行训练任务;及
网络芯片,通过所述互联芯片与所述人工智能芯片连接。


2.如权利要求1所述的人工智能训练卡,其特征在于:所述互联芯片包括PCIE交换芯片。


3.如权利要求2所述的人工智能训练卡,其特征在于:所述人工智能训练卡包括与所述互联芯片连接的主接口,所述主接口包括PCIE接口,接收训练任务。


4.如权利要求1所述的人工智能训练卡,其特征在于:所述人工智能训练卡包括电源接口和与所述电源接口连接的电源转换模块,所述电源转换模块连接所述人工智能芯片、所述互联芯片和所述网络芯片,对通过所述电源接口输入的电进行转换,提供所述人工智能芯片、所述互联芯片和所述网络芯片所需的工作电压。


5.如权利要求4所述的人工智能训练卡,其特征在于:所述电源转换模块包括第一电源转换器,所述第一电源转换器连接所述电源接口和所述人工智能芯片,给所述人工智能芯片供电。


6.如权利要求4所述的人工智能训...

【专利技术属性】
技术研发人员:郭锐王刚张胜刘向东
申请(专利权)人:阿里巴巴集团控股有限公司
类型:新型
国别省市:开曼群岛;KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1