异构智能计算系统技术方案

技术编号:24168445 阅读:48 留言:0更新日期:2020-05-16 02:10
本发明专利技术提供了一种异构智能计算系统,包括:计算模块:对待处理数据进行计算;IO模块:将各接口进行连线;风扇模块:控制转速;电源模块:提供能源并进行自检;管理模块:对机箱风扇模块和电源模块进行管理;监控模块:对所有模块进行监控和维护。本发明专利技术减少了数据交互次数,从而提高计算效率;对系统中各模块进行监控,便于运维人员及时、方便、快捷的完成对整个数据中心的运营与维护。

Heterogeneous intelligent computing system

【技术实现步骤摘要】
异构智能计算系统
本专利技术涉及通信
,具体地,涉及一种异构智能计算系统。
技术介绍
经过60多年的演进,特别是在移动互联网、大数据、超级计算、传感网、脑科学等新理论新技术以及经济社会发展强烈需求的共同驱动下,人工智能加速发展,呈现出深度学习、跨界融合、人机协同、群智开放、自主操控等新特征。大数据驱动知识学习、跨媒体协同处理、人机协同增强智能、群体集成智能、自主智能系统成为人工智能的发展重点,受脑科学研究成果启发的类脑智能蓄势待发,芯片化硬件化平台化趋势更加明显,人工智能发展进入新阶段。近两年国内的人工智能处理器也如火如荼,如百度AI开发者大会正式发布Dueros语音系统,无人驾驶平台Apollo1.0自动驾驶平台;华为发布全球第一款AI移动芯片麒麟970。最为知名的寒武纪深度神经网络处理器架构采用硬件神经元和硬件突触作为运算器,并为神经网络的高速连接设计了存储结构,另外还专门设计了与通用处理器完全不同的指令集。最新推出的寒武纪-1A(Cambricon-1A)商用智能处理器IP产品,可集成至各类终端SoC芯片,每秒可处理160亿个虚拟神经元,每秒峰值运算能力达2万亿虚拟突触,性能比通用处理器高两个数量级,功耗降低了一个数量级。该处理器荣获第三届世界互联网大会“世界互联网领先科技成果”奖项。寒武纪还描述了其未来三年的发展路线图:力争在3年后占据中国高性能芯片30%的市场份额,并使得全世界10亿台以上的智能终端集成寒武纪处理器,打造中国主导的高性能芯片新生态。作为寒武纪的投资方,联想集团将与寒武纪共同开发人工智能服务器产品,共同推进智能互联网的发展。继2015年推出“数据中国”战略之后,中科曙光在重大战略方面的新举措。中科曙光方面介绍称,目标是通过先进、高效的智能计算,让数据变成智慧知识和智能服务能力。具体行动方面,曙光试图打造完整的人工智能计算产品线,支持适用于不同应用场景的多种芯片,同时促进高性能计算、大数据、云计算和深度学习等多元计算模式的深入融合。一方面是产品,曙光正式推出“全浸没式液冷AI训练专用服务器”。这是针对AI服务器集群存在的高耗能、空间部署密度低、高噪音等痛点给出的产品方案。该服务器在效能上,可以实现相较节电40%的效果,同时可以消除对数据中心运维环境和科研办公室噪音污染等困扰。此外,曙光还联手中科院“兄弟公司”寒武纪,研发推出“全球首款基于寒武纪芯片的AI推理专用服务器”Phaneron。Phaneron在硬件神经元虚拟化、寒武纪深度学习指令集、Caffe、Mxnet、TensorFlow等支持和应用方面,都会有不俗表现。在提供AI计算硬件的基础上,曙光推出了人工智能管理平台—“SothisAI”。“SothisAI”主打异构融合、简单易用、弹性灵活、可快速部署等,希望协助用户快速释放AI所需的计算力。在AI应用层面,曙光推出了“超大规模公共安全视频内容分析系统”,该系统的核心特点是深度整合N+1层神经网络、万路大规模视频并发处理和10万亿数据秒级查询响应等。除了安防,曙光的AI相关产品还被部署在互联网、广媒娱乐、制造与自动化、金融、医疗、环境、物流交通、零食和新业应用等领域。2017年7月12日,浪潮发布了新一代M5服务器家族,其中最引人瞩目的莫过于号称全球首款2U8NVLinkTMGPU密度最高、性能最强的AI服务器NF5288M5。这款产品是浪潮与NVDIA联合研发的创新计算平台,能满足AI云、深度学习模型训练和线上推理等各类AI应用场景对计算架构性能、功耗的不同需求。该服务器在2U的计算节点里边集成八颗NVLink的P100/V100GPU,这是目前业界计算密度最高的一个平台了。浪潮还设计了弹性扩展的GPU与计算节点分离的平台,可以面向不同的AI计算的应用类型,比如语音识别和图像识别,比如面向视频流的识别,面向文字的识别。它对通用处理器和加速器的配比会有不同的需求,对系统的带宽会有不同的需求,对存储会有不同的需求,对内存、缓存能力的需要也会有不同的需求。在一些具体的运维环境里面,浪潮也做了一些新的创新,比如说和百度合作了可以插16个GPU卡的GPUBox,实际上这是可以解耦的一个平台,可以通过GPUBox里边不同的分区,把16个GPU分散给不同的节点,来实现面向不同的应用的灵活性。浪潮也对基于FPGA的一些AI算法应用进行了实践。AI有两大应用,一类是训练,一类是识别。对于训练,在一些数据中心服务应用里面,FPGA是一个非常好的实现。从定制化的角度来看,定制的ASIC可能是更好的办法,会有更高的性能功耗比,但是针对到某一个具体的应用上,面临着能不能达到做一个芯片的经济规模,或者说我们能不能在有限的时间内快速部署的问题。嵌入式设备并不总是独立作战,一些计算复杂度较高的任务会采用“云+端”的处理架构,一个例子是锤子手机新品发布会上演示的科大讯飞输入法,通过语音输入转换为文字,准确率达97%,其背后是基于深度学习的语音识别系统,单纯依靠移动端是难以实现的,即使实现了也会有诸如手机发烫、电池不够用等问题,将任务合理分工,“云+端”协作完成复杂任务,可以大幅提升用户体验。异构智能计算平台是人工智能时代占领战略制高点的核心技术,本研究内容面向新型数据中心基础设施对人工智能和大数据等新型应用需求,采用自主可控软硬件技术体制,运用先进的异构协同高效能体系结构,研究基于国产多核/众核处理器+协处单元加速部件相融合的高效能异构并行智能处理架构,研制基于国产多核/众核CPU的高性能服务器硬件基础平台、高效能可重构的AI智能计算协处理加速单元(IntelligenceProcessingUnit,IPU)、高效能AI软件运行和支撑框架等,并在上述成果基础上研制形成国产自主可控异构智能计算平台,并实现基于典型人工智能算法的应用验证。面向军事装备智能、新疆反恐等国家重大安全需求开展应用移植,适度定制自主可控异构智能计算平台解决方案。自主可控异构智能计算平台是面向新一代人工智能的基础设施。它针对人工智能和大数据等新型应用需求,采用自主可控软硬件技术体制,运用先进的异构协同高效能体系结构,研制基于国产多核/众核处理器+协处单元加速部件相融合的高效能异构并行智能处理架构和高效能人工智能计算基础设施。专利文献CN206489563U(申请号:201720117916.4)公开了一种异构计算系统,属于数据处理领域。该系统包括管理服务器、HUB、集中式运算集群和分布式运算集群;分布式运算集群包括n种计算卡,每个普通计算机至少包括一种计算卡;集中式运算集群中包括n种计算卡,每个服务器至少包括一种计算卡;管理服务器通过HUB与各个普通计算机建立间歇性通信连接;管理服务器通过HUB与各个服务器建立持续性通信连接
技术实现思路
针对现有技术中的缺陷,本专利技术的目的是提供一种异构智能计算系统。根据本专利技术提供的异构智能计算系统,包括:计算模块:对待处理数据进行计算;IO模块:将各接口进行连线;风扇模块:控制转速;电源模本文档来自技高网
...

【技术保护点】
1.一种异构智能计算系统,其特征在于,包括:/n计算模块:对待处理数据进行计算;/nIO模块:将各接口进行连线;/n风扇模块:控制转速;/n电源模块:提供能源并进行自检;/n管理模块:对机箱风扇模块和电源模块进行管理;/n监控模块:对所有模块进行监控和维护。/n

【技术特征摘要】
1.一种异构智能计算系统,其特征在于,包括:
计算模块:对待处理数据进行计算;
IO模块:将各接口进行连线;
风扇模块:控制转速;
电源模块:提供能源并进行自检;
管理模块:对机箱风扇模块和电源模块进行管理;
监控模块:对所有模块进行监控和维护。


2.根据权利要求1所述的异构智能计算系统,其特征在于,所述计算模块包括通用计算模块和异构计算模块;
所述通用计算模块、异构计算模块和IO模块,根据高速串行计算机扩展总线标准PCIe进行连接,形成统一的计算节点;
所述计算节点包括全宽节点和半宽节点;
所述计算节点包括通用计算节点和异构计算节点。


3.根据权利要求2所述的异构智能计算系统,其特征在于,在计算节点上进行拓扑配置,得到全宽节点级联型拓扑,包括:CPU和GPU的比例为1:8,支持GPUDirectRDMA和8个GPU之间P2P,包括:配置Teslav100GPU,通过NVlink实现。


4.根据权利要求2所述的异构智能计算系统,其特征在于,在计算节点上进行拓扑配置,得到全宽节点均衡型拓扑,包括:CPU和GPU的比例或者CPU和IPU的比例为1:4,支持GPUDrectRDMA与4个GPU或者IPU之间P2P,包括:配置Teslav100GPU,通过NVlink实现;或者配置IPU通过NoC实现。


5.根据权利要求2所述的异构智能计算系统,其特征在于,在计算节点上进行拓扑配置,得到半宽节点级联型拓扑,包括:支持16张半高半长的GPU或IPU卡,CPU与GPU的比例或者CPU与IPU的比例为1:8。


6.根据权利要求2所述的异构智能计算系统,其特征在于,所述计算节点包括:两...

【专利技术属性】
技术研发人员:尹家伟冒睿瑞张浩博高明柯王熠
申请(专利权)人:华东计算技术研究所中国电子科技集团公司第三十二研究所
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1