The embodiment of the invention provides a data processing device and a server, wherein the data processing device includes a M chip for each node, a node node chip comprises a N chip; the first node chip of the M node chip connected to the first node, the formation of the chip; M, N were 1 integer greater than the first node chip; the first node, from first to M according to the order of the rows, followed by the first communication data transmission and processing; each node chip chip of the each node, according to chip from the first node to the distal point chip sequence, followed by the first communication data transmission and processing. The embodiment of the invention can reduce the transmission time of communication data and improve the data processing efficiency.
【技术实现步骤摘要】
数据处理装置和服务器
本专利技术涉及数据处理技术,尤其涉及一种数据处理装置和服务器。
技术介绍
目前,深度学习是机器学习研究中的一个新的领域,是所有高科技研究和开发中最热门的领域之一,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像,声音和文本。深度学习的关键是DNN(DeepNeuralNetwork,深度神经网络),由于DNN具有深层结构、数千万参数需要学习,因此DNN的预测和训练过程需要巨大的计算能力。通常,通过部署在多个芯片上的计算节点构成DNN,提高DNN的计算能力。在DNN训练过程中,经常需要CPU(中央处理单元)和DNN之间传输Broadcast(广播)消息和Gather(收集)消息。现有技术中,是将所有芯片串联,构成一维芯片链,再将CPU与一维芯片链中的首芯片连接,Broadcast消息由CPU从一维芯片链的首芯片依次传送到一维芯片链的末芯片;Gather消息分别则从一维芯片链的末芯片依次传输到首芯片,再传输给CPU。在实现本专利技术的过程中,专利技术人发现,现有技术一维芯片链至少存在以下问题:当一维芯片链包括的芯片个数较多时,Broadcast和Gather消息分别需要从一维芯片链的一端依次传输到另一端,需要经过较多芯片的转发,需要较长的消息传输时间,从而提升了DNN的数据处理时延,降低了DNN的数据处理效率。
技术实现思路
本专利技术实施例所要解决的其中一个技术问题是,提供一种数据处理装置和服务器,以减少通信数据的传输时间,提高数据处理效率。为解决上述技术问题,根据本专利技术实施例的一个方面,提供一种数据 ...
【技术保护点】
一种数据处理装置,其特征在于,包括M行节点芯片,每行节点芯片包括N个节点芯片;所述M行节点芯片中的首节点芯片依次连接,形成首列节点芯片;其中,M、N分别为大于1的整数;所述首列节点芯片中的各首节点芯片,用于按照从第1行至第M行的顺序,依次传输处理第一通信数据;所述每行节点芯片中的各节点芯片,用于按照从首节点芯片至末节点芯片的顺序,依次传输处理所述第一通信数据。
【技术特征摘要】
1.一种数据处理装置,其特征在于,包括M行节点芯片,每行节点芯片包括N个节点芯片;所述M行节点芯片中的首节点芯片依次连接,形成首列节点芯片;其中,M、N分别为大于1的整数;所述首列节点芯片中的各首节点芯片,用于按照从第1行至第M行的顺序,依次传输处理第一通信数据;所述每行节点芯片中的各节点芯片,用于按照从首节点芯片至末节点芯片的顺序,依次传输处理所述第一通信数据。2.根据权利要求1所述的数据处理装置,其特征在于,所述每行节点芯片中的各节点芯片,还用于按照从末节点芯片至首节点芯片的顺序,依次传输各节点芯片产生的第二通信数据;所述首列节点芯片中的各首节点芯片,还用于按照从第1行至第M行的顺序,依次传输各节点芯片产生的第二通信数据。3.根据权利要求2所述的数据处理装置,所述第1行节点芯片中的首节点芯片设置有与主板连接的第一外部接口,用于通过所述第一外部接口接收主板发送的所述第一通信数据;所述第M行节点芯片中的首节点芯片设置有与主板连接的第二外部接口,用于通过所述第二外部接口向主板发送收集到的所有节点芯片的第二通信数据。4.根据权利要求2所述的数据处理装置,其特征在于,还包括:主机节点芯片,设置有与主板连接的第三外部接口,并分别与所述第1行和第M行节点芯片中的首节点芯片连接,用于通过所述第三外部接口接收主板发送的所述第一通信数据并转发给第1行节点芯片中的首节点芯片,以及接收第M行节点芯片中的首节点芯片收集的、所有节点芯片的第二通信数据并通过所述第三外部接口转发给主板。5.根据权利要求1所述的数据处理装置,其特征在于,所述每行节点芯片中的各节点芯片,还用于按照从末节点芯片至首节点芯片的顺序,依次传输各节点芯片产生的第二通信数据;所述首列节点芯片中的各首节点芯片,还用于按照从第M行至第1行的顺序,依次传输各节点芯片产生的第二通信数据。6.根据权利要求5所述的数据处理装置,其特征在于,所述第1行节点芯片中的首节点芯片设置有与主板连接的第一外部接口,用于通过所述第一外部接口接收主板发送的所述第一通信数据,以及向主板发送收集到的所有节点芯片的第二通信数据。7.根据权利要求5所述的数据处理装置,其特征在于,还包括:主机节点芯片,设置有与主板连接的第三外部接口,并与所述第1行节点芯片中的首节点芯片连接,用于通过所述第三外部接口接收主板发送的所述第一通信数据并转发给第1行节点芯片中的首节点芯片,以及接收第1行节点芯片中的首节点芯片收集的、所有节点芯片的第二通信数据并通过所述第三外部接口转发给主板。8.根据权利要求3、4、6、7任一所述的数据处理装置,其特征在于,所述...
【专利技术属性】
技术研发人员:桂文明,
申请(专利权)人:算丰科技北京有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。