【技术实现步骤摘要】
数据处理装置及相关产品
本申请涉及信息处理
,特别是涉及一种数据处理装置及相关产品。
技术介绍
随着目前机器学习的不断发展,越来越多的多架构的机器学习芯片逐渐问世,这些机器学习芯片在访问或者处理存储器中的数据时,由于机器学习芯片所需的数据量大,且机器学习芯片对数据处理的速度要求高。常见的机器学习芯片通常包括主运算单元和从运算单元,主处理单元在同一时刻,分别向多个从处理单元传输机器学习数据及运算指令,多个从处理单元根据获得的传输机器学习数据及运算指令,执行机器学习运算。采用上述方法,主处理单元与各从处理单元之间均进行数据传输,需要占用大量的传输接口,使得机器学习芯片的硬件开销大。
技术实现思路
本申请实施例提供了一种数据处理装置及相关产品,可以降低机器学习芯片的硬件开销。第一方面,一种数据处理装置,所述数据处理装置用于执行机器学习数据的处理,所述数据处理装置包括:主处理单元和至少一个从处理单元组,所述从处理单元组包括共享从处理单元和至少一个并行从处理单元;所述主处理单元 ...
【技术保护点】
1.一种数据处理装置,其特征在于,所述数据处理装置用于执行机器学习数据的处理,所述数据处理装置包括:主处理单元和至少一个从处理单元组,所述从处理单元组包括共享从处理单元和至少一个并行从处理单元;/n所述主处理单元,用于将机器学习数据拆分为共享数据和至少两个并行计算数据,向所述共享从处理单元发送所述共享数据,并根据预设的两个时钟周期内分别向各所述并行从处理单元发送所述并行计算数据;/n所述共享从处理单元,用于接收所述共享数据,并将所述共享数据传输给各所述并行从处理单元;/n所述并行从处理单元,用于在第一个时钟周期内接收第一并行数据、在第二个时钟周期内接收第二并行数据,并将所述 ...
【技术特征摘要】
1.一种数据处理装置,其特征在于,所述数据处理装置用于执行机器学习数据的处理,所述数据处理装置包括:主处理单元和至少一个从处理单元组,所述从处理单元组包括共享从处理单元和至少一个并行从处理单元;
所述主处理单元,用于将机器学习数据拆分为共享数据和至少两个并行计算数据,向所述共享从处理单元发送所述共享数据,并根据预设的两个时钟周期内分别向各所述并行从处理单元发送所述并行计算数据;
所述共享从处理单元,用于接收所述共享数据,并将所述共享数据传输给各所述并行从处理单元;
所述并行从处理单元,用于在第一个时钟周期内接收第一并行数据、在第二个时钟周期内接收第二并行数据,并将所述第一并行数据传输给上一级并行从处理单元,或者,所述共享从处理单元。
2.根据权利要求1所述装置,其特征在于,所述主处理单元,具体用于在第一个时钟周期向所述共享从处理单元发送所述共享数据,向各所述并行从处理单元发送所述第一并行计算数据;在第二个时钟周期向最后一级并行从处理单元发送所述第二并行计算数据。
3.根据权利要求2所述装置,其特征在于,所述共享从处理单元,具体用于在所述第一个时钟周期接收所述共享数据,在所述第二个时钟周期向各所述并行从处理单元广播所述共享数据,并在所述第二个时钟周期接收第一级并行从处理单元发送的所述第一并行计算数据。
4.根据权利要求2所述装置,其特征在于,所述共享从处理单元还用于根据所述共享数据和所述第一级并行从处理单元发送的并行计算数据,进行中间运算,得到中间结果,并将所述中间结果传输给所述主处理单元;
所述并行从处理器还用于根据所述共享数据和所述并行计算数据,进行中间运算,得到所述中间结果,并...
【专利技术属性】
技术研发人员:不公告发明人,
申请(专利权)人:上海寒武纪信息科技有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。