数据处理方法、装置及设备制造方法及图纸

技术编号:19691361 阅读:47 留言:0更新日期:2018-12-08 11:03
本发明专利技术提供一种数据处理方法、装置及设备。本发明专利技术的方法,通过将所有计算核分为至少两组,每组计算核用于共同执行一个数据帧的深度模型计算任务;CPU调度所述至少两组计算核并行地执行至少两帧数据的深度模型计算任务,实现了在进行一次深度模型计算的过程中,多组计算核并行地执行多帧数据的深度模型计算任务;对于每一组计算核,在对深度模型中不适于多个计算核完成该层计算的层进行计算时,该组内一个计算核负责该层的计算,该组内其他计算核空闲,而其他组的计算核同时在对其他帧数据进行深度模型计算,而不是空闲等待,减少了空闲计算核的数量,提高了计算核的单核利用率,从而提高了AI芯片的整体处理帧率。

【技术实现步骤摘要】
数据处理方法、装置及设备
本专利技术涉及人工智能芯片
,尤其涉及一种数据处理方法、装置及设备。
技术介绍
人工智能(ArtificialIntelligence,简称AI)芯片包括中央处理器(CentralProcessingUnit,简称CPU)和用于深度模型计算的多个计算核,通常用于基于视觉的深度模型的处理。通常深度模型包括多个需计算的层,对于输入深度模型的任意一帧数据,均需要经过逐层地计算。目前,AI芯片中的全部计算核均参与深度模型的每一层的计算。在进行每一层的计算时,CPU将当前层的计算任务划分为多个子任务,由全部计算核并行地完成分配到的子任务,目的是为了提高深度模型计算的效率。但是,深度模型中通常存在若干特殊层的计算任务不适合划分为多个子任务,这种特殊层的计算任务需由一个计算核执行,在该计算核执行其中一特殊层的计算任务期间,其他计算核空闲;需等待该计算核完成该特殊层的计算任务之后,才有可能参与下一个层的计算,造成AI芯片中计算核的单核利用率低,导致AI芯片的深度模型的处理效率低。
技术实现思路
本专利技术提供一种数据处理方法、装置及设备,用以解决现有AI芯片中计算核的单核本文档来自技高网...

【技术保护点】
1.一种数据处理方法,其特征在于,包括:将所有计算核分为至少两组,每组计算核用于共同执行一个数据帧的深度模型计算任务;调度所述至少两组计算核并行地执行至少两帧数据的深度模型计算任务。

【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:将所有计算核分为至少两组,每组计算核用于共同执行一个数据帧的深度模型计算任务;调度所述至少两组计算核并行地执行至少两帧数据的深度模型计算任务。2.根据权利要求1所述的方法,其特征在于,所述至少两组中任意两个分组内计算核的数量均相等;或者,所述至少两组中任意两个分组内计算核数量的差值小于预设数量差。3.根据权利要求2所述的方法,其特征在于,所述将所有计算核分为至少两组,包括:将所述所有计算核分成的组的数量小于预设阈值。4.根据权利要求2所述的方法,其特征在于,所述将所有计算核分为至少两组,包括:将所述所有计算核分为两组或者三组。5.根据权利要求1-4任一项所述的方法,其特征在于,所述调度所述至少两组计算核并行地执行至少两帧数据的深度模型计算任务,包括:在接收到对一帧数据的深度模型计算任务时,调度空闲的一组所述计算核执行所述一帧数据的深度模型计算任务;在接收到对另一帧数据的深度模型计算任务时,调度空闲的另一组所述计算核执行所述另一帧数据的深度模型计算任务。6.根据权利要求1-4任一项所述的方法,其特征在于,所述调度所述至少两组计算核并行地执行至少两帧数据的深度模型计算任务,包括:通过多线程并行地调度所述至少两组计算核,以使每组所述计算核执行一帧数据的深度模型计算任务。7.根据权利要求6所述的方法,其特征在于,通过多线程并行地调度所述至少两组计算核,以使每组所述计算核执行一帧数据的深度模型计算任务,包括:在接收到对一帧数据的深度模型计算任务时,通过第一线程调度空闲的一组所述计算核执行所述一帧数据的深度模型计算任务;在接收到对另一帧数据的深度模型计算任务时,通过第二线程调度空闲的另一组所述计算核执行所述另一帧数据的深度模型计算任务。8.一种数据处理装置,其特征在于,包括:分组模块,用于将所有计算核分为至少两组,每...

【专利技术属性】
技术研发人员:付鹏王奎澎寇浩锋范彦文周强包英泽方阳华何声一
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1