【技术实现步骤摘要】
数据处理方法、装置及设备
本专利技术涉及人工智能芯片
,尤其涉及一种数据处理方法、装置及设备。
技术介绍
人工智能(ArtificialIntelligence,简称AI)芯片包括中央处理器(CentralProcessingUnit,简称CPU)和用于深度模型计算的多个计算核,通常用于基于视觉的深度模型的处理。通常深度模型包括多个需计算的层,对于输入深度模型的任意一帧数据,均需要经过逐层地计算。目前,AI芯片中的全部计算核均参与深度模型的每一层的计算。在进行每一层的计算时,CPU将当前层的计算任务划分为多个子任务,由全部计算核并行地完成分配到的子任务,目的是为了提高深度模型计算的效率。但是,深度模型中通常存在若干特殊层的计算任务不适合划分为多个子任务,这种特殊层的计算任务需由一个计算核执行,在该计算核执行其中一特殊层的计算任务期间,其他计算核空闲;需等待该计算核完成该特殊层的计算任务之后,才有可能参与下一个层的计算,造成AI芯片中计算核的单核利用率低,导致AI芯片的深度模型的处理效率低。
技术实现思路
本专利技术提供一种数据处理方法、装置及设备,用以解决现有A ...
【技术保护点】
1.一种数据处理方法,其特征在于,包括:将所有计算核分为至少两组,每组计算核用于共同执行一个数据帧的深度模型计算任务;调度所述至少两组计算核并行地执行至少两帧数据的深度模型计算任务。
【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:将所有计算核分为至少两组,每组计算核用于共同执行一个数据帧的深度模型计算任务;调度所述至少两组计算核并行地执行至少两帧数据的深度模型计算任务。2.根据权利要求1所述的方法,其特征在于,所述至少两组中任意两个分组内计算核的数量均相等;或者,所述至少两组中任意两个分组内计算核数量的差值小于预设数量差。3.根据权利要求2所述的方法,其特征在于,所述将所有计算核分为至少两组,包括:将所述所有计算核分成的组的数量小于预设阈值。4.根据权利要求2所述的方法,其特征在于,所述将所有计算核分为至少两组,包括:将所述所有计算核分为两组或者三组。5.根据权利要求1-4任一项所述的方法,其特征在于,所述调度所述至少两组计算核并行地执行至少两帧数据的深度模型计算任务,包括:在接收到对一帧数据的深度模型计算任务时,调度空闲的一组所述计算核执行所述一帧数据的深度模型计算任务;在接收到对另一帧数据的深度模型计算任务时,调度空闲的另一组所述计算核执行所述另一帧数据的深度模型计算任务。6.根据权利要求1-4任一项所述的方法,其特征在于,所述调度所述至少两组计算核并行地执行至少两帧数据的深度模型计算任务,包括:通过多线程并行地调度所述至少两组计算核,以使每组所述计算核执行一帧数据的深度模型计算任务。7.根据权利要求6所述的方法,其特征在于,通过多线程并行地调度所述至少两组计算核,以使每组所述计算核执行一帧数据的深度模型计算任务,包括:在接收到对一帧数据的深度模型计算任务时,通过第一线程调度空闲的一组所述计算核执行所述一帧数据的深度模型计算任务;在接收到对另一帧数据的深度模型计算任务时,通过第二线程调度空闲的另一组所述计算核执行所述另一帧数据的深度模型计算任务。8.一种数据处理装置,其特征在于,包括:分组模块,用于将所有计算核分为至少两组,每...
【专利技术属性】
技术研发人员:付鹏,王奎澎,寇浩锋,范彦文,周强,包英泽,方阳华,何声一,
申请(专利权)人:百度在线网络技术北京有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。