一种作业的处理方法、设备及介质技术

技术编号：32247242 阅读：9 留言：0更新日期：2022-02-09 17:50

本申请提供了一种作业的处理方法、设备及介质，涉及计算机技术领域，该方法包括接收待处理的作业，该作业包括多个计算任务，多个计算任务中的每个计算任务对应至少一个算子，然后根据算子与计算单元的对应关系，确定多个计算任务中每个计算任务对应的计算单元，当多个计算任务中的第一计算任务和第二计算任务对应的计算单元的类型不同时，根据作业的输入规模，确定计算单元的计算模式，接着将多个计算任务调度至对应的计算单元，并通过计算单元按照计算模式对作业进行处理。因此，该方法能够提高作业的处理效率，进而提高人工智能模型的推理效率。推理效率。推理效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种作业的处理方法、设备及介质

[0001]本申请涉及计算机
，尤其涉及一种作业的处理方法、设备、计算机存储介质及计算机程序产品。

技术介绍

[0002]随着计算机技术尤其是人工智能（artificial intelligence，AI）技术的发展，AI应用已经广泛用于目标检测、语音识别、人脸识别等领域。AI应用通常是基于AI模型，例如是深度神经网络模型进行推理，以实现相应的功能。利用深度神经网络模型在进行推理过程中，需要大量的计算资源来对推理作业进行处理。一般地，中央处理器（central processing unit，CPU）、图形处理器（graphics processing unit，GPU）、现场可编程逻辑门阵列（field programmable gate array，FPGA）、专用集成电路（application specific integrated circuit，ASIC）等计算单元能够提供计算资源。
[0003]目前，利用深度神经网络模型在进行推理过程中，通过异构计算的方式对推理作业进行处理，如利用多种计算单元对该推理作业进行协同处理。通常情况下，通过异构计算的方式对推理作业进行协同处理的过程较为固定，例如将推理作业中计算量较大的计算任务（例如利用卷积层提取特征的任务）加载到算力较好的计算单元如GPU进行处理，将推理作业中计算量较小的计算任务（例如进行加减法运算的任务）加载到算力较差的计算单元如CPU进行处理。
[0004]然而，通过异构计算的方式对推理作业进行处理的...

【技术保护点】

【技术特征摘要】
1.一种作业的处理方法，其特征在于，包括：接收待处理的作业，所述作业包括多个计算任务，所述多个计算任务中的每个计算任务对应至少一个算子；根据算子与计算单元的对应关系，确定所述多个计算任务中每个计算任务对应的计算单元；当所述多个计算任务中的第一计算任务和第二计算任务对应的计算单元的类型不同时，根据所述作业的输入规模，确定所述计算单元的计算模式；将所述多个计算任务调度至对应的计算单元，并通过所述计算单元按照所述计算模式对所述作业进行处理。2.根据权利要求1所述的方法，其特征在于，所述输入规模通过输入数据的批尺寸表征；所述根据所述作业的输入规模，确定所述计算单元的计算模式，包括：当所述输入数据的批尺寸小于或等于第一预设阈值时，确定所述计算单元的计算模式为异步模式。3.根据权利要求1所述的方法，其特征在于，所述输入规模通过输入数据的批尺寸表征；所述根据所述作业的输入规模，确定所述计算单元的计算模式，包括：当所述输入数据的批尺寸大于第一预设阈值时，确定所述计算单元的计算模式为同步模式。4.根据权利要求2或3所述的方法，其特征在于，所述方法还包括：当所述输入数据的批尺寸大于第二预设阈值时，将所述输入数据的批尺寸降低至小于或等于所述第二预设阈值，所述第二预设阈值大于所述第一预设阈值。5.根据权利要求1所述的方法，其特征在于，所述通过所述计算单元按照所述计算模式对所述作业进行处理，包括：当所述计算单元的核数为单核时，通过所述计算单元按照所述计算模式对所述作业进行串行处理。6.根据权利要求1所述的方法，其特征在于，所述通过所述计算单元按照所述计算模式对所述作业进行处理，包括：当所述计算...

【专利技术属性】
技术研发人员：邸皓轩，李丹洪，张晓武，
申请(专利权)人：荣耀终端有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人