一种模型调度方法技术

技术编号：39573935 阅读：11 留言：0更新日期：2023-12-03 19:25

本申请实施例提供一种模型调度方法

全部详细技术资料下载

【技术实现步骤摘要】
一种模型调度方法、设备及存储介质

[0001]本申请涉及深度学习
，尤其涉及一种模型调度方法
、
设备及存储介质
。

技术介绍

[0002]随着视觉
AI
的普遍应用，部署一种模型已经很难满足应用需求，尤其是在高帧率高精度的检测和识别场景中，比如客流识别场景，终端既要实现高精度的检测跟踪，又要实现数据的择优和提特征，往往需要部署多种模型来支持日益复杂的应用需求
。
[0003]目前，由于
NPU(Neural
‑
network Processing Unit
，神经网络处理单元
)
具有独占性，因此需要采用串行的方式来调用模型，也即是依次执行多个模型，这导致在输入帧率要求较高的情况下为了满足帧率不得不压缩模型耗时，造成模型精度的降低，或者在模型精度要求较高的情况下为了保证精度则不得不降低输入帧率
。
无论是那种情况，最终产生的处理结果的质量并不佳
。

技术实现思路

[0004]本申请的多个方面提供一种模型调度方法
、
设备及存储介质，用以提升多模型场景下的处理结果质量
。
[0005]本申请实施例提供一种模型调度方法，包括：
[0006]按照预置处理频率触发指定的起始模型对源数据进行处理；
[0007]根据所述预置处理频率计算所述起始模型对应的触发间隔时间，以确定剩余模型在所述触发间隔时间内可占用的可用时段；
[...

【技术保护点】

【技术特征摘要】
1.
一种模型调度方法，包括：按照预置处理频率触发指定的起始模型对源数据进行处理；根据所述预置处理频率计算所述起始模型对应的触发间隔时间，以确定剩余模型在所述触发间隔时间内可占用的可用时段；在所述起始模型产生的可用时段内，基于预设的调度策略确定各个剩余模型的触发时机，以控制各个剩余模型配合所述起始模型完成每个源数据的处理工作
。2.
根据权利要求1所述方法，还包括：创建存在先后关系的多个调度任务，其中，待调度的多个模型按组分布在所述多个调度任务下，所述起始模型分布在起始调度任务下；所述在所述起始模型产生的可用时段内，基于预设的调度策略确定各个剩余模型的触发时机，包括：利用所述多个调度任务，在所述起始模型产生的可用时段内基于预设的调度策略确定各个剩余模型的触发时机
。3.
根据权利要求2所述的方法，所述利用所述多个调度任务，在所述起始模型产生的可用时段内基于预设的调度策略确定各个剩余模型的触发时机，包括：在所述起始调度任务下的模型组执行完毕后，计算所述可用时段中的剩余时段；向所述起始调度任务的下一个调度任务发送触发信号，以触发所述下一个调度任务基于所述调度策略确定其下分布的模型组内各模型的触发时机；若所述下一个调度任务下的模型组执行完毕后所述剩余时段未消耗完，则继续向后续的调度任务发送触发信号，直至所述剩余时段消耗完
。4.
根据权利要求3所述的方法，还包括：若所述起始调度任务下的模型组中仅包含所述起始模型，则将所述可用时段作为所述剩余时段；若所述起始调度任务下的模型组中包含多个模型，则从所述可用时段中减掉除所述起始模型之外的其它模型的耗时后所剩余的时段，作为所述剩余时段
。5.
根据权利要求1所述的方法，所述调度策略包括：优先触发已执行次数落后的模型；优先触发优先级更高的模型；和
/
或优先触发耗时更长的模型
。6.
根据权利要求1所述的方法，所述按照预置处理频率触发指定的起始模型对源数据进行处理，包括：按照所述预置处理频率从输入数据中提取源数据；按照所述预置处理频率将提取到的源数据输入所述起始模型，以触发所述起始模型对接收到的源数据进行处理
。7.
根据权利要求1所述的方法，所述根据所述预置处理...

【专利技术属性】
技术研发人员：张文杰，
申请(专利权)人：阿里云计算有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人