一种多用户多出口DNN推理分区与任务调度方法技术

技术编号：44584942 阅读：21 留言：0更新日期：2025-03-14 12:45

一种多用户多出口DNN推理分区与任务调度方法，在每个用户设备和边缘服务器上都部署了经过训练的多出口DNN模型，在一段时隙内，任务到达用户设备满足泊松分布并被存储在用户设备的任务队列中；以策略可行性区间为约束，以任务的出口点、分区点以及调度决策为优化变量，建立以最大化一段时隙内任务推理的总完成率和推理准确率为目标的优化问题P；将问题解耦为服务器调度优化问题P1，建立服务器任务的图模型，使用双贪心算法求解问题P1；再将问题简化为P2，建立马尔可夫决策过程，使用多智能体强化学习算法求解最优策略。本发明专利技术适用于多用户设备进行多出口DNN推理分区，能有效提高一段时间内的任务完成率和推理准确率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于边缘智能，用于多用户场景下协同边缘服务器对多出口深度神经网络(deep neural network,dnn)推理进行分区与任务调度的方法。该方法通过对复杂任务的数据预测计算，建立服务器的任务模型，制定出接近最优的出口、分区以及调度决策，从而最大化任务完成率和推理准确率。

技术介绍

1、为了应对资源受限环境中应用dnn的挑战，研究者们开始深入探索将部分dnn推理任务卸载到边缘服务器上，从而减少边缘设备的计算量，提高网络推理效率和资源利用率，使dnn能够更高效地适应资源受限的边缘设备。在边缘智能环境中，将dnn推理任务在本地设备和边缘设备之间智能的分割协作处理，可以使得dnn模型根据不同计算设备和网络环境进行灵活部署，提高推理过程的整体效率。同时，提前退出机制作为一种有效的优化策略，可以在网络架构中设置多个中间出口，根据输入任务的复杂程度，在保持可接受推理准确率的前提下，提前终止部分推理任务，减少不必要的计算量，降低传输给边缘服务器的任务负载。

2、现有的研究大多考虑推理任务结构上的优化，但随着dnn计算需求的激...

【技术保护点】

1.一种多用户多出口DNN推理分区与任务调度方法，其特征在于，在每个用户设备和边缘服务器上都部署了经过训练的多出口DNN模型，在一段时隙内，任务到达用户设备满足泊松分布并被存储在用户设备的任务队列中；以策略可行性区间为约束，以任务的出口点、分区点以及调度决策为优化变量，建立以最大化一段时隙内任务推理的总完成率和推理准确率为目标的优化问题P；将问题解耦为服务器调度优化问题P1，建立服务器任务的图模型，使用双贪心算法求解问题P1；再将问题简化为P2，建立马尔可夫决策过程，使用多智能体强化学习算法求解最优策略。

2.如权利要求1所述的一种多用户多出口DNN推理分区与任务调度方法，其...

【技术特征摘要】

1.一种多用户多出口dnn推理分区与任务调度方法，其特征在于，在每个用户设备和边缘服务器上都部署了经过训练的多出口dnn模型，在一段时隙内，任务到达用户设备满足泊松分布并被存储在用户设备的任务队列中；以策略可行性区间为约束，以任务的出口点、分区点以及调度决策为优化变量，建立以最大化一段时隙内任务推理的总完成率和推...

【专利技术属性】
技术研发人员：田贤忠，李玉诚，毛旭华，
申请(专利权)人：浙江工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人