【技术实现步骤摘要】
本专利技术属于边缘智能,用于多用户场景下协同边缘服务器对多出口深度神经网络(deep neural network,dnn)推理进行分区与任务调度的方法。该方法通过对复杂任务的数据预测计算,建立服务器的任务模型,制定出接近最优的出口、分区以及调度决策,从而最大化任务完成率和推理准确率。
技术介绍
1、为了应对资源受限环境中应用dnn的挑战,研究者们开始深入探索将部分dnn推理任务卸载到边缘服务器上,从而减少边缘设备的计算量,提高网络推理效率和资源利用率,使dnn能够更高效地适应资源受限的边缘设备。在边缘智能环境中,将dnn推理任务在本地设备和边缘设备之间智能的分割协作处理,可以使得dnn模型根据不同计算设备和网络环境进行灵活部署,提高推理过程的整体效率。同时,提前退出机制作为一种有效的优化策略,可以在网络架构中设置多个中间出口,根据输入任务的复杂程度,在保持可接受推理准确率的前提下,提前终止部分推理任务,减少不必要的计算量,降低传输给边缘服务器的任务负载。
2、现有的研究大多考虑推理任务结构上的优化,但随着dnn计算需求的激
...【技术保护点】
1.一种多用户多出口DNN推理分区与任务调度方法,其特征在于,在每个用户设备和边缘服务器上都部署了经过训练的多出口DNN模型,在一段时隙内,任务到达用户设备满足泊松分布并被存储在用户设备的任务队列中;以策略可行性区间为约束,以任务的出口点、分区点以及调度决策为优化变量,建立以最大化一段时隙内任务推理的总完成率和推理准确率为目标的优化问题P;将问题解耦为服务器调度优化问题P1,建立服务器任务的图模型,使用双贪心算法求解问题P1;再将问题简化为P2,建立马尔可夫决策过程,使用多智能体强化学习算法求解最优策略。
2.如权利要求1所述的一种多用户多出口DNN推理分
...【技术特征摘要】
1.一种多用户多出口dnn推理分区与任务调度方法,其特征在于,在每个用户设备和边缘服务器上都部署了经过训练的多出口dnn模型,在一段时隙内,任务到达用户设备满足泊松分布并被存储在用户设备的任务队列中;以策略可行性区间为约束,以任务的出口点、分区点以及调度决策为优化变量,建立以最大化一段时隙内任务推理的总完成率和推...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。