【技术实现步骤摘要】
工业网络的多智能体调度方法、装置、设备及存储介质
[0001]本专利技术涉及计算机软件
,具体涉及工业网络的多智能体调度方法、装置、设备及存储介质。
技术介绍
[0002]工业互联网正助力制造业朝着网络化和智能化的方向发展,随着面向管理的信息技术与面向生产的运营技术的深度融合,工业场景不断衍生出许多形态多样的业务流类型,例如以时间触发流为核心的经典业务流、以“子流按序触发”为特征的复杂链式流以及面向新型工业应用的智能业务流。因此如何构建具备“准时、准确”性能特征的确定性网络技术,以有效支撑多形态业务流的融合共网传输,是当前工业互联网面临的重大挑战。
[0003]因此,亟需一种能够适应复杂工业场景,满足多形态业务流的确定传输需求的业务流调度方法。
技术实现思路
[0004]有鉴于此,本专利技术提供了一种工业网络的多智能体调度方法、装置、设备及存储介质,能够适应复杂工业场景,可以有效满足多形态业务流的确定传输需求。
[0005]第一方面,本专利技术提供了一种工业网络的多智能体调度方法,包括: ...
【技术保护点】
【技术特征摘要】
1.一种工业网络的多智能体调度方法,其特征在于,包括:将工业网络中的单同步域划分为多个子同步域,并利用所述多个子同步域构建网络模型,其中每个子同步域由对应的单域控制器控制;以减少资源占用率和调度失败率为目标,构建约束条件集合;根据所述约束条件集合以及所述网络模型,构建部分可观马尔可夫决策过程,所述部分可观马尔可夫决策过程用于为链式业务流的跨域协同调度制定最优策略。2.根据权利要求1所述的方法,其特征在于,所述将工业网络中的单同步域划分为多个子同步域,包括:按照控制器位置、网络规模和接入方式对单同步域进行划分,得到多个子同步域。3.根据权利要求1或2所述的方法,其特征在于,所述以减少资源占用率和调度失败率为目标,构建约束条件集合,包括:其中,E
m,n,t
表示累积能量消耗值,表示累积能量消耗最大阈值,m表示智能体序号,n表示接入设备序号,M表示智能体序号的集合,N表示接入设备序号的集合,t表示时间,R表示时间的集合;其中,T
m,n,t
表示累积时间开销值,表示累积时间开销最大阈值,m表示智能体序号,n表示接入设备序号,M表示智能体序号的集合,N表示接入设备序号的集合,t表示时间,R表示时间的集合;其中,T
t
表示当前周期时延值,T
max
表示周期时延最大值,t表示时间,R表示时间的集合;其中,O
m,n,t
表示节点选择值,该节点选择值为1时表示选择相应节点参与当前学习周期,该节点选择值为0时表示不选择相应节点参与当前学习周期;m表示智能体序号,n表示接入设备序号,M表示智能体序号的集合,N表示接入设备序号的集合,t表示时间,R表示时间的集合;间的集合;间的集合;其中,为下行频谱资源分配决策变量,为上行频谱资源分配决策变量,以及η
m,n,t
为板载计算资源决策变量。4.根据权利要求1或2所述的方法,其特征在于,所述根据所述约束条件集合以及所述网络模型,构建部分可观马尔可夫决策过程,包括:
将每个单...
【专利技术属性】
技术研发人员:张维庭,杨冬,刘颖,代嘉宁,龚恺,王洪超,张宏科,
申请(专利权)人:北京交通大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。