【技术实现步骤摘要】
意图光网络冲突解决方法及装置
[0001]本专利技术涉及通信
,尤其是指一种意图光网络冲突解决方法及装置。
技术介绍
[0002]现有的技术方案中意图驱动网络通用架构及其意图驱动网络转译方法,由业务应用层、意图使能层、基础设施层构成。意图驱动通用技术流程包括意图转译,意图原语及策略验证。具体的,以自然语言表示的用户意图经意图表征后输出以词为单位,遵循<领域、领域属性、对象、操作、结果>的规范化意图语言,基础设施层感知遥测网络全局信息并输入策略推理模块,未验证网络策略输入策略验证模块,策略验证优化后输出最佳网络策略。该意图驱动网络通用架构及技术广泛适用于包括有线无线网络在内的多制式网络,为异构网络提供一种通用的自动化策略制定方法达到契合用户意图的功能。
[0003]现有的技术方案中有很多解决网络资源冲突的解决方案,但没有关于意图光网络冲突的解决方案。
技术实现思路
[0004]本专利技术的目的在于提供一种意图光网络冲突解决方法及装置,以解决现有技术未提供意图光网络冲突的
【技术保护点】
【技术特征摘要】
1.一种意图光网络冲突解决方法,其特征在于,包括:获取用户意图:将所述用户意图输入多意图冲突协商模型,得到所述多意图冲突协商模型输出的意图冲突解决策略;其中,产生冲突的每个用户意图被建模为具有强化学习能力的一个智能体,所述多意图冲突协商模型是基于多智能体强化学习训练得到的。2.根据权利要求1所述的方法,其特征在于,所述意图冲突解决策略包括:其中,R
i
表示第i个智能体的意图冲突解决策略;u
i
(r)表示意图冲突协商后第i个智能体的运营商收益函数;p
i
表示意图冲突协商后由于部分业务被降级处理导致的第i个智能体的损失;π表示第i个智能体的动作策略。3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:基于多智能体强化学习训练,确定所述多意图冲突协商模型;其中,所述多智能体强化学习的训练目标为使得多智能体的整体策略达到纳什均衡,从而确定所述意图冲突解决策略。4.根据权利要求3所述的方法,其特征在于,所述每个智能体的意图冲突解决策略满足第二条件,所述第二条件为:第二条件,所述第二条件为:其中,s
i
表示第i个智能体的智能体状态;π
i
表示第i个智能体的动作策略;π
‑
i
表示除第i个智能体之外的其他所有智能体的动作策略;S
i
的表示第i个智能体的状态空间;V
i
()表示第i个智能体自身的期望回报;Π
i
表示第i个智能体的策略空间;表示所有智能体的策略空间;表示除第i个智能体以外所有智能体的策略空间。5.根据权利要求3所述的方法,其特征在于,基于多智能体强化学习训练,确定所述多意图冲突协商模型,包括:针对产生冲突的多个用户意图,获取不同类型用户意图的运营商计费方式;获取意图冲突时间段内,各个智能体的状态空间、动作空间、奖励函数以及状态转移函数;根据各个智能体的运营商计费方式、状态空间、动作空间、奖励函数以及状态转移函数进行强化学习训练,得到所述多意图冲突协商模型;其中,所述智能体的状态空间为意图冲突时间段内所述智能体所感知的链路环境信息;所述智能体的动作空间为在满足用户意图的前提下,该用户意图为解决冲突可变动的范围;所述奖励函数为在能够解决当前冲突的前提下,运营商的收益;所述状态转移函数为常函数。6.根据权利要求5所述的方法,其特征在于,所述链路环境信息包括以下至少一项:智能体需要使用的带宽资源;
智能体的丢包率;智能体的时延要求;智能体的抖动。7.根据权利要求5所述的方法,其特征在于,所述动作空间包括以下至少一项:带宽容忍量;丢包容忍量;时延容忍量。8.根据权利要求5所述的方法,其特征在于,根据各个智能体的运营商计费方式、状态空间、动作空间、奖励函数以及状态转移函数进行强化学习训练的训练方式,包括:通过训练一个非线性函数来逼近多意图冲突协商模型的策略函数F;其中,所述非线性函数为:S'=F(s,a)其中,在状态s下通过执行动作a,以达到状态S
′
。9.一种意图光网络冲突解决装置,其特征在于,包括:获取模块,用于获取用户意图:冲突解决模块,用于将所述用户意图输入多意图冲突协商模型,得到所述多意图冲突协商模型输出的意图冲突解决策略;其中,产生冲突的每个用户意图被建模为具有强化学习能力的一个智能...
【专利技术属性】
技术研发人员:李允博,张德朝,王东,柳晟,杨辉,滕云,孙政结,姚秋彦,包博文,李超,
申请(专利权)人:北京邮电大学中国移动通信集团有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。