一种视频通信资源分配决策方法及系统技术方案

技术编号:40820110 阅读:33 留言:0更新日期:2024-03-28 19:38
本发明专利技术公开了一种视频通信资源分配决策方法及系统,包括:以预期回报值最大为目标,构建智能体;将从经验缓冲区中抽取的多个经验样本作为学习样本,并根据各个学习样本对应的多步回报值,计算得到各个学习样本的时间差分误差;基于各个学习样本的时间差分误差,更新经验缓冲区中的所有经验样本对应的预期回报值,并为所有学习样本分配抽样优先级,以完成对智能体的优化;实时获取系统状态,并通过完成优化的智能体,获取当前时刻的最佳行动策略,并基于最佳行动策略,实现网络通信资源的分配。采用本发明专利技术实施例,实时地适应网络的动态变化,选择使得预期回报值最大的最佳行动策略,以提升网络通信资源的分配效果。

【技术实现步骤摘要】

本专利技术涉及通信资源分配领域,尤其涉及一种视频通信资源分配决策方法及系统


技术介绍

1、在数字时代,实时通信技术已经渗透到我们的日常生活、工作和学习中。其中,webrtc(web real-time communication是一个允许网页应用程序进行实时音频、视频通信的开放标准。webrtc的核心优势在于它是点对点的,可以直接在两个通信终端之间传输数据,而无需中央服务器的介入。然而,实时视频通信面临的一个核心挑战是网络条件的动态变化。网络带宽、延迟和丢包率等因素都可能影响视频通信的质量。为了应对这些挑战,webrtc引入了svc(scalab le video coding)技术。svc可以动态调整视频流的质量,以适应不同的网络条件,从而为用户提供更好的体验。

2、目前,常见的webrtc-svc的资源分配策略有以下三种。第一种是静态资源分配,其是根据预先定义的设置或配置进行,在此策略中,发送端的行为是固定的,不考虑网络状况的变化,虽然这种方法简单易实现,但缺乏灵活性,不能很好地适应网络状况的变化。第二种是基于反馈的动态调整,其依赖于从接本文档来自技高网...

【技术保护点】

1.一种视频通信资源分配决策方法,其特征在于,包括:

2.如权利要求1所述的一种视频通信资源分配决策方法,其特征在于,在所述将从经验缓冲区中抽取的多个经验样本作为学习样本,并根据各所述学习样本对应的多步回报值,计算得到各所述学习样本的时间差分误差之前,还包括:

3.如权利要求1所述的一种视频通信资源分配决策方法,其特征在于,所述基于各所述学习样本的时间差分误差,更新所述经验缓冲区中的所有经验样本对应的预期回报值,并为所有所述学习样本分配抽样优先级,以完成对所述智能体的优化,具体为:

4.如权利要求1所述的一种视频通信资源分配决策方法,其特征在于,所述将...

【技术特征摘要】

1.一种视频通信资源分配决策方法,其特征在于,包括:

2.如权利要求1所述的一种视频通信资源分配决策方法,其特征在于,在所述将从经验缓冲区中抽取的多个经验样本作为学习样本,并根据各所述学习样本对应的多步回报值,计算得到各所述学习样本的时间差分误差之前,还包括:

3.如权利要求1所述的一种视频通信资源分配决策方法,其特征在于,所述基于各所述学习样本的时间差分误差,更新所述经验缓冲区中的所有经验样本对应的预期回报值,并为所有所述学习样本分配抽样优先级,以完成对所述智能体的优化,具体为:

4.如权利要求1所述的一种视频通信资源分配决策方法,其特征在于,所述将从经验缓冲区中抽取的多个经验样本作为学习样本,并根据各所述学习样本对应的多步回报值,计算得到各所述学...

【专利技术属性】
技术研发人员:牛冠冲贺国栋李晓辉黄振江颜斌
申请(专利权)人:西安电子科技大学广州研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1