基于在线联邦迁移学习的码率自适应策略高效训练方法技术

技术编号：39181458 阅读：8 留言：0更新日期：2023-10-27 08:29

本发明专利技术提供一种基于在线联邦迁移学习的码率自适应策略高效训练方法，步骤为：(1)用户客户端经过动态网络条件鉴别器鉴别网络类型和交通方式；(2)根据鉴别器的鉴别结果将用户聚类成规定的组别，组内用户进行联邦学习；(3)每一组的中心节点初始化加载预训练离线模型，作为初始全局模型；(4)中心节点将全局模型参数发送给组内所有用户；(5)组内用户以全局模型为基础，在线迁移训练本地模型参数，定期向中心节点发送本地更新模型参数；(6)中心节点聚合组内所有用户模型参数训练得到全局模型；(7)重复上述步骤，直至中心节点的聚合全局模型训练完毕。本发明专利技术在保证用户实时视频会话质量的同时，大大缩短在线学习模型的训练时间。大大缩短在线学习模型的训练时间。大大缩短在线学习模型的训练时间。

全部详细技术资料下载

【技术实现步骤摘要】
基于在线联邦迁移学习的码率自适应策略高效训练方法

[0001]本专利技术涉及多媒体通信
，具体涉及一种基于在线联邦迁移学习的码率自适应策略高效训练方法。

技术介绍

[0002]在互联网基础设施和应用不断发展的推动下，实时视频服务和应用正变得越来越普遍。从在线直播、视频会议，到社交聚会甚至新兴的云游戏场景、智能远程驾驶，实时视频无形地改变着我们的生活方式。根据市场报告预测，实时视频流量将占所有互联网视频流量的17％，到2025年将在全球产生高达2173亿美元的收入。
[0003]此外，目前的内容提供商主要使用码率自适应技术来传输实时视频，即根据用户当前视频的播放情况与网络状况，自动调整切换码率，以优化用户体验质量(Quality of Experience,QoE)。近年来，基于强化学习的码率自适应方法不断涌现，它们不依赖于预先人为设定的固定规则，应用深度强化学习训练智能体学习历史实时视频流经验来生成码率自适应策略，这使得它们能够更好地适应动态的实时网络场景。
[0004]现有的算法主要包括离线学习和在线学习两类工作。现有算法大多数局限于离线学习，即在仿真器中训练好模型后再部署到实际环境中使用，难免造成仿真和真实网络环境的差距，性能退化严重。不同于离线学习，在线学习提倡用动态的实时视频流进行训练，根据新的网络环境不断完善并预测模型，而不是使用预训练模型。OnRL(Huanhuan Zhang,Anfu Zhou,Jiamin Lu,Ruoxuan Ma,Yuhan Hu,Cong Li,Xinyu...

【技术保护点】

【技术特征摘要】
1.基于在线联邦迁移学习的码率自适应策略高效训练方法，其特征在于，该方法包括如下步骤：(1)每个用户客户端经过动态网络条件鉴别器鉴别用户经历的网络类型和交通方式；其中，所述用户客户端经历真实网络进行实时视频流化传输；(2)根据所述动态网络条件鉴别器的鉴别结果将用户聚类成规定的组别，相同组的用户进行组内联邦学习；(3)每一组的中心节点初始化加载一个预训练的通用离线模型；其中，所述离线模型作为中心节点的初始全局模型；(4)每一组的中心节点将全局模型参数发送给组内所有用户；(5)组内用户以全局模型为基础，根据本地网络状况在线迁移训练本地模型参数，定期向中心节点发送本地更新模型参数；(6)中心节点聚合组内所有用户的模型参数，训练得到聚合全局模型；(7)重复上述步骤(4)至(6)，直至中心节点的聚合全局模型训练完毕。2.根据权利要求1所述的基于在线联邦迁移学习的码率自适应策略高效训练方法，其特征在于，步骤(1)中，所述动态网络条件鉴别器通过对用户客户端经历的真实网络进行实时监测和鉴别，定期动态检测用户端的网络条件，用户客户端可以灵活地与对应组别的中心节点交互模型参数。3.根据权利要求1所述的基于在线联邦迁移学习的码率自适应策略高效训练方法，其特征在于，步骤(1)中，所述用户经历的网络类型包括第三代移动通信网络、...

【专利技术属性】
技术研发人员：陈浩，郑倩媛，马展，
申请(专利权)人：南京大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人