网络资源优化、模型训练方法、装置、存储介质及设备制造方法及图纸

技术编号:32744856 阅读:66 留言:0更新日期:2022-03-20 08:52
本公开提供了一种网络资源优化、模型训练方法、装置、存储介质及设备,涉及通信技术领域。涉及的网络资源优化模型训练方法,包括:对目标域子切片以及源域子切片进行聚类,得到聚类簇;确定各所述源域子切片在其所在的聚类簇中的重要性权重;将所述源域子切片的所述重要性权重作为所述源域子切片被选中的概率,根据所述概率从所述源域子切片中选择第一源域子切片,根据所述第一源域子切片的数据训练所述网络资源优化模型,其中,所述网络资源优化模型用于根据所述目标域子切片的数据确定所述目标域子切片的优化策略。本公开实施例解决了无线网络资源动态优化场景下,初始目标域切片配置数据收集过程较为困难的问题,简化了模型训练过程。训练过程。训练过程。

【技术实现步骤摘要】
网络资源优化、模型训练方法、装置、存储介质及设备


[0001]本公开涉及通信
,尤其涉及一种网络资源优化、模型训练方法、装置、存储介质及设备。

技术介绍

[0002]5G(5th Generation Mobile Communication Technology,第五代移动通信技术)端到端网络切片由无线子切片、传输子切片、核心网子切片组合而成,每个子切片可以单独管理,其中,无线子切片主要是对无线空口资源进行编排部署以满足分解到无线侧客户对网络的需求。针对网络切片的资源动态优化,目前比较常用的一种方式为,利用RL
[0003](Reinforcement Learning,强化学习技术)将网络切片资源管理问题抽象成一个MDP(Markov Decision Process,马尔科夫决策过程),在模型中以特定的性能指标如吞吐量,或者具体的业务需求作为奖励函数Reward,在网络中对资源进行动态调整,用以弱化人为干预。
[0004]但在目前这种网络资源动态调整的方式中,初始目标切片无线配置数据收集过程较为困难,通常需要先向现网发送不同的配置策略,并收集每种配置策略带来的性能变化数据生成Reward函数;且如果随机向现网环境中发送不同的配置策略,会带来一定的试错风险,对现网环境带来损害。

技术实现思路

[0005]本公开提供了一种网络资源优化、模型训练方法、装置、存储介质及设备,至少在一定程度上克服相关技术中网络资源动态调整过程中,初始目标切片无线配置数据收集过程较为困难,导致网络资源动态调整策略制定较为困难的问题。
[0006]根据本公开的第一个方面,提供了一种网络资源优化模型训练方法,包括:对目标域子切片以及源域子切片进行聚类,得到聚类簇;确定各所述源域子切片在其所在的聚类簇中的重要性权重;将所述源域子切片的所述重要性权重作为所述源域子切片被选中的概率,根据所述概率从所述源域子切片中选择第一源域子切片,根据所述第一源域子切片的数据训练所述网络资源优化模型,其中,所述网络资源优化模型用于根据所述目标域子切片的数据确定所述目标域子切片的优化策略。
[0007]可选的,将所述源域子切片的所述重要性权重作为所述源域子切片被选中的概率,根据所述概率从所述源域子切片中选择第一源域子切片,根据所述第一源域子切片的数据训练所述网络资源优化模型,包括:循环执行如下步骤,直至所述网络资源优化模型训练完成:依次在各所述目标域子切片所在的聚类簇中按照所述重要性权重选择所述第一源域子切片;基于所述第一源域子切片的数据生成所述第一源域子切片所处基站小区的状态向量以及所述第一源域子切片的行为;根据所述状态向量以及所述行为确定执行所述行为后所述基站小区的目标状态与产生的回报;根据所述目标状态与所述回报更新所述网络资源优化模型的模型参数。
[0008]可选的,确定各所述源域子切片在其所在的聚类簇中的重要性权重,包括:计算第二源域子切片与第一聚类簇中的所述目标域子切片之间的平均距离,将所述平均距离确定为所述第二源域子切片的所述重要性权重,其中,所述第二源域子切片为所述第一聚类簇中的任意源域子切片,所述第一聚类簇为所述聚类簇中的任意聚类簇。
[0009]可选的,对目标域子切片以及源域子切片进行聚类,得到聚类簇,包括:分别基于所述目标域子切片与所述源域子切片生成相同维度的特征,得到待聚类的样本集;循环执行如下步骤,直至所述样本集为空:从所述样本集中选取任意未分类样本;根据所述样本集中的其余样本与所述未分类样本之间的距离,检索出所述未分类样本的邻域;根据所述未分类样本的邻域中样本的个数确定所述未分类样本和/或所述邻区中的样本所属的聚类簇。
[0010]可选的,根据所述未分类样本的邻域中样本的个数确定所述未分类样本和/或所述邻区中的样本所属的聚类簇,包括:若所述邻区中样本的个数小于第一阈值,将所述未分类样本标记为噪声点,将所述未分类样本放入噪声点的聚类簇,从所述样本集中删除所述未分类样本;若所述邻区中样本的个数小于第二阈值,在已完成聚类的聚类簇中查找距离所述邻区的中心点最近的聚类簇,将所述邻区与距离所述中心点最近的聚类簇合并,得到新的聚类簇,并从所述样本集中移除所述邻区中所有的样本,其中,所述第一阈值不大于所述第二阈值;若所述邻区中样本的个数不小于所述第二阈值,将所述邻区中所有的样本确定为一个聚类簇,确定所述未分类样本为该聚类簇的中心点,并从所述样本集中移除所述邻区中所有的样本。
[0011]可选的,所述状态向量包括以下至少一项:子切片特征、当前时刻切片资源配置情况及利用率、切片配置生效后的感知数据以及已选择的每个行为的次数。
[0012]可选的,所述子切片特征至少包括以下一项:子切片的业务信息、子切片所处基站的历史资源使用情况以及子切片对应基站的密度参数。
[0013]可选的,所述行为包括:所述源域子切片的历史配置数据。
[0014]可选的,所述源域子切片的历史配置数据至少包括以下一项:切片标识、切片生效时间、参数修改时间、跟踪区标识TAC、基站小区标识、5QI列表切片组用户数、最大无线资源控制RRC连接态用户数、专用物理资源块RPB资源比率、最大PRB资源比率以及最小PRB资源比率。
[0015]可选的,所述回报根据以下至少一项参数计算得到:业务的抖动、丢包率、上行速率、下行速率以及时延。
[0016]可选的,所述方法还包括:在所述网络资源优化模型训练完成之后,将所述网络资源优化模型上线运行;采集所述网络资源优化模型上线运行预设时长内所述目标域子切片所处基站小区的状态数据以及所述目标域子切片的行为数据;根据所述状态数据以及所述行为数据对所述网络资源优化模型的模型参数进行更新。
[0017]可选的,对目标域子切片以及源域子切片进行聚类,得到聚类簇,包括:通过基于密度的聚类算法对所述目标域子切片以及所述源域子切片进行聚类,得到所述聚类簇。
[0018]根据本公开的第二个方面,还提供了一种网络资源优化方法,包括:根据本公开实施例提供的任意一种网络资源优化模型预测所述目标域子切片的目标行为;将所述目标行为下发至网管设备。
[0019]根据本公开的第三个方面,还提供了一种网络资源优化模型训练装置,包括:聚类模块,用于对目标域子切片以及源域子切片进行聚类,得到聚类簇;确定模块,用于确定各所述源域子切片在其所在的聚类簇中的重要性权重;训练模块,用于将所述源域子切片的所述重要性权重作为所述源域子切片被选中的概率,根据所述概率从所述源域子切片中选择第一源域子切片,根据所述第一源域子切片的数据训练所述网络资源优化模型,其中,所述网络资源优化模型用于根据所述目标域子切片的数据确定所述目标域子切片的优化策略。
[0020]根据本公开的第四个方面,还提供了一种网络资源优化装置,包括:预测模块,用于根据本公开实施例提供的任意一种网络资源优化模型预测所述目标域子切片的目标行为;下发模块,用于将所述目标行为下发至网管设备。
[0021]根据本公开的第五个方面本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种网络资源优化模型训练方法,其特征在于,包括:对目标域子切片以及源域子切片进行聚类,得到聚类簇;确定各所述源域子切片在其所在的聚类簇中的重要性权重;将所述源域子切片的所述重要性权重作为所述源域子切片被选中的概率,根据所述概率从所述源域子切片中选择第一源域子切片,根据所述第一源域子切片的数据训练所述网络资源优化模型,其中,所述网络资源优化模型用于根据所述目标域子切片的数据确定所述目标域子切片的优化策略。2.根据权利要求1所述的方法,其特征在于,将所述源域子切片的所述重要性权重作为所述源域子切片被选中的概率,根据所述概率从所述源域子切片中选择第一源域子切片,根据所述第一源域子切片的数据训练所述网络资源优化模型,包括:循环执行如下步骤,直至所述网络资源优化模型训练完成:依次在各所述目标域子切片所在的聚类簇中按照所述重要性权重选择所述第一源域子切片;基于所述第一源域子切片的数据生成所述第一源域子切片所处基站小区的状态向量以及所述第一源域子切片的行为;根据所述状态向量以及所述行为确定执行所述行为后所述基站小区的目标状态与产生的回报;根据所述目标状态与所述回报更新所述网络资源优化模型的模型参数。3.根据权利要求1所述的方法,其特征在于,确定各所述源域子切片在其所在的聚类簇中的重要性权重,包括:计算第二源域子切片与第一聚类簇中的所述目标域子切片之间的平均距离,将所述平均距离确定为所述第二源域子切片的所述重要性权重,其中,所述第二源域子切片为所述第一聚类簇中的任意源域子切片,所述第一聚类簇为所述聚类簇中的任意聚类簇。4.根据权利要求1所述的方法,其特征在于,对目标域子切片以及源域子切片进行聚类,得到聚类簇,包括:分别基于所述目标域子切片与所述源域子切片生成相同维度的特征,得到待聚类的样本集;循环执行如下步骤,直至所述样本集为空:从所述样本集中选取任意未分类样本;根据所述样本集中的其余样本与所述未分类样本之间的距离,检索出所述未分类样本的邻域;根据所述未分类样本的邻域中样本的个数确定所述未分类样本和/或所述邻区中的样本所属的聚类簇。5.根据权利要求4所述的方法,其特征在于,根据所述未分类样本的邻域中样本的个数确定所述未分类样本和/或所述邻区中的样本所属的聚类簇,包括:若所述邻区中样本的个数小于第一阈值,将所述未分类样本标记为噪声点,将所述未分类样本放入噪声点的聚类簇,从所述样本集中删除所述未分类样本;若所述邻区中样本的个数小于第二阈值,在已完成聚类的聚类簇中查找距离所述邻区的中心点最近的聚类簇,将所述邻区与距离所述中心点最近的聚类簇合并,得到新的聚类
簇,并从所述样本集中移除所述邻区中所有的样本,其中,所述第一阈值不大于所述第二阈值;若所述邻区中样本的个数不小于所述第二阈值,将所述邻区中所有的样本确定为一个聚类簇,确定所述未分类样本为该聚类簇的中心点,并从所述样本集中移除所述邻区中所有的样本。6.根据权利要求2所述的方法,其特征在于,所述状态向量包括以下至少一项:子切片特...

【专利技术属性】
技术研发人员:王迎章军张乐杨博李时宇
申请(专利权)人:中国电信股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1