一种网络优化方法和装置制造方法及图纸

技术编号：26976749 阅读：85 留言：0更新日期：2021-01-06 00:14

本发明专利技术实施例公开了一种网络优化方法和装置，所述方法包括：对第一区域中的小区的存在的问题进行建模得到N个智能体、建模方法和训练方法；其中，所述第一区域包括的小区中存在的问题属于相同的问题种类的小区所占的比例大于或等于预设阈值，且包含的小区的地理位置连续，且第一区域的轮廓为外凸图形；对于每一个智能体，根据建模方法和训练方法确定所述智能体的初始模型，使用强化学习方法对智能体的初始模型进行训练；或者，根据智能体的训练后的模型对智能体对应的小区进行网络优化；或者，根据建模方法和训练方法确定智能体的初始模型，根据建模方法和训练方法使用强化学习方法对智能体的初始模型进行训练，对智能体对应的小区进行网络优化。

全部详细技术资料下载

【技术实现步骤摘要】
一种网络优化方法和装置
本专利技术实施例涉及但不限于移动通信领域，尤指一种网络优化方法和装置。
技术介绍
目前长期演进(LTE，LongTermEvolution)中自组织网络(SON，Self-OrgnizingNetwork)实际应用的自优化方法，大多是基于人为设定的专家规则的。当网络中小区的性能指标符合某一条件时，则自动进行某调整动作，修改小区的参数，达到网络自优化的目的。目前已有的无线网络自优化算法可以分为两类，分别是传统的网络自优化算法和基于人工智能的网络自优化算法。其中，传统的网络自优化算法主要是依靠人工制定的规则表进行网络自优化，即在开启自优化时，查询各种网络状态，根据专家制定的规则表应作出何种调整。这种自优化方法将同一套规则用于所有参与自由化的设备，而实际上各个基站所处的环境、基站性能等条件都可能存在很大区别，这导致不同设备上的自优化效果良莠不齐。例如，专利号为CN106714239A的专利中公开的负载均衡算法中，使用固定的门限、规则和阈值，对于性能、所处环境不同的小区无法做到个性化的调整，导...

【技术保护点】
1.一种网络优化方法，包括：/n对第一区域中的小区的存在的问题进行建模得到N个智能体、建模方法和训练方法；其中，所述第一区域包括的小区中存在的问题属于相同的问题种类的小区所占的比例大于或等于预设阈值，且包含的小区的地理位置连续，且第一区域的轮廓为外凸图形，N为大于或等于1的整数；/n对于每一个智能体，根据建模方法和训练方法确定所述智能体的初始模型，根据建模方法和训练方法使用强化学习方法对智能体的初始模型进行训练；或者，根据智能体的训练后的模型对智能体对应的小区进行网络优化；或者，根据建模方法和训练方法确定所述智能体的初始模型，根据建模方法和训练方法使用强化学习方法对智能体的初始模型进行训练，根...

【技术特征摘要】
1.一种网络优化方法，包括：
对第一区域中的小区的存在的问题进行建模得到N个智能体、建模方法和训练方法；其中，所述第一区域包括的小区中存在的问题属于相同的问题种类的小区所占的比例大于或等于预设阈值，且包含的小区的地理位置连续，且第一区域的轮廓为外凸图形，N为大于或等于1的整数；
对于每一个智能体，根据建模方法和训练方法确定所述智能体的初始模型，根据建模方法和训练方法使用强化学习方法对智能体的初始模型进行训练；或者，根据智能体的训练后的模型对智能体对应的小区进行网络优化；或者，根据建模方法和训练方法确定所述智能体的初始模型，根据建模方法和训练方法使用强化学习方法对智能体的初始模型进行训练，根据智能体的训练后的模型对智能体对应的小区进行网络优化。

2.根据权利要求1所述的方法，其特征在于，其中，所述对第一区域中的小区的存在的问题进行建模得到N个智能体、建模方法和训练方法包括：
在预先设置的问题种类、建模方法和训练方法之间的对应关系中，查找所述第一区域中包括的小区存在的问题所属的问题种类对应的建模方法和训练方法；其中，所述建模方法包括：所述智能体的生成方法、所述智能体的状态的定义方法、所述智能体的动作的定义方法、所述智能体的奖励函数的定义方法和所述智能体的用于选择动作的初始策略的定义方法；所述训练方法包括：使用强化学习方法调整用于选择动作的初始策略的方法；
根据所述智能体的生成方法生成N个所述智能体。

3.根据权利要求2所述的方法，其特征在于，其中，所述根据智能体的生成方法生成N个所述智能体包括以下任意一个或多个：
当所述第一区域中的小区存在的问题不涉及多个小区之间的协同工作时，将所述第一区域中的一个所述小区作为一个所述智能体，不同所述小区对应不同的所述智能体；
当所述第一区域中的小区存在的问题涉及多个小区之间的协同工作时，将所述第一区域中的一个具有邻接关系的小区对作为一个所述智能体，不同具有邻接关系的小区对对应不同所述智能体。

4.根据权利要求1所述的方法，其特征在于，其中，所述第一区域的确定包括：
获取网络中所有小区的历史性能数据；
对于每一个所述小区，根据所述小区的历史性能数据确定所述小区为正常小区还是问题小区；
将问题小区中存在的问题所属的问题种类相同的小区划分为同一个第二区域；
对于每一个所述第二区域，根据所述第二区域中包括的小区的地理位置关系和所述第二区域的轮廓确定所述第一区域。

5.根据权利要求4所述的方法，其特征在于，其中，所述根据第二区域中包括的小区的地理位置关系和所述第二区域的轮廓确定所述第一区域包括以下任意一个或多个：
当所述第二区域中包括的小区的地理位置连续，且所述第二区域的轮廓为外凸图形时，将所述第二区域作为所述第一区域；
当所述第二区域中包括的小区的地理位置不连续，或所述第二区域的轮廓不是外凸图形时，将所述第二区域和除所述第二区域中包括的小区之外的最少数量的其他小区加入所述第一区域中，使得所述第一区域中包括的小区的地理位置连续，且所述第一区域的轮廓为外凸图形。

6.根据权利要求1所述的方法，其特征在于，其中，所述建模方法包括：所述智能体的生成方法、所述智能体的状态的定义方法、所述智能体的动作的定义方法、所述智能体的奖励函数的定义方法和所述智能体的用于选择动作的策略的定义方法；所述训练方法包括：使用强化学习方法调整用于选择动作的策略的方法；
所述根据建模方法和训练方法确定所述智能体的初始模型包括：
根据所述智能体的用于选择动作的初始策略的定义方法确定所述智能体的用于选择动作的初始策略，将所述智能体的用于选择动作的初始策略作为所述智能体的初始模型；
所述采用强化学习方法对智能体的初始模型的训练包括：
在第i轮迭代中，当不满足收敛条件时，
在第一概率下选择随机动作，下发所述随机动作，使得所述随机动作在所述智能体对应的小区中生效；
在第二概率下根据所述智能体的第i轮迭代对应的性能数据和所述智能体的状态的定义方法确定所述智能体的第i轮迭代对应的状态，根据所述智能体的第(i－1)轮迭代对应的状态、第i轮迭代对应的状态和所述训练方法调整所述智能体的在第(i－1)轮迭中调整后的策略，根据所述智能体的第i轮迭代对应的状态、所述智能体的第一数据和所述智能体的动作的定义方法计算智能体的第i轮迭代对应的最优动作，下发智能体的第i轮迭代对应的最优动作，使得所述智能体的第i轮迭代对应的最优动作在所述智能体对应的...

【专利技术属性】
技术研发人员：谢勤政，
申请(专利权)人：中兴通讯股份有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人