【技术实现步骤摘要】
数据处理方法、装置及其相关设备
[0001]本申请涉及无线通信
,尤其涉及一种数据处理方法、装置及其相关设备。
技术介绍
[0002]在移动通信系统中,引入机器学习的方式来替换传统的通信模块或者辅助系统决策,以提升通信系统的性能增益。上述机器学习应用的在线训练过程中,需要不同的计算资源节点处理不同来源的数据和执行大量的计算任务,其中,计算资源节点可以包括终端、基站、核心网设备和边缘计算设备等。
[0003]然而,受限于不同计算资源节点的计算能力,当计算资源节点的待处理数据的数据量较大时,可能导致该计算资源节点无法及时完成计算任务,从而导致业务延时,甚至可能影响节点整体性能。
技术实现思路
[0004]本申请提供了一种用于数据处理方法、装置及其相关设备。
[0005]根据本申请的一方面,提供了一种数据处理方法,所述方法由计算中心节点执行,所述方法包括:
[0006]获取多个计算资源节点的初始状态信息;
[0007]根据所述多个计算资源节点的初始状态信息,确定所述多个计算资源 ...
【技术保护点】
【技术特征摘要】
1.一种数据处理方法,其特征在于,应用于计算中心节点,所述方法包括:获取多个计算资源节点的初始状态信息;根据所述多个计算资源节点的初始状态信息,确定所述多个计算资源节点中至少一个目标计算资源节点对应的目标算力分配策略;向所述至少一个目标计算资源节点发送对应的目标算力分配策略,其中,所述目标算力分配策略包括所述多个计算资源节点的目标算力分配比例,用于对应的目标计算资源节点根据所述多个计算资源节点的目标算力分配比例,分发待处理数据。2.根据权利要求1所述的方法,其特征在于,所述初始状态信息包括对应计算资源节点的待处理数据的数据量、对应计算资源节点处理所述待处理数据所需的计算量、对应计算资源节点的可用存储空间和对应计算资源节点的可用算力中的至少一个;其中,所述可用算力用于表征对应计算资源节点在单位时间内可处理的数据量。3.根据权利要求1所述的方法,其特征在于,所述获取多个计算资源节点的初始状态信息之前,所述方法还包括:获取各所述计算资源节点所处的位置、各所述计算资源节点的待处理数据的数据特征和数据类型中的至少一种;根据各所述计算资源节点所处的位置、各所述计算资源节点的待处理数据的数据特征和数据类型中的至少一种,从各所述计算资源节点中确定所述多个计算资源节点;向所述多个计算资源节点发送指示信息,其中,所述指示信息,用于指示所述多个计算资源节点向所述计算中心节点发送对应的初始状态信息。4.根据权利要求1所述的方法,其特征在于,所述根据所述多个计算资源节点的初始状态信息,确定所述多个计算资源节点中至少一个目标计算资源节点对应的目标算力分配策略,包括:根据所述多个计算资源节点的初始状态信息,生成状态序列;根据所述多个计算资源节点的初始状态信息以及所述至少一个目标计算资源节点的初始算力分配策略,生成动作序列;其中,所述初始算力分配策略包括所述多个计算资源节点的初始算力分配比例;根据所述状态序列和所述动作序列,确定累积奖赏;其中,所述累积奖赏,与在所述状态序列所指示的状态下执行所述动作序列所需消耗的资源量或时间成反向关系;根据所述累积奖赏,对所述至少一个目标计算资源节点的初始算力分配策略进行至少一次更新,训练强化学习模型,以得到所述至少一个目标计算资源节点对应的目标算力分配策略。5.根据权利要求4所述的方法,其特征在于,所述强化学习模型通过以下步骤训练得到:获取训练样本,所述训练样本包括所述多个计算资源节点的状态序列、所述累积奖赏最大时对应的动作序列、所述状态序列下采取所述累积奖赏最大时对应的动作序列后获得的奖赏、以及采取所述累积奖赏最大时对应的动作序列后转移的状态序列,其中,所述累积奖赏最大时对应的动作序列是根据使得所述累积奖赏最大的所述多个计算资源节点的算力分配比例确定的;根据所述训练样本训练强化学习模型,以对所述强化学习模型的模型参数进行更新;
在未满足模型训练结束条件的情况下,采用更新后的训练样本继续对更新后的所述强化学习模型进行训练,直至满足所述模型训练结束条件,停止对所述强化学习模型进行训练。6.根据权利要求5所述的方法,其特征在于,所述模型训练结束条件包括所述强化学习模型的累积奖赏收敛、所述强化学习模型的训练时间达到预设阈值和所述强化学习模型的迭代更新次数达到设定次数中的至少一个条件。7.根据权利要求1
‑
6中任一项所述的方法,其特征在于,所述方法还包括:接收所述多个计算资源节点发送的待处理数据;根据所述多个计算资源节点的待处理数据,对目标模型进行训练,以得到经过计算中心节点训练后的目标模型;接收所述多个计算资源节点发送的经过计算资源节点训练后的目标模型;将所述经过计算中心节点训练后的目标模型和各所述经过计算资源节点训练后的目标模型进行聚合,以得到聚合后的目标模型;向所述多个计算资源节点发送所述聚合后的目标模型。8.一种数据处理方法,其特征在于,应用于目标计算资源节点,所述方法包括:向计算中心节点发送所述目标计算资源节点的初始状态信息;接收所述计算中心节点发送的目标算力分配策略,其中,所述目标算力分配策略包括多个计算资源节点的目标算力分配比例;根据所述多个计算资源节点的目标算力分配比例,分发所述目标计算资源节点的待处理数据。9.根据权利要求8所述的方法,其特征在于,所述向计算中心节点发送所述目标计算资源节点的初始状态信息之前,所述方法还包括:接收所述计算中心节点发送的指示信息,其中,所述指示信息,用于指示向所述计算中心节点发送对应的初始状态信息。10.根据权利要求8或9所述的方法,其特征在于,所述根据所述多个计算资源节点的目标算力分配比例,分发所述目标计算资源节点的待处理数据,包括:从所述目标计算资源节点的待处理数据中,确定与所述目标计算资源节点对应的目标算力分配比例匹配的第一目标数据;根据所述多个计算资源节点中所述目标计算资源节点的上级计算资源节点对应的目标算力分配比例,向所述上级计算资源节点发送所述目标计算资源节点的待处理数据中除所述第一目标数据之外的其余数据。11.根据权利要求10所述的方法,其特征在于,所述方法还包括:接收所述目标计算资源节点对应的各下级计算资源节点发送的第二目标数据,其中,所述第二目标数据是根据各所述下级计算资源节点对应的目标算力分配比例和各所述下级计算资源节点对应的待处理数据确定的。12.根据权利要求11所述的方法,其特征在于,所述方法还包括:根据各所述下级计算资源节点发送的第二目标数据和所述第一目标数据,对目标模型进行训练,以得到经过所述目标计算资源节点训练后的目标模型;向所述计算中心节点发送经过所述目标计算资源节点训练后的目标模型;
接收所述计算中心节点发送的聚合后的目标模型。13.一种计算中心节点,其特征在于,包括存储器,收发机,处理器:存储器,用于存储计算机程序;收发机,用于在所述处理器的控制下收发数据;处理器,用于读取所述存储器中的计算机程序并执行以下操作:获取多个计算资源节点的初始状态信息;根据所述多个计算资源节点的初始状态信息,确定所述多个计算资源节点中至少一个目标计算资源节点对应的目标算力分配策略;向所述至少一个目标计算资源节点发送对应的目标算力分配策略,其中,所述目标算力分配策略包括所述多个计算资源节点的目标算力分配比例,用于对应的目标计算资源节点根据所述多个计算资源节点的目标算力分配比例,分发待处理数据。14.根据权利要求13所述的计算中心节点,其特征在于,所述初始状态信息包括对应计算资源节点的待处理数据的...
【专利技术属性】
技术研发人员:吴立臣,杨现俊,
申请(专利权)人:大唐移动通信设备有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。