样本确定方法、装置及设备制造方法及图纸

技术编号:39175834 阅读:8 留言:0更新日期:2023-10-27 08:23
本申请公开了一种样本确定方法、装置及设备,属于通信技术领域,本申请实施例的样本确定方法包括:第一设备接收目标设备发送的第一信息,所述第一信息包括时变参数信息及人工智能AI模型属性信息,所述时变参数信息用于指示通信行为的随机性;所述第一设备基于目标推理模型的推理结果及所述时变参数信息,确定用于训练所述目标推理模型的训练样本,所述目标推理模型为与所述AI模型属性信息对应的推理模型。型。型。

【技术实现步骤摘要】
样本确定方法、装置及设备


[0001]本申请属于通信
,具体涉及一种样本确定方法、装置及设备。

技术介绍

[0002]无线移动通信结合人工智能(Artificial Intelligence,AI)能够较好地提高通信质量,例 如,物理层的基于AI信道质量压缩、基于AI的波束管理、基于AI的定位。以波束管理为 例,在毫米波无线通信中,通信收发端(例如,基站和终端)都配置了多个模拟波束,对 于同一个终端,在不同的发送和接收模拟波束测量到信道质量是变化的。如何快速并准确 地从所有可能的收发模拟波束组合中选择出信道质量最高的收发波束组,是影响传输质量 的关键。在引入AI神经网络模型后,终端可以基于AI神经网络模型有效地预测信道质量 最高的收发模拟波束,并上报给网络侧,从而能够获得更好的传输质量。
[0003]强化学习是一种AI神经网络模型训练方法。强化学习训练是基于环境而行动,利用推 理结果进行训练,能够取得最大化的预期利益。目前,受限于设备的计算能力,推理功能 和训练功能分离部署在不同的设备上,不支持AI神经网络模型的强化学习训练。

技术实现思路

[0004]本申请实施例提供一种样本确定方法、装置及设备,能够解决推理功能和训练功能分 离部署在不同的设备上,不支持AI神经网络模型的强化学习训练的问题。
[0005]第一方面,提供了一种样本确定方法,包括:
[0006]第一设备接收目标设备发送的第一信息,所述第一信息包括时变参数信息及人工智能 AI模型属性信息,所述时变参数信息用于指示通信行为的随机性;
[0007]所述第一设备基于目标推理模型的推理结果及所述时变参数信息,确定用于训练所述 目标推理模型的训练样本,所述目标推理模型为与所述AI模型属性信息对应的推理模型。
[0008]第二方面,提供了一种样本确定方法,包括:
[0009]目标设备向第一设备发送第一信息,所述第一信息包括时变参数信息及AI模型属性信 息,所述时变参数信息用于指示通信行为的随机性;
[0010]其中,所述时变参数信息及AI模型属性信息用于确定训练样本,所述训练样本用于训 练所述目标推理模型,所述目标推理模型为与所述AI模型属性信息对应的推理模型。
[0011]第三方面,提供了一种样本确定装置,第一设备包括所述样本确定装置,包括:
[0012]接收模块,用于接收目标设备发送的第一信息,所述第一信息包括时变参数信息及人 工智能AI模型属性信息,所述时变参数信息用于指示通信行为的随机性;
[0013]第一确定模块,用于基于目标推理模型的推理结果及所述时变参数信息,确定用于训 练所述目标推理模型的训练样本,所述目标推理模型为与所述AI模型属性信息对应的推理 模型。
[0014]第四方面,提供了一种样本确定装置,目标设备包括所述样本确定装置,包括:
[0015]发送模块,用于向第一设备发送第一信息,所述第一信息包括时变参数信息及AI模型 属性信息,所述时变参数信息用于指示通信行为的随机性;
[0016]其中,所述时变参数信息及AI模型属性信息用于确定训练样本,所述训练样本用于训 练所述目标推理模型,所述目标推理模型为与所述AI模型属性信息对应的推理模型。
[0017]第五方面,提供了一种电子设备,所述电子设备为第一设备,包括处理器和存储器, 所述存储器存储可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行 时实现如第一方面所述的方法的步骤。
[0018]第六方面,提供了一种电子设备,所述电子设备为第一设备,包括处理器及通信接口, 其中,所述通信接口用于接收目标设备发送的第一信息,所述第一信息包括时变参数信息 及人工智能AI模型属性信息,所述时变参数信息用于指示通信行为的随机性;所述处理器 用于基于目标推理模型的推理结果及所述时变参数信息,确定用于训练所述目标推理模型 的训练样本,所述目标推理模型为与所述AI模型属性信息对应的推理模型。
[0019]第七方面,提供了一种电子设备,所述电子设备为目标设备,包括处理器和存储器, 所述存储器存储可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行 时实现如第二方面所述的方法的步骤。
[0020]第八方面,提供了一种电子设备,所述电子设备为目标设备,包括处理器及通信接口, 其中,所述通信接口用于向第一设备发送第一信息,所述第一信息包括时变参数信息及AI 模型属性信息,所述时变参数信息用于指示通信行为的随机性;其中,所述时变参数信息 及AI模型属性信息用于确定训练样本,所述训练样本用于训练所述目标推理模型,所述目 标推理模型为与所述AI模型属性信息对应的推理模型。
[0021]第九方面,提供了一种样本确定系统,包括:第一设备及目标设备,所述第一设备可 用于执行如第一方面所述的样本确定方法的步骤,所述目标设备可用于执行如第二方面所 述的样本确定方法的步骤。
[0022]第十方面,提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程 序或指令被处理器执行时实现如第一方面所述的方法的步骤,或者实现如第二方面所述的 方法的步骤。
[0023]第十一方面,提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所 述处理器耦合,所述处理器用于运行程序或指令,实现如第一方面所述的方法,或实现如 第二方面所述的方法。
[0024]第十二方面,提供了一种计算机程序/程序产品,所述计算机程序/程序产品被存储在存 储介质中,所述计算机程序/程序产品被至少一个处理器执行以实现如第一方面所述的样本 确定方法的步骤,或者,所述计算机程序/程序产品被至少一个处理器执行以实现如第二方 面所述的样本确定方法的步骤。
[0025]本申请实施例中,第一设备接收目标设备发送的第一信息,所述第一信息包括时变参 数信息及人工智能AI模型属性信息,所述时变参数信息用于指示通信行为的随机性;所述 第一设备基于目标推理模型的推理结果及所述时变参数信息,确定用于训练所述目标推理 模型的训练样本,所述目标推理模型为与所述AI模型属性信息对应的推理模型。这样,通 过第一设备与目标设备交互获取时变参数信息及AI模型属性信息,在第一设备上获取用于 训练所述目标推理模型的训练样本,能够利用第一设备的网络环境对目标推理模
型进行训 练,从而能够实现目标推理模型的强化学习训练。
附图说明
[0026]图1是本申请实施例可应用的一种无线通信系统的框图;
[0027]图2是本申请实施例提供的一种样本确定方法的流程图之一;
[0028]图3是本申请实施例提供的一种样本确定方法的流程图之二;
[0029]图4是本申请实施例提供的一种样本确定装置的结构图之一;
[0030]图5是本申请实施例提供的一种样本确定装置的结构图之二;
[0031]图6是本申请实施例提供的一种通信设备的结构图;
[0032]图7是本申请实施例提供本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种样本确定方法,其特征在于,包括:第一设备接收目标设备发送的第一信息,所述第一信息包括时变参数信息及人工智能AI模型属性信息,所述时变参数信息用于指示通信行为的随机性;所述第一设备基于目标推理模型的推理结果及所述时变参数信息,确定用于训练所述目标推理模型的训练样本,所述目标推理模型为与所述AI模型属性信息对应的推理模型。2.根据权利要求1所述的方法,其特征在于,所述时变参数信息包括时变贪心参数。3.根据权利要求1所述的方法,其特征在于,所述时变参数信息包括第一边界参数、第二边界参数及训练进程参数,所述第一边界参数用于指示时变贪心参数的起始边界和终止边界,所述第二边界参数用于指示时变贪心策略使能训练进程的起始信息和终止信息。4.根据权利要求3所述的方法,其特征在于,所述目标设备包括第二设备及第三设备,所述第一设备接收目标设备发送的第一信息,包括:所述第一设备接收所述第三设备发送的所述第一边界参数及第二边界参数;所述第一设备接收所述第二设备发送的所述训练进程参数及AI模型属性信息。5.根据权利要求3所述的方法,其特征在于,所述第一设备基于目标推理模型的推理结果及所述时变参数信息,确定用于训练所述目标推理模型的训练样本,包括:所述第一设备基于所述第一边界参数、所述第二边界参数及所述训练进程参数,确定时变贪心参数;所述第一设备基于目标推理模型的推理结果及所述时变贪心参数,确定用于训练所述目标推理模型的训练样本。6.根据权利要求3所述的方法,其特征在于,所述第一设备基于所述第一边界参数、第二边界参数及训练进程参数,确定时变贪心参数,包括:所述第一设备基于所述第二边界参数及所述训练进程参数,确定训练进度参数;所述第一设备基于所述训练进度参数及所述第一边界参数确定时变贪心参数。7.根据权利要求1

6中任一项所述的方法,其特征在于,所述第一设备基于目标推理模型的推理结果及所述时变参数信息,确定用于训练所述目标推理模型的训练样本,包括:所述第一设备基于目标推理模型的推理结果及所述时变参数信息,确定目标通信行为;其中,所述训练样本包括所述目标通信行为。8.根据权利要求7所述的方法,其特征在于,所述目标通信行为包括如下至少一项:预测信道质量最强的收发波束组合;上报信道质量最强的发送波束;选择调制和编码方案MCS;选择配对用户组合;选择配对波束。9.根据权利要求7所述的方法,其特征在于,所述第一设备基于目标推理模型的推理结果及所述时变参数信息,确定目标通信行为之前,所述方法还包括:所述第一设备将历史的状态信息输入所述目标推理模型,得到所述推理结果;其中,所述训练样本还包括所述历史的状态信息。10.根据权利要求7所述的方法,其特征在于,所述确定目标通信行为后,所述方法还包
括:所述第一设备执行所述目标通信行为;所述第一设备确定所述目标通信行为对应的目标奖励及更新的状态信息,所述目标奖励用于指示网络性能;其中,所述训练样本还包括所述目标奖励及所述更新的状态信...

【专利技术属性】
技术研发人员:周通
申请(专利权)人:维沃移动通信有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1