【技术实现步骤摘要】
本申请涉及车辆控制,更具体地,涉及一种模型训练方法、频谱资源分配方法、装置及电子设备。
技术介绍
1、随着新一代移动通信技术的不断发展,车联网因其具有推动智能交通和智慧城市发展的潜在价值,近年来受到全世界的关注。车联网通过将车辆连接到移动网络,实现车辆与车辆(vehicle to vehicle,v2v)、车辆与基础设施(vehicle to infrastructure,v2i)等全方位连接功能。而频谱资源是实现车联网通信的必备条件,但随着车联网应用范围的不断扩大和对网络通信性能要求的不断提高,现存的频谱资源和分配算法已经难以满足车联网中所有通信需求。
技术实现思路
1、鉴于上述问题,本申请提出了一种模型训练方法、频谱资源分配方法、装置及电子设备,可以通过策略评估模型为目标交互链路分配最优的频谱资源,提高频谱资源的利用率,更好的满足车联网中的通讯需求。
2、第一方面,本申请实施例提供了一种模型训练方法,所述方法包括:获取经验数据集,所述经验数据集为在测试车辆行驶通过目标路段的
...【技术保护点】
1.一种模型训练方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述基于所述经验数据集,对所述初始评估模型进行迭代训练,直至所述初始评估模型符合第一预设条件,得到训练后的所述初始评估模型作为所述策略评估模型,包括:
3.根据权利要求2所述的方法,其特征在于,所述将每条所述经验数据输入至初始价值模型,得到所述初始价值模型输出的每条所述经验数据对应的目标奖励值,包括:
4.根据权利要求2所述的方法,其特征在于,所述初始价值模型包括第一价值模型以及第二价值模型,所述将每条所述经验数据输入至初始价值模型,得到所述
...【技术特征摘要】
1.一种模型训练方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述基于所述经验数据集,对所述初始评估模型进行迭代训练,直至所述初始评估模型符合第一预设条件,得到训练后的所述初始评估模型作为所述策略评估模型,包括:
3.根据权利要求2所述的方法,其特征在于,所述将每条所述经验数据输入至初始价值模型,得到所述初始价值模型输出的每条所述经验数据对应的目标奖励值,包括:
4.根据权利要求2所述的方法,其特征在于,所述初始价值模型包括第一价值模型以及第二价值模型,所述将每条所述经验数据输入至初始价值模型,得到所述初始价值模型输出的每条所述经验数据对应的目标奖励值,包括:
5.根据权利要求1...
【专利技术属性】
技术研发人员:梁伟强,宋文明,张璨,李辉,郭和攀,魏璜,
申请(专利权)人:广州汽车集团股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。