下载模型训练方法、策略生成方法、装置、电子设备及介质的技术资料

文档序号:44551024

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。

本申请实施例提供了一种模型训练方法、策略生成方法、装置、电子设备及介质,涉及数据处理技术领域,该方法包括:生成样本经验,其中样本经验包括:第一状态、经验动作、经验回报和第二状态。然后利用估计神经网络确定在第一状态下执行经验动作后的估计奖励值...
该专利属于中北大学所有,仅供学习研究参考,未经过中北大学授权不得商用。

详细技术文档下载地址

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。