下载用于自动影响执行器的方法和设备的技术资料

文档序号:26477949

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。

本发明涉及用于自动影响执行器的设备和方法,其中通过用于学习政策的探索策略提供执行器或其环境的至少一个状态,其中通过政策根据状态来定义用于自动影响执行器的动作,其中将状态值定义为在遵循政策下从状态出发实现的报酬总和的期望值,其中将状态动作值定...
该专利属于罗伯特·博世有限公司所有,仅供学习研究参考,未经过罗伯特·博世有限公司授权不得商用。

详细技术文档下载地址

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。