下载基于分层强化学习的因果发现方法、装置、介质及设备的技术资料

文档序号:35909201

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。

本发明提供了一种基于分层强化学习的因果发现方法、装置、介质及设备,所述方法包括:基于强化学习方法,构建高层和低层策略网络;按照预设步长运行高层策略网络,对变量进行处理,生成无向图,并获取外部奖励;根据当前无向图以及无向图的历史记录,获取好奇...
该专利属于哈尔滨工业大学所有,仅供学习研究参考,未经过哈尔滨工业大学授权不得商用。

详细技术文档下载地址

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。