温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。
本发明属于数据信任域策略优化技术领域,公开了一种信任域引导裁剪的策略优化方法、系统、存储介质及应用,所述信任域引导裁剪的策略优化方法包括:缓冲集合到经验回放器;从经验回放器中采样;计算批概率比矩阵、计算批KL距离矩阵;运用批KL距离矩阵根据...该专利属于中国人民解放军国防科技大学所有,仅供学习研究参考,未经过中国人民解放军国防科技大学授权不得商用。
温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。
本发明属于数据信任域策略优化技术领域,公开了一种信任域引导裁剪的策略优化方法、系统、存储介质及应用,所述信任域引导裁剪的策略优化方法包括:缓冲集合到经验回放器;从经验回放器中采样;计算批概率比矩阵、计算批KL距离矩阵;运用批KL距离矩阵根据...