专利查询
首页
专利评估
登录
注册
当前位置:
首页
>
专利查询
>
华东师范大学
>
一种基于偏好传递性的人在回路强化学习数据增强方法技术
>技术资料下载
下载一种基于偏好传递性的人在回路强化学习数据增强方法的技术资料
文档序号:43285980
温馨提示:您尚未登录,请点
登陆
后下载,如果您还没有账户请点
注册
,登陆完成后,请刷新本页查看技术详细信息。
本发明公开了一种基于偏好传递性的人在回路强化学习数据增强方法,其特点是该方法具体包括:每轮人类标注时从强化学习智能体动作序列库中采样动作序列;根据人类对动作序列对的偏好标注构建人类偏好依赖图;将人类偏好依赖图中的动作序列的均等偏好关系转换为...
该专利属于华东师范大学所有,仅供学习研究参考,未经过华东师范大学授权不得商用。
详细技术文档下载地址
温馨提示:您尚未登录,请点
登陆
后下载,如果您还没有账户请点
注册
,登陆完成后,请刷新本页查看技术详细信息。