智能决策方法及装置、电子设备、可读存储介质制造方法及图纸

技术编号:41626452 阅读:26 留言:0更新日期:2024-06-13 02:25
本公开提供了一种智能决策方法及装置、电子设备、可读存储介质,该方法包括:基于第一任务的决策知识信息确定所述第一任务对应的模型参数;基于所述模型参数对决策模型的网络参数进行调整;所述决策模型为第二任务的决策模型;所述网络参数调整后的决策模型用于任务决策。本公开提供的智能决策方法及装置、电子设备、可读存储介质可以提高智能体在新决策任务中决策的准确性。

【技术实现步骤摘要】

本公开属于智能控制,更具体地说,是涉及一种智能决策方法及装置、电子设备、可读存储介质


技术介绍

1、在工业控制、自动驾驶、游戏等领域,决策transformer发挥了巨大作用。通过扩展模型规模并充分利用庞大的离线数据集,进一步验证了决策transformer的有效性,将其打造成一种能够高效解决各类决策任务的通用智能体。虽然基于决策transformer的智能体在进行已知任务决策时准确性高,但是还不能很好地对分布外的决策任务做到很好的泛化,在进行新决策任务时准确性差。


技术实现思路

1、本公开的目的在于提供一种智能决策方法及装置、电子设备、可读存储介质,以提高智能体在新决策任务中决策的准确性。

2、本公开实施例的第一方面,提供了一种智能决策方法,包括:

3、基于第一任务的决策知识信息确定所述第一任务对应的模型参数;

4、基于所述模型参数对决策模型的网络参数进行调整;所述决策模型为第二任务的决策模型;所述网络参数调整后的决策模型用于任务决策。

5、本公开实施例的第本文档来自技高网...

【技术保护点】

1.一种智能决策方法,其特征在于,包括:

2.如权利要求1所述的智能决策方法,其特征在于,还包括:

3.如权利要求1所述的智能决策方法,其特征在于,所述基于第一任务的决策知识信息确定所述第一任务对应的模型参数,包括:

4.如权利要求3所述的智能决策方法,其特征在于,所述决策知识信息为多条,所述基于第一任务的决策知识信息确定所述第一任务对应的模型参数,包括:

5.如权利要求4所述的智能决策方法,其特征在于,所述将多个模型参数进行融合,得到融合后的模型参数,包括:

6.如权利要求1至5任一项所述的智能决策方法,其特征在于,所述网络参...

【技术特征摘要】

1.一种智能决策方法,其特征在于,包括:

2.如权利要求1所述的智能决策方法,其特征在于,还包括:

3.如权利要求1所述的智能决策方法,其特征在于,所述基于第一任务的决策知识信息确定所述第一任务对应的模型参数,包括:

4.如权利要求3所述的智能决策方法,其特征在于,所述决策知识信息为多条,所述基于第一任务的决策知识信息确定所述第一任务对应的模型参数,包括:

5.如权利要求4所述的智能决策方法,其特征在于,所述将多个模型参数进行融合,得到融合后的模型参数,包括:

6.如权利要求1至5任一项所述的智能决策方法,其特征在于,所述...

【专利技术属性】
技术研发人员:何召锋金永刚项刘宇郭嘉伟赵浩郑天昱侯金冰
申请(专利权)人:北京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1