【技术实现步骤摘要】
本公开属于智能控制,更具体地说,是涉及一种智能决策方法及装置、电子设备、可读存储介质。
技术介绍
1、在工业控制、自动驾驶、游戏等领域,决策transformer发挥了巨大作用。通过扩展模型规模并充分利用庞大的离线数据集,进一步验证了决策transformer的有效性,将其打造成一种能够高效解决各类决策任务的通用智能体。虽然基于决策transformer的智能体在进行已知任务决策时准确性高,但是还不能很好地对分布外的决策任务做到很好的泛化,在进行新决策任务时准确性差。
技术实现思路
1、本公开的目的在于提供一种智能决策方法及装置、电子设备、可读存储介质,以提高智能体在新决策任务中决策的准确性。
2、本公开实施例的第一方面,提供了一种智能决策方法,包括:
3、基于第一任务的决策知识信息确定所述第一任务对应的模型参数;
4、基于所述模型参数对决策模型的网络参数进行调整;所述决策模型为第二任务的决策模型;所述网络参数调整后的决策模型用于任务决策。
...
【技术保护点】
1.一种智能决策方法,其特征在于,包括:
2.如权利要求1所述的智能决策方法,其特征在于,还包括:
3.如权利要求1所述的智能决策方法,其特征在于,所述基于第一任务的决策知识信息确定所述第一任务对应的模型参数,包括:
4.如权利要求3所述的智能决策方法,其特征在于,所述决策知识信息为多条,所述基于第一任务的决策知识信息确定所述第一任务对应的模型参数,包括:
5.如权利要求4所述的智能决策方法,其特征在于,所述将多个模型参数进行融合,得到融合后的模型参数,包括:
6.如权利要求1至5任一项所述的智能决策方法,其
...【技术特征摘要】
1.一种智能决策方法,其特征在于,包括:
2.如权利要求1所述的智能决策方法,其特征在于,还包括:
3.如权利要求1所述的智能决策方法,其特征在于,所述基于第一任务的决策知识信息确定所述第一任务对应的模型参数,包括:
4.如权利要求3所述的智能决策方法,其特征在于,所述决策知识信息为多条,所述基于第一任务的决策知识信息确定所述第一任务对应的模型参数,包括:
5.如权利要求4所述的智能决策方法,其特征在于,所述将多个模型参数进行融合,得到融合后的模型参数,包括:
6.如权利要求1至5任一项所述的智能决策方法,其特征在于,所述...
【专利技术属性】
技术研发人员:何召锋,金永刚,项刘宇,郭嘉伟,赵浩,郑天昱,侯金冰,
申请(专利权)人:北京邮电大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。