【技术实现步骤摘要】
BDI计划执行中的偏序关系的学习方法、介质和设备
[0001]本专利技术涉及基于特定计算模型的计算机系统的
,特别涉及一种BDI智能体计划执行中的偏序关系的学习方法、介质和设备。
技术介绍
[0002]智能体(Agent)是位于某环境中,通过感知信息并在该环境中自主行动来实现其设计目标的个体,智能体所在的环境可以是真实世界,也可以是计算机系统中的纯计算环境。智能体已被用于开发各种领域的应用,包括航天器、工业制造等。
[0003]作为最常用的智能体设计体系结构之一,基于实践推理(practical reasoning)的Belief
‑
Desire
‑
Intention(BDI)体系结构使用信念(belief)、愿望(desire)以及意图(intention)等概念来表示智能体的心智状态,并通过实践推理来决定下一步应该采取的行动。
[0004]BDI智能体拥有着用来实现给定设计目标的计划库,智能体则需从计划库中选择不同的计划(Plan)来实现目标(计划选择问题),不同的计划有着其执行前必须满足的前置条件(Precondition)以及完成该计划所需要实现的步骤,计划中的步骤可以是智能体能够直接执行的基本动作(action)或者是需要由其他计划实现的子目标(subGoal);在目标实现过程中,智能体承诺还需执行的步骤被称为智能体实现该目标的意图(intention),即实现该目标还需要做什么。在许多实际问题中,BDI智能体会被同时赋予多个目标。此时,BDI智能体
【技术保护点】
【技术特征摘要】
1.一种BDI计划执行中偏序关系的学习方法,其特征在于:所述方法包括以下步骤:步骤1:获取偏序目标计划树中所有的计划,构成计划集PS;步骤2:遍历计划集PS中的计划P
i
,根据计划P
i
中所包含的步骤集合V及偏序关系生成其对应的决策树,i为计划集中计划的序号;步骤3:计划集PS中所有计划的决策树创建成功后,给定m次机会让智能体使用MCTS算法调度智能体意图,更新决策树;步骤4:经过m次学习后,根据学习到的决策树的结果,将偏序目标计划树转化为目标计划树。2.根据权利要求1所述的一种BDI计划执行中偏序关系的学习方法,其特征在于:步骤2中,生成所述决策树包括以下步骤:步骤2.1:构建表示决策树的多元组DT
i
=(P,R,curNode),其中,P表示该决策树归属于计划集PS中的计划P
i
,R表示该决策树的根节点,curNode表示该决策树当前指向的节点;步骤2.2:构建表示决策树中的节点的多元组DTN=(V
N
,E
c
,E
f
,E
p
,E
e
,visit),其中,V
N
为该节点对应的步骤集合V中的步骤,E
c
表示该节点的孩子节点所构成的集合,E
f
表示该节点的父节点,E
p
表示从根节点到该节点所经历的所有节点中V
N
组成的集合,E
e
表示该节点下可扩展的节点的V
N
组成的集合,visit表示该节点的访问次数;步骤2.3:构建决策树的根节点DTN
R
,DTN
R
的V
N
为P
i
,E
f
、E
p
为空,visit=0,遍历步骤集合V并结合偏序关系,找到其对应的E
e
,设置决策树DT
i
的根节点R和curNode为DTN
R
;步骤2.4:判断决策树是否满足要求,若是,则进行步骤3,否则进行下一步;步骤2.5:顺序获取决策树DT
i
中curNode的E
e
中的一个元素且该元素不属于curNode的孩子节点V
N
所构成的集合,记为E
ei
,以此创建新的决策树节点DTN
i
,DTN
i
的V
N
为E
ei
,将DTN
i
加入curNode的E
c
,设置DTN
i
的E
f
为curNode,DTN
i
的E
p
为curNode的E
p
∪V
N
,遍历步骤集合V,并结合偏序关系,找到其对应的E
e
,设置visit为0,更新DT
i
的curNode为新创建节...
【专利技术属性】
技术研发人员:宋程程,姚远,产思贤,刘晓莹,郑可琛,刘一帆,
申请(专利权)人:浙江工业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。