【技术实现步骤摘要】
一种不同环境下BDI意图进展的学习方法、介质和设备
[0001]本专利技术涉及基于特定计算模型的计算机系统的
,特别涉及一种不同环境下BDI意图进展的学习方法、介质和设备。
技术介绍
[0002]智能体(Agent)是位于某环境中,通过感知信息并在该环境中自主行动来实现其设计目标的个体,智能体所在的环境可以是真实世界,也可以是计算机系统中的纯计算环境。智能体已被用于开发各种领域的应用,包括航天器、工业制造等。
[0003]在基于信念
‑
愿望
‑
意图(belief
‑
desire
‑
intention)的智能体体系结构中,BDI智能体的行为是根据信念、目标和计划来指定的。信念表示智能体关于环境(和自身)的信息。目标表示智能体试图实现的环境的期望状态。计划是智能体修改环境以实现其目标的手段。计划由步骤组成,这些步骤要么是直接改变智能体环境的基本动作,要么是由其他计划实现的子目标。对于每个顶级目标,智能体选择一个构成意图根源的计划,并开始执行计划中的步骤。如果意图的下一步是子目标,则选择(子)计划来实现子目标并将其添加到意图中,然后执行(子)计划中的步骤,以此类推。
[0004]针对意图进展问题,Yao等人提出了SA,一种基于蒙特卡洛(MCTS)搜索的方法,SA能够选择计划来实现智能体的目标,并在这些计划中交叉执行步骤。Thangarajah等人提出了目标
‑
计划树(GPT)的概念,以表示BDI智能体的目标和计划 ...
【技术保护点】
【技术特征摘要】
1.一种不同环境下BDI意图进展的学习方法,其特征在于:所述方法包括以下步骤:步骤1:获取目标计划树GPTs={t1,t2,t3.....t
n
}中的执行特征E
c
;步骤2:根据E
c
,通过修改生成GPTs时的初始环境s0中的部分变量值,生成让智能体进行学习的环境集合S;步骤3:对环境集合S的元素进行分类,分为有效环境和无效环境,只保留有效环境Env
e
让智能体学习,获取变量集合R
g
;步骤4:构建有向无环图DAG,保存智能体学习不同环境下的意图进展。2.根据权利要求1所述的一种不同环境下BDI意图进展的学习方法,其特征在于:所述步骤1包括以下步骤:步骤1.1:对于GPTs中的任一目标计划树GPT
i
,将其中所有计划构成计划集PS,获取计划集PS中所有计划的前置条件组成的集合PS
pre
;i为1至n的任一整数;步骤1.2:以GPT
i
中所有动作构成动作集AS,获取动作集AS中所有动作的后置条件组成的集合AS
post
;步骤1.3:该GPT
i
的执行特征E
ci
为{PS
pre
‑
AS
post
},获得属于集合PS
pre
但不属于集合AS
post
的变量;步骤1.4:依次获取GPTs中每个目标计划树的执行特征,得到GPTs的执行特征E
c
=E
c1
∪E
c2
∪E
c3
∪...∪E
cn
。3.根据权利要求1所述的一种不同环境下BDI意图进展的学习方法,其特征在于:所述步骤2包括以下步骤:步骤2.1:随机生成一个整数num,num为1至E
c
中变量个数间的任一整数,在初始环境s0中选择num个变量进行修改,变量属于E
c
且未被修改过;步骤2.2:修改选择的num个变量,即在初始环境s0中变量值为真则修改为假,变量值为假则修改为真,其余变量的值保持不变;步骤2.3:得到新环境s1,重复步骤2.1直至获得包括预期元素数量的环境集合S。4.根据权利要求1所述的一种不同环境下BDI意图进展的学习方法,其特征在于:所述步骤3包括以下步骤:步骤3.1:获取实现顶层目标TLG
i
的所有可能变量R
i
,TLG
i<...
【专利技术属性】
技术研发人员:宋程程,姚远,产思贤,刘晓莹,郑可琛,刘一帆,
申请(专利权)人:浙江工业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。