一种不同环境下BDI意图进展的学习方法、介质和设备技术

技术编号：38557845 阅读：5 留言：0更新日期：2023-08-22 21:00

本发明专利技术涉及一种不同环境下BDI意图进展的学习方法、介质和设备，方法获取目标计划树中的执行特征，通过修改生成目标计划树时的初始环境中的部分变量值，生成让智能体进行学习的环境集合，对环境集合的元素分类，构建有向无环图DAG，保存智能体学习不同环境下的意图进展；介质存储不同环境下BDI意图进展的学习程序，执行所述方法，计算机设备的处理器执行程序实现所述方法。本发明专利技术提出执行特征的概念，以此来生成大量的环境让智能体进行学习，提出有效环境的概念，提高智能体学习环境的效率；提出让智能体学习以往环境的经验并保存为有向无环图，加快智能体的执行速度。加快智能体的执行速度。加快智能体的执行速度。

全部详细技术资料下载

【技术实现步骤摘要】
一种不同环境下BDI意图进展的学习方法、介质和设备

[0001]本专利技术涉及基于特定计算模型的计算机系统的
，特别涉及一种不同环境下BDI意图进展的学习方法、介质和设备。

技术介绍

[0002]智能体(Agent)是位于某环境中，通过感知信息并在该环境中自主行动来实现其设计目标的个体，智能体所在的环境可以是真实世界，也可以是计算机系统中的纯计算环境。智能体已被用于开发各种领域的应用，包括航天器、工业制造等。
[0003]在基于信念
‑
愿望
‑
意图(belief
‑
desire
‑
intention)的智能体体系结构中，BDI智能体的行为是根据信念、目标和计划来指定的。信念表示智能体关于环境(和自身)的信息。目标表示智能体试图实现的环境的期望状态。计划是智能体修改环境以实现其目标的手段。计划由步骤组成，这些步骤要么是直接改变智能体环境的基本动作，要么是由其他计划实现的子目标。对于每个顶级目标，智能体选择一个构成意图根源的计划，并开始执行计划中的步骤。如果意图的下一步是子目标，则选择(子)计划来实现子目标并将其添加到意图中，然后执行(子)计划中的步骤，以此类推。
[0004]针对意图进展问题，Yao等人提出了SA，一种基于蒙特卡洛(MCTS)搜索的方法，SA能够选择计划来实现智能体的目标，并在这些计划中交叉执行步骤。Thangarajah等人提出了目标
‑
计划树(GPT)的概念，以表示BDI智能体的目标和计划...

【技术保护点】

【技术特征摘要】
1.一种不同环境下BDI意图进展的学习方法，其特征在于：所述方法包括以下步骤：步骤1：获取目标计划树GPTs＝{t1，t2，t3.....t
n
}中的执行特征E
c
；步骤2：根据E
c
，通过修改生成GPTs时的初始环境s0中的部分变量值，生成让智能体进行学习的环境集合S；步骤3：对环境集合S的元素进行分类，分为有效环境和无效环境，只保留有效环境Env
e
让智能体学习，获取变量集合R
g
；步骤4：构建有向无环图DAG，保存智能体学习不同环境下的意图进展。2.根据权利要求1所述的一种不同环境下BDI意图进展的学习方法，其特征在于：所述步骤1包括以下步骤：步骤1.1：对于GPTs中的任一目标计划树GPT
i
，将其中所有计划构成计划集PS，获取计划集PS中所有计划的前置条件组成的集合PS
pre
；i为1至n的任一整数；步骤1.2：以GPT
i
中所有动作构成动作集AS，获取动作集AS中所有动作的后置条件组成的集合AS
post
；步骤1.3：该GPT
i
的执行特征E
ci
为{PS
pre
‑
AS
post
}，获得属于集合PS
pre
但不属于集合AS
post
的变量；步骤1.4：依次获取GPTs中每个目标计划树的执行特征，得到GPTs的执行特征E
c
＝E
c1
∪E
c2
∪E
c3
∪...∪E
cn
。3.根据权利要求1所述的一种不同环境下BDI意图进展的学习方法，其特征在于：所述步骤2包括以下步骤：步骤2.1：随机生成一个整数num，num为1至E
c
中变量个数间的任一整数，在初始环境s0中选择num个变量进行修改，变量属于E
c
且未被修改过；步骤2.2：修改选择的num个变量，即在初始环境s0中变量值为真则修改为假，变量值为假则修改为真，其余变量的值保持不变；步骤2.3：得到新环境s1，重复步骤2.1直至获得包括预期元素数量的环境集合S。4.根据权利要求1所述的一种不同环境下BDI意图进展的学习方法，其特征在于：所述步骤3包括以下步骤：步骤3.1：获取实现顶层目标TLG
i
的所有可能变量R
i
，TLG
i<...

【专利技术属性】
技术研发人员：宋程程，姚远，产思贤，刘晓莹，郑可琛，刘一帆，
申请(专利权)人：浙江工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人