一种基于人机交互的可靠行为树任务规划方法及系统技术方案

技术编号:37369627 阅读:48 留言:0更新日期:2023-04-27 07:15
本发明专利技术提供一种基于人机交互的可靠行为树任务规划方法及系统,包括:根据预先构建的行为树知识库和人机交互决策方式,确定动作结点集;将所述动作结点集输入自动规划算法中进行行为树任务规划,获取规划完成的行为树;其中,所述人机交互决策方式是在行为树任务规划中通过人机交互方式确定任务规划方向。本发明专利技术通过在算法实时的规划过程中通过人机交互决策方式进行规划方向把控,既能通过人的决策保障规划方向的正确性,又能针对当前规划目标和应用场景实时修正预设规则的不足之处,更能在面对复杂多变情况时保证最为全面的规划,使规划结果可信、可解释、可直接应用。可直接应用。可直接应用。

【技术实现步骤摘要】
一种基于人机交互的可靠行为树任务规划方法及系统


[0001]本专利技术属于人机交互
,具体涉及一种基于人机交互的可靠行为树任务规划方法及系统。

技术介绍

[0002]行为树(Behavior Tree,BT)作为一种流行的控制体系结构在计算机游戏和机器人行业中发展起来,它模拟机器人的行为并控制其任务切换。目前,实践中使用的绝大多数BTs都是由任务规划人员手动设计的,需要BT设计师的丰富经验和知识。然而,机器人任务变得越来越多样化和复杂。
[0003]为了解决这一问题,近年来,自动生成BT的研究已成为学术界的一个热点,它提高了创建BT的效率。通常,用于自动BT生成的方法可分为两类,基于学习的方法和基于规划的方法。一些基于学习的BT生成方法使用进化算法进行,包括遗传编程算法、语法进化算法和混合进化算法。此外,强化学习算法和演示学习方法也被采用到自动BT生成方法中。
[0004]尽管基于学习的方法对于未知环境中的机器人更具鲁棒性,但学习过程耗时且对人类的可解释性较差,尤其是在安全应用和医疗情况下,需要可靠、可解释和人类可接受的任本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于人机交互的可靠行为树任务规划方法,其特征在于,包括:根据预先构建的行为树知识库和人机交互决策方式,确定动作结点集;将所述动作结点集输入自动规划算法中进行行为树任务规划,获取规划完成的行为树;其中,所述人机交互决策方式是在行为树任务规划中通过人机交互方式确定任务规划方向。2.如权利要求1所述的方法,其特征在于,所述行为树知识库的构建,包括:将已验证行为树中的知识以元动作结点形式进行保存,确定动作结点;根据已验证行为树中的动作结点和已验证的行为树结构,获取相邻动作结点关系;并根据预设假设条件,将每个所述相邻动作结点关系抽象为不同的预设动作结点元素;根据每个所述动作结点元素构建行为树知识库;其中,所述行为树知识库允许出现同名动作结点,但不允许出现相同动作结点元素。3.如权利要求2所述的方法,其特征在于,每个所述动作结点元素可抽象为下述中的一种或多种成员结构:前续结点、祖先结点、相对层深、增量层深、并行结点标记和前续结点队列;所述前续结点表示知识提取过程中相邻前置动作结点的名称;所述祖先结点表示与前续结点共有的、最亲缘祖先控制流结点类型;所述相对层深表示当前动作结点相对于祖先结点的深度;所述增量层深表示祖先与前续动作结点之间的深度差;所述并行结点标记表示同前置结点的祖先结点是否可以是并行结点;所述前续结点队列表示在知识提取阶段存储的递归前置动作结点集。4.如权利要求1所述的方法,其特征在于,所述人机交互决策方式包括:在所述行为树知识库中通过用户输入动作结点集,规定用户决策对所述行为树知识库中未检索到的动作结点是否进行移除操作;并规定在进行行为树自动规划过程中,当无法规划出唯一的初始动作结点时,则通过用户决策从计算机提供的候选动作结点中筛选出一个具体的候选动作结点作为初始动作结点;当一个动作结点,对应多个候选动作结点元素时,则通过用户决策筛选出一个具体的候选动作结点元素。5.如权利要求4所述的方法,其特征在于,所述将所述动作结点集输入自动规划算法中进行行为树任务规划,获取规划完成的行为树,包括:将动作结点集和行为树知识库输入自动规划算法中;通过检查所述动作结点集中的动作结点是否符合第一预设规划条件,获取检查结果;当所述检查结果显示为是时,通过筛选出符合第二预设规划条件的动作结点作为待规划行为树的初始动作结点,当所述检查结果显示为否时,根据所述人机交互的决策方式对所述动作结点集进行修正;基于所述初始动作结点,判断所述初始动作结点是否对应多个动作结点元素,获取判断结果;当所述判断结果显示为否时,根据待规划动作结点在行为树知识库中对应的候选动作
结点元素,进行行为树规划迭代,选择出下一个候选动作结点元素,当所述判断结果显示为是时,根据所述人机交互的决策方式选择出一个具体的候选动作结点元素;在每次迭代过程中根据规划进度的当前动作结点,对待规划行为树结构进行更新;当待规划动作结点集为空时,则规划完成,获取更新完成的行为树;其中,所述第一预设规划条件包括:动作结点没有重复动作和动作结点没有未知动作;所述第二预设规划条件包括:行为树知识库中初始动作结点存在无前续结点的结点元素;或当行为树知识库中初始动作结点不存在无前续结点的动作结点元素时,所述动作结点元素中的前续结点必须不在动作结点集中。6.一种基于人机交...

【专利技术属性】
技术研发人员:李晶华武云龙李皓赵晓晴徐萌田涛
申请(专利权)人:天津滨海人工智能创新中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1