一种基于自然对话的智能体层次化技能生成方法技术

技术编号：38271641 阅读：10 留言：0更新日期：2023-07-27 10:25

本发明专利技术公开一种基于自然对话的智能体层次化技能生成方法，用户通过语音或文本输入方式与智能体进行自然语言交互，并自动生成可被智能体直接执行的、层次化的行为树结构，该行为树实时驱动智能体在其世界环境中执行相应的状态检查和操作技能。同时，用户还能够获得可视化的学生模型，以随时查看行为树库中的已有技能及其组成结构，并实时掌握当前行为树运行状态。用户使用自然语言传授的层次化技能结构被保存在行为树库中，并在后续的调用中具有参数泛化能力。本发明专利技术是一种任何用户群都可掌握的免编程智能体层次化技能生成方法，具有一次学习的能力，且具有强逻辑性、强泛化性和鲁棒性。棒性。棒性。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于自然对话的智能体层次化技能生成方法

[0001]本专利技术涉及机器人控制
，具体来说，是一种基于自然对话的智能体层次化技能生成方法。

技术介绍

[0002]随着信息科技的发展，使用智能体完成日常生活、工业生产、特殊领域中的各项技能成为不可避免的发展趋势，比如日常服务中的物体运送、工业流水线上的3C装配、航天领域的卫星装配等，且这些技能往往是以长序列的底层技能组合而成。使用这些智能体的用户或技术工人大多不具备智能体编程能力，但熟练掌握所需完成任务的技能步骤和流程。因此，如何让用户快速、高效地向智能体传授由层次化技能组成的操作任务成为一个重要的命题。受到人类社会教育学的启发，一种自然的想法是将智能体看作具备基本元技能(即不可再分割的底层技能)的“学徒”，而人类教师的作用是使用自然语言向学徒传授高层任务，并逐步向下分解至其已掌握且能实时执行的较低层技能。最终，智能体将自己具备的基本元技能组织为高层的完整操作技能，并具备参数泛化能力。
[0003]近年来，使用自然语言教授智能体操作技能成为一大研究热点，[Language
‑
conditioned imitation learning for robot manipulation tasks]Stepputtis等人将自然语言融入到操作任务的模仿学习中，[CALVIN:ABenchmark for Language
‑
Conditioned Policy Learning for Long
‑
Hori...

【技术保护点】

【技术特征摘要】
1.一种基于自然对话的智能体层次化技能生成方法，其特征在于：包括用户界面、自然语言理解模块、回复生成模块、技能模块、状态感知模块、行为管理模块，以及包含机械臂的虚拟或真实世界；所述用户界面用来实现智能体接收用户输入的文本信息或语音信息，并将语音信息转换为文本信息；所述自然语言理解模块用于对经用户界面输入和语音听写后的文本信息进行处理，采用训练好的JointBert模型根据文本信息给出直接用于生成层次化技能的槽位，并输出文本信息的意图，若意图为技能指令时，对意图进行处理，具体为：首先查询技能模块中存储的已经具备的所有技能，判断技能是否为已学技能，若已学则直接进行技能调用；否则，在技能模块中进行同义技能判断，若存在同义技能，则将意图判定为同义查询，并向用户发起交互提问，以确定是否进行同义技能；当确认为同义技能时直接进行技能调用，若不存在同义技能或得到用户否定回复时，则将意图判定为学新技能；所述回复生成模块，采用ChatGPT与模板回复相结合的方式与用户间进行语言交互；其中，模板回复仅用于意图判断为同义查询的语言交互过程；除此以外，智能体产生的回复均由ChatGPT给出；所述技能模块中以行为树库对智能体所具有的技能进行表示和驱动；同时技能模块还对自然语言理解模块输出的意图进行同义技能判断；所述状态感知模块包括对世界环境和机械臂状态的查询，以配合技能模块中行为树库部分所述的执行条件、跳过条件、完成条件的检查，以及底层元技能的执行；所述行为管理模块中设计了一个由自然语言理解模块输出的语义信息自动生成行为树结构的算法，设计如下：首先进行初始化，获取当前以xml存储的行为树root和待运行主树的sequence节点main_seq，并建立一个存放所教学技能的栈Stack；然后等待用户输入，当用户输入为退出时，结束所有交互及技能执行，否则获取由自然语言理解模块给出的语义信息，包括用户意图intent，技能名skill_name，槽位slot、槽位类型slot.type，并根据下述3种情况分别进行处理：情况1：用户意图为学新技能；在root下新建一个ID为技能名skill_name的子树new_tree，并向其添加一个sequence节点seq_node；然后将所有槽位都以黑板键值对的形式添加在seq_node下，键为槽位slot,值为其类型slot.type在其父级树中对应的值，记作{slot.type}；接下来将新技能添加在其父节点技能之下；若栈Stack为空，所述父节点为main_seq，否则为栈顶存储的sequence节点；取到父节点f_seq后，查询f_seq下的已有黑板键值对，如果当前新技能所包含的参数尚未存在于黑板中，则补充其对应的键值对，此时键为该槽位slot，值为该槽位对应的元技能运行参数；然后在该父节点f_seq下写明该新技能子树的ID和语义信息；当情况1的操作完成后，将seq_node放入栈Stack中；情况2：用户意图为技能调用；首先判断该调用技能的父节点，当栈Stack为空时，此时的父节点为main_seq，否则为栈顶存储的sequence节点；然后将现在所调用的技能添加至该父节点f_seq；同样先查询f_seq下的已...

【专利技术属性】
技术研发人员：戴树岭，王恺怡，赵永嘉，张宁，雷小永，
申请(专利权)人：北京航空航天大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人