【技术实现步骤摘要】
教练装置及其合作运作控制方法
本专利技术是关于一种用于教练式驱动多机器人合作运作系统的教练装置及其合作运作控制方法。具体而言,本专利技术的教练装置将多个行动机器人划分为多个行动群组,并藉由精简各行动群组中该等行动机器人的该等状态空间数据,以降低训练合作模型的数据量。
技术介绍
随着科技的发展,机器人已逐渐融入人类的生活,以协助人类完成各种任务。近年来仓储机器人风靡全球,电子商务营运商藉由仓储机器人可有效地进行仓储管理,以节省所需的人工,例如:对货物进行分拣、搬运、放置操作等。除了仓储管理外,机器人亦可运用于港口漂流物清理、巡检、追捕、避障等应用。在前述这些应用中,机器人间需要通过合作运作来完成目标任务。然而,传统机器人合作运作是基于状态-动作(State-Action)控制,无法即时规划最佳避障路径,难以负荷多机器人的避障合作运作,最终产生机器人冻结(freezingrobot)问题。再者,机器人行走处理合作运作问题(例如:避免碰撞、追捕行为、共同清洁等)亦需要短时间内快速反应。有鉴于此,如何提供一种合作运作机制,其 ...
【技术保护点】
1.一种用于一教练式驱动多机器人合作运作系统的教练装置,包括:/n一存储器,存储一精简状态空间模型、一合作学习模型及一策略库;/n一通信接口,用以与多个行动机器人连线;以及/n一处理器,电性连接该存储器及该通信接口,用以执行以下操作:/n通过该通信接口,自各该行动机器人接收一状态空间数据及一目标信息;/n根据该等目标信息及该等状态空间数据,将该等行动机器人划分为多个行动群组;/n将该等状态空间数据输入至该精简状态空间模型,以产生多个精简状态空间数据,其中各该精简状态空间数据对应至该等行动群组其中之一,且经由整合所对应的该行动群组中至少一该等行动机器人的至少一该等状态空间数据 ...
【技术特征摘要】
20181127 TW 1071422861.一种用于一教练式驱动多机器人合作运作系统的教练装置,包括:
一存储器,存储一精简状态空间模型、一合作学习模型及一策略库;
一通信接口,用以与多个行动机器人连线;以及
一处理器,电性连接该存储器及该通信接口,用以执行以下操作:
通过该通信接口,自各该行动机器人接收一状态空间数据及一目标信息;
根据该等目标信息及该等状态空间数据,将该等行动机器人划分为多个行动群组;
将该等状态空间数据输入至该精简状态空间模型,以产生多个精简状态空间数据,其中各该精简状态空间数据对应至该等行动群组其中之一,且经由整合所对应的该行动群组中至少一该等行动机器人的至少一该等状态空间数据所产生;
将该等精简状态空间数据输入至该合作学习模型,以训练并生成一合作模型;
针对各该行动群组,根据该等精简状态空间数据,自该策略库选择一群组策略;以及
针对各该行动群组,通过该通信接口,将该合作模型及该群组策略传送至该行动群组中各该行动机器人,以使该行动群组中各该行动机器人根据该合作模型及该群组策略执行一行动任务。
2.如权利要求1所述的教练装置,其特征在于,各该状态空间数据包括一自身位置值、一移动物体位置值、一固定物体位置值及一可行走方向值。
3.如权利要求2所述的教练装置,其特征在于,针对各该行动群组,该处理器根据该行动群组中该等行动机器人的该等状态空间数据中的该等自身位置值、该等移动物体值及该等可行走方向值,计算该行动群组的一群组自身位置值、一移动群组值及一群组可行走方向值,以及该行动群组的该精简状态空间数据包括该群组自身位置值、该移动群组值、该群组可行走方向值及该等行动机器人的该等固定物体位置值。
4.如权利要求2所述的教练装置,其特征在于,该处理器是根据该目标信息及该等状态空间数据的该等自身位置值,动态地将该等行动机器人划分为该等行动群组,以及各该行动群组中的至少一该等行动机器人彼此邻近且具有一相同的行动目标、一相同的行动行为或其组合。
5.如权利要求1所述的教练装置,其特征在于,针对各该行动群组,该处理器更执行一策略选择程序,其包括以下操作:
自该策略库选择多个候选策略;
产生具有该等候选策略的一策略投票消息;
通过该通信接口传送该策略投票消息至该行动群组的该等行动机器人;
通过该通信接口自该行动群组中各该行动机器人接收一策略选择消息;以及
根据该等策略选择消息,自该等候选策略选择该群组策略。
6.如权利要求5所述的教练装置,其特征在于,针对各该行动群组,该处理器更执行以下操作:
判断是否通过该通信接口,自该行动群组中该等行动机器人至少其中之一接收一策略要求消息;
判断传送该策略要求消息的该等行动机器人的一数量是否超过该行动群组的该等行动机器人的一总数的一比例;以及
当该数量超过该总数的该比例时,重新执行该策略选择程序。
7.如权利要求1所述的教练装置,其特征在于,该通信接口用以与多个感测装置连线,以及该处理器更通过该通信接口自该等感测装置接收多个感测数据,并将该等精简状态空间数据及该等感测数据输入至该合作学习模型,以训练并生成该合作模型。
8.如权利要求1所述的教练装置,其特征在于,该处理器更通过该通信接口自该等行动机器人其中之一接收一脱离群组要求消息。
9.如权利要求1所述的教练装置,其特征在于,该合作学习模型基于一增强式学习演算法,训练并生成该合作模型。
10.如权利要求1所述的教练装置,其特征在于,各该行动群组的该群组策略是一移动策略。
11.一种合作运作控制方法,适用于一教练式驱动多机器人合作运作系统的一教练装置,该教...
【专利技术属性】
技术研发人员:王秉丰,郭忠义,王蓁蒂,
申请(专利权)人:财团法人资讯工业策进会,
类型:发明
国别省市:中国台湾;71
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。