【技术实现步骤摘要】
一种机器人避障方法、装置和系统
本申请涉及电子设备领域,尤其涉及一种机器人避障方法、装置和系统。
技术介绍
机器人(例如扫地机器人)已经被广泛应用于人们的日常生活中。由于机器人的工作几乎是完全自主的,因此,在工作的过程中,经常会遇到一些被困的情况。目前,可通过使用机器学习的方法来训练机器人进行识别困境,以进行避障。其中,较常见的机器学习方法包括监督学习和强化学习。在监督学习中,需要人工收集大量的样本数据,并人工给这些样本数据打上对应的被困住或未被困住的标签,然后对打上标签的样本数据进行监督学习模型训练,获得对应模型,以便机器人根据该模型判断是否需要进行避障。示例性的,以机器人是扫地机器人,样本数据为扫地机器人所处的环境信息为例。如图1A所示的环境信息,因为,扫地机器人被插排的连接线所困,无法自由移动,因此,人工可为该样本数据打上被困住的标签。又如,如图1B所示的环境中,扫地机器人并未插排及其连接线所困,可以自由移动,因此,人工可以为该样本数据打上未被困住的标签。又如,在图2A所示的环境中,扫地机器人处于墙壁以及固定物体的夹角位置,无法继续自由移动,因此,人工可以为将该样本数据打上被困住的标签。又如,在图2B所示的环境中,扫地机器人处于远离墙壁以及固定物体的位置,可以继续自由移动,因此,人工可以为该样本数据打上未被困住的标签。又如,在图3A所示的环境中,扫地机器人处于固定物体与地面之间的缝隙中,无法继续自由移动,因此,人工可以为该样本数据打上被困住的标签。对应的,如图3B所示,机器人远离固定物体以及固定物体与地面之间的缝隙,可以自由移动,那么人工可以为该样本 ...
【技术保护点】
1.一种机器人避障方法,其特征在于,所述方法包括:所述机器人获取所述机器人移动过程中N个时刻的样本信息,N为大于0的整数;其中,N个时刻中每个时刻的样本信息包括:用于指示该时刻所述机器人所处环境的环境图像信息、用于指示所述机器人该时刻在所述环境图像信息指示的环境中的位置的位置信息,以及用于指示所述机器人该时刻的状态的标签信息;所述标签信息包括第一标签或第二标签,所述第一标签用于指示所述机器人处于未被困住状态,所述第二标签用于指示所述机器人处于被困住状态;所述机器人将N个时刻中M个时刻的样本信息发送给服务器,M为小于或等于N的正整数;所述机器人从所述服务器接收困境识别模型,所述困境识别模型由一个或者多个机器人采集的样本信息训练所得;所述机器人根据所述困境识别模型在移动过程中进行避障。
【技术特征摘要】
1.一种机器人避障方法,其特征在于,所述方法包括:所述机器人获取所述机器人移动过程中N个时刻的样本信息,N为大于0的整数;其中,N个时刻中每个时刻的样本信息包括:用于指示该时刻所述机器人所处环境的环境图像信息、用于指示所述机器人该时刻在所述环境图像信息指示的环境中的位置的位置信息,以及用于指示所述机器人该时刻的状态的标签信息;所述标签信息包括第一标签或第二标签,所述第一标签用于指示所述机器人处于未被困住状态,所述第二标签用于指示所述机器人处于被困住状态;所述机器人将N个时刻中M个时刻的样本信息发送给服务器,M为小于或等于N的正整数;所述机器人从所述服务器接收困境识别模型,所述困境识别模型由一个或者多个机器人采集的样本信息训练所得;所述机器人根据所述困境识别模型在移动过程中进行避障。2.根据权利要求1所述的方法,其特征在于,每个时刻的环境图像信息包括:在该时刻所述机器人所处环境中,所述机器人的移动线路上及移动路线周边物体的图像信息。3.根据权利要求1或2所述的方法,其特征在于,每个时刻的位置信息包括:该时刻的环境图像信息指示的环境中,所述机器人与所述机器人的移动线路上及移动线路周边的物体的相对位置信息。4.根据权利要求1-3中任一项所述的方法,其特征在于,所述机器人将N个时刻中M个时刻的样本信息发送给服务器,包括:所述机器人确定所述N个时刻的样本信息中,第N个时刻的样本信息包括的标签信息用于指示所述机器在所述第N个时刻处于被困住的状态;所述机器人将所述第N个时刻的前M-1个时刻的样本信息和所述第N个时刻的样本信息发送给所述服务器。5.根据权利要求1-4中任一项所述的方法,其特征在于,所述机器人根据所述困境识别模型在移动过程中进行避障,包括:所述机器人获取当前时刻的环境图像信息,及当前时刻的位置信息;所述机器人根据所述当前时刻的环境图像信息,所述当前时刻的位置信息,以及当前时刻所述机器人的移动方向和移动速度,获取下一时刻的环境图像信息以及下一时刻的位置信息;所述机器人根据所述下一时刻的环境图像信息,所述下一时刻的位置信息,以及所述困境识别模型确定下一时刻所述机器人被困住的概率;所述机器人确定下一时刻所述机器人被困住的概率大于预设阈值,所述机器人改变运动策略,进行避障。6.一种避障装置,其特征在于,应用于机器人,所述装置包括:获取单元、通信单元以及避障单元;所述获取单元,用于获取所述机器人移动过程中N个时刻的样本信息,N为大于0的整数;其中,N个时刻中每个时刻的样本信息包括:用于指示该时刻所述机器人所处环境的环境图像信息、用于指示所述机器人该时刻在所述环境图像信息指示的环境中的位置的位置信息,以及用于指示所述机器人该时刻的状态的标签信息;所述标签信息包括第一标签或第二标签,所述第一标签用于指示所述机器人处于未被困住状态,所述第二标签用于指示所述机器人处于被困住状态;所述通信单元,用于将N个时刻中M个时刻的样本信息发送给服务器,M为小于或等于N的正整数;所述通信单元,还用于从所述服务器接收困境识别模型,所述困境识别模型由一个或者多个机器人采集的样本信息训练所得;所述避障单元,用于根据所述困境识别模型在所述机器人移动过程中进行避障。7.根据权利要求6所述的装置,其特征在于,每个时刻的环境图像信息包括:在该时刻所述机器人所处环境中,所述机器人的移动线路上及移动路线周边物体的图像信息。8.根据权利要求6或7所述的装置,其特征在于,每个时刻的位置信息包括:该时刻的环境图像信息指示的环境中,所述机器人与所述机器人的移动线路...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。