一种机器人避障方法、装置和系统制造方法及图纸

技术编号:22380037 阅读:57 留言:0更新日期:2019-10-29 04:31
本申请实施例公开了一种机器人避障方法、装置和系统,涉及电子设备领域,解决了使用机器学习方法进行困境识别过程中,人力成本投入大,训练的模型准确性低的问题。具体方案为:机器人获取移动过程中N个时刻的样本信息。其中,N个时刻中每个时刻的样本信息包括:用于指示该时刻机器人所处环境的环境图像信息、用于指示机器人该时刻所在位置的位置信息,以及用于指示机器人该时刻是否处于被困住状态的标签信息。机器人将N个时刻中M个时刻的样本信息发送给服务器。机器人从服务器接收由一个或者多个机器人采集的样本信息训练所得的困境识别模型。机器人根据困境识别模型在移动过程中进行避障。本申请实施例用于机器人移动的过程中。

A robot obstacle avoidance method, device and system

【技术实现步骤摘要】
一种机器人避障方法、装置和系统
本申请涉及电子设备领域,尤其涉及一种机器人避障方法、装置和系统。
技术介绍
机器人(例如扫地机器人)已经被广泛应用于人们的日常生活中。由于机器人的工作几乎是完全自主的,因此,在工作的过程中,经常会遇到一些被困的情况。目前,可通过使用机器学习的方法来训练机器人进行识别困境,以进行避障。其中,较常见的机器学习方法包括监督学习和强化学习。在监督学习中,需要人工收集大量的样本数据,并人工给这些样本数据打上对应的被困住或未被困住的标签,然后对打上标签的样本数据进行监督学习模型训练,获得对应模型,以便机器人根据该模型判断是否需要进行避障。示例性的,以机器人是扫地机器人,样本数据为扫地机器人所处的环境信息为例。如图1A所示的环境信息,因为,扫地机器人被插排的连接线所困,无法自由移动,因此,人工可为该样本数据打上被困住的标签。又如,如图1B所示的环境中,扫地机器人并未插排及其连接线所困,可以自由移动,因此,人工可以为该样本数据打上未被困住的标签。又如,在图2A所示的环境中,扫地机器人处于墙壁以及固定物体的夹角位置,无法继续自由移动,因此,人工可以为将该样本数据打上被困住的标签。又如,在图2B所示的环境中,扫地机器人处于远离墙壁以及固定物体的位置,可以继续自由移动,因此,人工可以为该样本数据打上未被困住的标签。又如,在图3A所示的环境中,扫地机器人处于固定物体与地面之间的缝隙中,无法继续自由移动,因此,人工可以为该样本数据打上被困住的标签。对应的,如图3B所示,机器人远离固定物体以及固定物体与地面之间的缝隙,可以自由移动,那么人工可以为该样本数据打上未被困住的标签。根据大量类似图1A-图3B所示的打上标签后的样本数据,进行监督学习模型训练便可获得对应模型,用于扫地机器人的避障。强化学习是指机器人以“试错”的方式进行学习的一种方法。机器人根据人工收集的大量的样本数据,以及人工给这些样本数据打上的被困住或未被困住的标签,通过不断的“试错”,确定出环境反馈的奖赏最大的行为。根据奖赏结果以及奖赏结果对应的试错方法进行标记,以此作为下次工作的参考。可以看到,无论使用监督学习,还是强化学习进行困境识别,都需要大量的样本数据。目前这些样本数据都需要人工收集,如通过网络爬虫搜索获得。为了区分收集到的样本数据对应的机器人的状态(如是否处于被困住的状态),需要人工对收集到的样本数据进行识别并打上对应的标签。由此会带来大量的人力成本的投入。另外,由于没有统一的样本数据收集标准,收集到的样本数据质量难以控制,会导致标签的标注质量低,如标注错误等。且通过网络爬虫收集到的样本数据,如上述环境信息,大多是以用户的角度拍摄的环境图片,并不能直观准确的体现机器人所处环境。这些均会导致训练的模型不准确。
技术实现思路
本申请实施例提供一种机器人避障方法、装置和系统,解决了使用机器学习方法进行困境识别过程中,人力成本投入大,训练的模型准确性低的问题。为达到上述目的,本申请实施例采用如下技术方案:本申请实施例的第一方面,提供一种机器人避障方法,该方法包括:机器人获取机器人移动过程中N个时刻的样本信息,N为大于0的整数;其中,N个时刻中每个时刻的样本信息包括:用于指示该时刻机器人所处环境的环境图像信息、用于指示机器人该时刻在环境图像信息指示的环境中的位置的位置信息,以及用于指示机器人该时刻的状态的标签信息;标签信息包括第一标签或第二标签,第一标签用于指示机器人处于未被困住状态,第二标签用于指示机器人处于被困住状态;机器人将N个时刻中M个时刻的样本信息发送给服务器,M为小于或等于N的正整数;机器人从服务器接收困境识别模型,困境识别模型由一个或者多个机器人采集的样本信息训练所得;机器人根据困境识别模型在移动过程中进行避障。这样,通过机器人自主采集环境图像信息以及位置信息,并根据当前状态获取100%正确的用于标识机器人是否处于被困住状态的标签信息,保证了样本信息的准确度的同时避免的大量人力的投入。而机器人将N个时刻的样本信息发送给服务器,经过训练获取困境识别模型,用于对机器人的移动进行避障指导,由于样本信息的准确度可以得到保证,因此困境识别模型的准确度也得到大幅提高,由此可以更加准确的指导机器人进行避障。结合第一方面和上述可能的实现方式,在另一种可能的实现方式中,每个时刻的环境图像信息包括:在该时刻机器人所处环境中,机器人的移动线路上及移动路线周边物体的图像信息。这样,就能够保证环境图像信息中可以包括最有可能成为机器人移动障碍的物体的信息。结合第一方面和上述可能的实现方式,在另一种可能的实现方式中,每个时刻的位置信息包括:该时刻的环境图像信息指示的环境中,机器人与机器人的移动线路上及移动线路周边的物体的相对位置信息。这样,就能够确定机器人在该时刻所处环境中的具体位置,以便机器人能够准确的预测机器人在下一时刻所处环境中的位置。结合第一方面和上述可能的实现方式,在另一种可能的实现方式中,机器人将N个时刻中M个时刻的样本信息发送给服务器,包括:机器人确定N个时刻的样本信息中,第N个时刻的样本信息包括的标签信息用于指示机器在第N个时刻处于被困住的状态;机器人将第N个时刻的前M-1个时刻的样本信息和第N个时刻的样本信息发送给服务器。这样,由于对于困境识别模型的训练而言,被困住的样本信息以及被困住之前一段时间的样本信息的质量较高,这样就在保证高质量样本信息的传输的同时,减小了系统信息传输的总量,减小了系统的通信负荷。结合第一方面和上述可能的实现方式,在另一种可能的实现方式中,机器人根据困境识别模型在移动过程中进行避障,包括:机器人获取当前时刻的环境图像信息,及当前时刻的位置信息;机器人根据当前时刻的环境图像信息,当前时刻的位置信息,以及当前时刻机器人的移动方向和移动速度,获取下一时刻的环境图像信息以及下一时刻的位置信息;机器人根据下一时刻的环境图像信息,下一时刻的位置信息,以及困境识别模型确定下一时刻机器人被困住的概率;机器人确定下一时刻机器人被困住的概率大于预设阈值,机器人改变运动策略,进行避障。这样,通过预测下一时刻机器人所处环境的环境图像信息以及位置信息,结合困境识别模型,就可以较为准确的判断下一时刻机器人是否会被困住,根据该结果进行避障,可以有效的避免机器人在移动过程中被困住的情况出现。本申请实施例的第二方面,提供一种避障装置,该装置可以包括:获取单元、通信单元以及避障单元。获取单元,用于获取机器人移动过程中N个时刻的样本信息,N为大于0的整数;其中,N个时刻中每个时刻的样本信息包括:用于指示该时刻机器人所处环境的环境图像信息、用于指示机器人该时刻在环境图像信息指示的环境中的位置的位置信息,以及用于指示机器人该时刻的状态的标签信息;标签信息包括第一标签或第二标签,第一标签用于指示机器人处于未被困住状态,第二标签用于指示机器人处于被困住状态;通信单元,用于将N个时刻中M个时刻的样本信息发送给服务器,M为小于或等于N的正整数;通信单元,还用于从服务器接收困境识别模型,困境识别模型由一个或者多个机器人采集的样本信息训练所得;避障单元,用于根据困境识别模型在机器人移动过程中进行避障。结合第二方面和上述可能的实现方式,在另一种可能的实现方本文档来自技高网
...

【技术保护点】
1.一种机器人避障方法,其特征在于,所述方法包括:所述机器人获取所述机器人移动过程中N个时刻的样本信息,N为大于0的整数;其中,N个时刻中每个时刻的样本信息包括:用于指示该时刻所述机器人所处环境的环境图像信息、用于指示所述机器人该时刻在所述环境图像信息指示的环境中的位置的位置信息,以及用于指示所述机器人该时刻的状态的标签信息;所述标签信息包括第一标签或第二标签,所述第一标签用于指示所述机器人处于未被困住状态,所述第二标签用于指示所述机器人处于被困住状态;所述机器人将N个时刻中M个时刻的样本信息发送给服务器,M为小于或等于N的正整数;所述机器人从所述服务器接收困境识别模型,所述困境识别模型由一个或者多个机器人采集的样本信息训练所得;所述机器人根据所述困境识别模型在移动过程中进行避障。

【技术特征摘要】
1.一种机器人避障方法,其特征在于,所述方法包括:所述机器人获取所述机器人移动过程中N个时刻的样本信息,N为大于0的整数;其中,N个时刻中每个时刻的样本信息包括:用于指示该时刻所述机器人所处环境的环境图像信息、用于指示所述机器人该时刻在所述环境图像信息指示的环境中的位置的位置信息,以及用于指示所述机器人该时刻的状态的标签信息;所述标签信息包括第一标签或第二标签,所述第一标签用于指示所述机器人处于未被困住状态,所述第二标签用于指示所述机器人处于被困住状态;所述机器人将N个时刻中M个时刻的样本信息发送给服务器,M为小于或等于N的正整数;所述机器人从所述服务器接收困境识别模型,所述困境识别模型由一个或者多个机器人采集的样本信息训练所得;所述机器人根据所述困境识别模型在移动过程中进行避障。2.根据权利要求1所述的方法,其特征在于,每个时刻的环境图像信息包括:在该时刻所述机器人所处环境中,所述机器人的移动线路上及移动路线周边物体的图像信息。3.根据权利要求1或2所述的方法,其特征在于,每个时刻的位置信息包括:该时刻的环境图像信息指示的环境中,所述机器人与所述机器人的移动线路上及移动线路周边的物体的相对位置信息。4.根据权利要求1-3中任一项所述的方法,其特征在于,所述机器人将N个时刻中M个时刻的样本信息发送给服务器,包括:所述机器人确定所述N个时刻的样本信息中,第N个时刻的样本信息包括的标签信息用于指示所述机器在所述第N个时刻处于被困住的状态;所述机器人将所述第N个时刻的前M-1个时刻的样本信息和所述第N个时刻的样本信息发送给所述服务器。5.根据权利要求1-4中任一项所述的方法,其特征在于,所述机器人根据所述困境识别模型在移动过程中进行避障,包括:所述机器人获取当前时刻的环境图像信息,及当前时刻的位置信息;所述机器人根据所述当前时刻的环境图像信息,所述当前时刻的位置信息,以及当前时刻所述机器人的移动方向和移动速度,获取下一时刻的环境图像信息以及下一时刻的位置信息;所述机器人根据所述下一时刻的环境图像信息,所述下一时刻的位置信息,以及所述困境识别模型确定下一时刻所述机器人被困住的概率;所述机器人确定下一时刻所述机器人被困住的概率大于预设阈值,所述机器人改变运动策略,进行避障。6.一种避障装置,其特征在于,应用于机器人,所述装置包括:获取单元、通信单元以及避障单元;所述获取单元,用于获取所述机器人移动过程中N个时刻的样本信息,N为大于0的整数;其中,N个时刻中每个时刻的样本信息包括:用于指示该时刻所述机器人所处环境的环境图像信息、用于指示所述机器人该时刻在所述环境图像信息指示的环境中的位置的位置信息,以及用于指示所述机器人该时刻的状态的标签信息;所述标签信息包括第一标签或第二标签,所述第一标签用于指示所述机器人处于未被困住状态,所述第二标签用于指示所述机器人处于被困住状态;所述通信单元,用于将N个时刻中M个时刻的样本信息发送给服务器,M为小于或等于N的正整数;所述通信单元,还用于从所述服务器接收困境识别模型,所述困境识别模型由一个或者多个机器人采集的样本信息训练所得;所述避障单元,用于根据所述困境识别模型在所述机器人移动过程中进行避障。7.根据权利要求6所述的装置,其特征在于,每个时刻的环境图像信息包括:在该时刻所述机器人所处环境中,所述机器人的移动线路上及移动路线周边物体的图像信息。8.根据权利要求6或7所述的装置,其特征在于,每个时刻的位置信息包括:该时刻的环境图像信息指示的环境中,所述机器人与所述机器人的移动线路...

【专利技术属性】
技术研发人员:徐学军
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1