System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 机器人运动控制方法、系统及电子设备技术方案_技高网

机器人运动控制方法、系统及电子设备技术方案

技术编号:40358777 阅读:5 留言:0更新日期:2024-02-09 14:45
本申请公开了一种机器人运动控制方法、系统及电子设备,包括:通过对机器人周边的地形图进行遮挡训练获得策略模型;将接收的控制指令输入至策略模型中得到关节控制指令;将关节控制指令输入至控制单元中,响应于接收的关节控制指令,控制单元控制机器人的关节转动至期望位置,以使机器人运动。本申请提供的机器人运动控制方法通过遮挡训练获得策略模型后可以提高机器人对外部的感知,从而使得机器人在外部传感器在受到遮挡时也能根据地形做出合理的判断,有助于机器人对未知地形做出合适的调整,从而提高了机器人适应复杂环境的能力。

【技术实现步骤摘要】

本申请涉及机器人控制,特别涉及一种机器人运动控制方法、系统及电子设备


技术介绍

1、随着人工智能和机器人技术的快速发展,机器人作为一种新兴的机器人类型受到了越来越多的关注。传统的机器人主要依靠内部传感器来感知周围环境,但是这种方式存在一定的局限性,例如在复杂环境下无法准确识别障碍物、无法适应不同地形等。因此很多机器人考虑加入外部感知来提高机器人的适应能力,但是采用外部感知后产生的数据量更大,系统集成难度高,引入额外的测量噪声,难以实现对机器人的整体控制。并且外部传感器在受到遮挡时机器人无法根据地形做出判断,导致机器人无法得到有效控制,出现运动效果减弱的情况。


技术实现思路

1、本申请提供一种机器人运动控制方法、系统及电子设备,以解决现有技术中的机器人的外部传感器受到遮挡后运动效果减弱的技术问题。

2、为了解决上述技术问题,本申请的实施例公开了如下技术方案:

3、第一方面,提供了一种机器人运动控制方法,包括:

4、通过对机器人周边的地形图进行遮挡训练获得策略模型;

5、将接收的控制指令输入至所述策略模型中得到关节控制指令;

6、将所述关节控制指令输入至控制单元中,响应于接收的所述关节控制指令,所述控制单元控制所述机器人的关节转动至期望位置,以使所述机器人运动。

7、结合第一方面,通过对机器人周边的地形图进行遮挡训练获得策略模型的方法包括:

8、获取所述机器人周边的地形图;

9、对所述地形图进行遮挡处理;

10、将遮挡处理后的所述地形图输入训练中的所述策略模型进行训练。

11、结合第一方面,对所述地形图进行遮挡处理之前,还包括:

12、将所述地形图划分为多个连续的区块;其中,所述区块包括圆形、矩形、三角形、菱形和梯形中的一种或多种。

13、结合第一方面,对所述地形图进行遮挡处理之前,还包括:

14、获取所述地形图中地形的高度信息并对所述高度信息进行标记;

15、其中,所述高度信息包括高度最大值、高度中位数、高度平均值中的任一种。

16、结合第一方面,对所述高度信息进行标记之后,还包括:

17、在所述地形图上设置标志位;当所述地形图被遮挡时,遮挡处的所述标志位为0,未被遮挡处的所述标志位为1。

18、结合第一方面,所述标志位用于表示所述高度信息的有效性;

19、当所述标志位为0时,遮挡处的所述高度信息无效;

20、当所述标志位为1时,未被遮挡处的所述高度信息有效;

21、所述策略模型用于识别有效的所述高度信息。

22、结合第一方面,在所述地形图中,所述标记所在的位置和所述标志位所在的位置不在同一平面。

23、结合第一方面,对所述地形图进行遮挡处理的方法包括:

24、获取覆盖比例值;

25、根据所述覆盖比例值覆盖所述地形图中相应比例的范围;

26、其中,所述覆盖比例值为覆盖范围与整个所述地形图范围的比值,所述覆盖比例值从0至100%中选择。

27、结合第一方面,对所述地形图进行遮挡处理的方法包括:

28、获取覆盖等级;

29、根据所述覆盖等级对所述地形图中相应比例的范围进行覆盖;

30、其中,所述覆盖等级包括0至11级,当所述覆盖等级为0级时,覆盖范围为0,当所述覆盖等级为11时,覆盖范围为100%,所述覆盖等级提升一级,所述覆盖范围提升10%。

31、结合第一方面,所述地形图包括地形块,所述地形块包括斜坡地形、障碍物地形、楼梯地形、凹凸地形和梅花桩地形中的一种或多种;

32、其中,多个所述地形块拼接组合成所述地形图。

33、结合第一方面,所述策略模型的训练方法还包括:

34、在模拟平台中构建初始策略模型、初始评价模型和模拟机器人;

35、将所述模拟机器人的本体信息输入所述初始策略模型,所述初始策略模型输出初始动作值以控制所述模拟机器人运动;

36、所述初始评价模型基于所述初始动作值和所述模拟机器人的动作输出初始评价值;

37、基于所述初始评价值所述初始策略模型对所述初始动作值进行优化;

38、通过迭代训练后,获得初阶策略模型和初阶评价模型;

39、将所述初阶策略模型与所述机器人匹配连接,并将所述机器人的本体信息输入所述初阶策略模型进行训练;

40、通过所述初阶评价模型的迭代训练后获得所述策略模型。

41、结合第一方面,将所述模拟机器人的本体信息输入所述初始策略模型时,还包括:

42、获取随机隐状态,所述随机隐状态结合所述本体信息输入所述初始策略模型;

43、所述初始策略模型基于所述随机隐状态和所述本体信息输出所述初始动作值;

44、所述随机隐状态结合所述本体信息以及特权信息输入所述初阶评价模型;

45、所述初阶评价网络基于所述随机隐状态、所述本体信息和所述特权信息输出所述初始评价值。

46、结合第一方面,所述随机隐状态通过世界模型获得,所述世界模型包括回归模型、状态转移预测模型、隐空间表征模型和地形高程重构模型;

47、所述回归模型由gru网络构成,所述回归模型将上一时刻的确定性状态、上一时刻的随机隐状态和所述本体信息作为输入,并输出当前确定性状态;

48、所述状态转移预测模型由mlp网络构成,所述状态转移预测模型将所述确定性状态作为输入,并输出未来随机隐状态;

49、所述隐空间表征模型将地形的所述高度信息通过卷积处理后提取的地形特征值与确定性状态进行拼接,并将拼接后的值融合至随机隐状态中输出;

50、所述地形高程重构模型将随机隐状态和确定性状态作为输入并结合历史信息和观测噪声通过反卷积处理将遮蔽的所述地形图还原;

51、其中,所述观测噪声包括所述高度信息的高度补偿值。

52、结合第一方面,所述特权信息包括所述本体信息以及所述高度信息、机身运动速度、四肢的受力大小、四肢的接触状态、历史关节位置、历史关节速度和抬腿间隔中的任一种或多种;

53、所述本体信息包括所述机器人的关节位置、关节速度、机身重力向量、机身在x、y、z轴上的转向角速度、相对于x轴和y轴的线速度命令、相对于机身坐标系的转向命令、上一时刻的初始动作值和地形信息,所述地形信息包括所述地形块的种类和所述高度信息的任一种或多种。

54、结合第一方面,所述观测噪声还包括所述关节位置的位置补偿值和所述关节速度的速度补偿值;所述本体信息中还包括误差系数,所述误差系数包括摩擦系数、电枢系数、阻尼系数和刚性系数中的一种或多种。

55、第二方面,提供了一种机器人运动控制系统,所述系统包括:

56、训练模块,所述训练模块用本文档来自技高网...

【技术保护点】

1.一种机器人运动控制方法,其特征在于,包括:

2.如权利要求1所述的机器人运动控制方法,其特征在于,通过对机器人周边的地形图进行遮挡训练获得策略模型的方法包括:

3.如权利要求2所述的机器人运动控制方法,其特征在于,对所述地形图进行遮挡处理之前,还包括:

4.如权利要求2所述的机器人运动控制方法,其特征在于,对所述地形图进行遮挡处理之前,还包括:

5.如权利要求4所述的机器人运动控制方法,其特征在于,对所述高度信息进行标记之后,还包括:

6.如权利要求5所述的机器人运动控制方法,其特征在于,所述标志位用于表示所述高度信息的有效性;

7.如权利要求5所述的机器人运动控制方法,其特征在于,在所述地形图中,所述标记所在的位置和所述标志位所在的位置不在同一平面。

8.如权利要求2所述的机器人运动控制方法,其特征在于,对所述地形图进行遮挡处理的方法包括:

9.如权利要求2所述的机器人运动控制方法,其特征在于,对所述地形图进行遮挡处理的方法包括:

10.如权利要求4所述的机器人运动控制方法,其特征在于,所述地形图包括地形块,所述地形块包括斜坡地形、障碍物地形、楼梯地形、凹凸地形和梅花桩地形中的一种或多种;

11.如权利要求10所述的机器人运动控制方法,其特征在于,所述策略模型的训练方法还包括:

12.如权利要求11所述的机器人运动控制方法,其特征在于,将所述模拟机器人的本体信息输入所述初始策略模型时,还包括:

13.如权利要求12所述的机器人运动控制方法,其特征在于,所述随机隐状态通过世界模型获得,所述世界模型包括回归模型、状态转移预测模型、隐空间表征模型和地形高程重构模型;

14.如权利要求13所述的机器人运动控制方法,其特征在于,所述特权信息包括所述本体信息以及所述高度信息、机身运动速度、四肢的受力大小、四肢的接触状态、历史关节位置、历史关节速度和抬腿间隔中的任一种或多种;

15.如权利要求14所述的机器人运动控制方法,其特征在于,所述观测噪声还包括所述关节位置的位置补偿值和所述关节速度的速度补偿值;所述本体信息中还包括误差系数,所述误差系数包括摩擦系数、电枢系数、阻尼系数和刚性系数中的一种或多种。

16.一种机器人运动控制系统,其特征在于,所述系统包括:

17.一种电子设备,其特征在于:包括存储器和处理器;所述存储器,用于存储计算机程序;所述处理器,用于当执行所述计算机程序时,实现如权利要求1-15中任一项所述的机器人运动控制方法。

...

【技术特征摘要】

1.一种机器人运动控制方法,其特征在于,包括:

2.如权利要求1所述的机器人运动控制方法,其特征在于,通过对机器人周边的地形图进行遮挡训练获得策略模型的方法包括:

3.如权利要求2所述的机器人运动控制方法,其特征在于,对所述地形图进行遮挡处理之前,还包括:

4.如权利要求2所述的机器人运动控制方法,其特征在于,对所述地形图进行遮挡处理之前,还包括:

5.如权利要求4所述的机器人运动控制方法,其特征在于,对所述高度信息进行标记之后,还包括:

6.如权利要求5所述的机器人运动控制方法,其特征在于,所述标志位用于表示所述高度信息的有效性;

7.如权利要求5所述的机器人运动控制方法,其特征在于,在所述地形图中,所述标记所在的位置和所述标志位所在的位置不在同一平面。

8.如权利要求2所述的机器人运动控制方法,其特征在于,对所述地形图进行遮挡处理的方法包括:

9.如权利要求2所述的机器人运动控制方法,其特征在于,对所述地形图进行遮挡处理的方法包括:

10.如权利要求4所述的机器人运动控制方法,其特征在于,所述地形图包括地形块,所述地形块包括斜坡地形、障碍物地形、楼梯地形、凹凸地形和梅花桩地形中的一种或多种;

<...

【专利技术属性】
技术研发人员:周明鑫刘迪源潘嘉刘聪
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1