System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于核化运动基元的人机协同铺盖轨迹模仿学习方法技术_技高网
当前位置: 首页 > 专利查询>之江实验室专利>正文

一种基于核化运动基元的人机协同铺盖轨迹模仿学习方法技术

技术编号:40069159 阅读:5 留言:0更新日期:2024-01-16 23:54
本发明专利技术涉及人机协同运动轨迹模仿学习领域,公开一种基于核化运动基元的人机协同铺盖轨迹模仿学习方法,包括以下步骤:1)采集人机协同铺盖过程中的人机联合示教轨迹,并进行预处理,从而构建训练样本。2)采用核化运动基元模型,在训练样本中学习人手位置与机械臂末端位置间的非线性关系。3)采用基于语义分割的织物抓取点检测方法识别并抓取布匹一角;4)在预测阶段,依据由RGB‑D相机检测获取的人手位置,实时地预测机械臂末端的响应位置,为机器人生成与人手当前位置及其运动趋势相协调的末端运动轨迹,从而完成人机协同铺盖动作。

【技术实现步骤摘要】

本专利技术涉及人机协同运动轨迹模仿学习领域,具体涉及一种基于核化运动基元的人机协同铺盖轨迹模仿学习方法


技术介绍

1、人机协同作为机器人的重要辅助服务功能,具有广阔的发展前景。例如人机协同铺盖可以解决被铺盖物体过大、一个人难以完成铺盖任务的情况。作为一种常见的典型人机协同任务,在人机协同铺盖任务的执行过程中,机器人需基于已观察到的人体动作轨迹与交互策略预测出自身的响应轨迹,以配合人手动作完成铺盖任务。然而,由于人手动作轨迹存在一定自发性,人手移动的目标位置点常发生改变,因此难以通过手动编程的方式学习人手轨迹与机器人末端轨迹之间的非线性映射关系。

2、根据文献查新,已有可以利用机器学习方法如监督学习、无监督学习、强化学习完成机器人操作技能的学习与重现。但是以上方法的学习过程均基于大量的训练数据,而在实际的人机协同场景中,示教数据通常数量较少。此外,也有采用模仿学习的方法,即通过示教者示教人手轨迹与机器人轨迹获取示教样本,机器人从示教样本中学习这种非线性关系,并将该关系泛化到新的环境与任务下,有效提高了机器人对人机协作类任务学习与泛化的能力。

3、已有的面向人机协同运动轨迹的模仿学习算法主要包含两类,即时间驱动的模仿学习算法与人手位置驱动的模仿学习算法。人手位置驱动的模仿学习算法直接预测对应机械臂末端位置,避免了时间对齐的问题,克服了时间驱动模仿学习算法对环境的严苛假设的缺点,具有更强的应用性。经典的高斯过程(gaussian process,gp)和高斯混合模型(gaussian mixture model,gmm),虽然可以直接编码人手位置和机械臂末端位置间的非线性关系,但由于算法不具备外插能力,难以直接调整已有的模型以满足新的任务需要。任务参数化高斯混合模型(task parameterized gaussian mixture model,tp-gmm)采用对局部轨迹特征建模的方法提高了高斯混合模型的外插特性,但是依然难以实现任意轨迹点的调整。基于此,亟需提供一种适用于人机协同铺盖等人机协同任务的技能学习与复现方法,以提高机器人的人机协同能力。


技术实现思路

1、针对上述问题,本专利技术的目的在于提供一种基于核化运动基元的人机协同铺盖轨迹模仿学习方法,能够使机器人完成人机协同铺盖技能的学习与复现。

2、实现本专利技术目的的具体技术方案为:

3、一种基于核化运动基元的人机协同铺盖轨迹模仿学习方法,包括以下步骤:

4、基于核化运动基元的人机协同铺盖轨迹模仿学习方法,其特征在于,包括以下步骤:

5、步骤1、针对人机协同铺盖任务,在工作空间采集多条人机联合示教轨迹样本,并对所采集的示教样本进行预处理,即使用高斯混合模型及高斯混合回归算法从中拟合出一条由条件概率分布描述的最优概率参考轨迹表征动作运动属性,从而构建出训练样本集;

6、步骤2、在训练样本集中训练核化运动基元模型,即利用概率参考轨迹,学习人机协同铺盖任务中人机联合轨迹样本的人手位置与机械臂末端位置间的非线性关系;

7、步骤3、布匹抓取,即采用基于语义分割的织物抓取点检测方法识别并抓取布匹一角;

8、步骤4、在预测阶段,核化运动基元模型的推理过程实时地依据由rgb-d相机检测获取的人手位置,预测机械臂末端的响应位置,即为机器人生成与人手铺盖动作当前位置及其运动趋势相协调的末端运动轨迹,从而完成人机协同铺盖动作。

9、进一步地,步骤1的具体方法为:

10、采用直接示教的方式同时分别采集人手及机器人运动轨迹,并对二者进行组合构成人机联合示教轨迹,所有人机联合示教轨迹由表示,其中表示人手位置输入点,表示机器人末端执行器位置输出点,l,h分别表示输入及输出空间的维数、示教轨迹长度和示教轨迹条数。l和h分别表示人手位置输入点和机器人末端执行器位置输出点所属人机联合示教轨迹的序号及该点在轨迹中的序号;

11、在采集多条人机联合示教轨迹样本后,使用高斯混合模型和高斯混合回归算法从中拟合出一条包含样本概率特性的概率参考轨迹以表征动作运动属性;

12、轨迹预处理过程中,首先使用高斯混合模型(gmm)获取示教轨迹的概率分布,即联合概率分布

13、

14、其中,s表示人手位置输入,ξ表示机器人末端执行器位置输出,πc、μc和σc分别表示第c个高斯分量的先验概率、均值和协方差,c表示高斯分量的数量,高斯混合模型中的πc、μc和σc参数利用em算法迭代求解,模型参数的初始化利用k-means聚类算法完成,高斯分量的数量c使用bic准则估计最优值;

15、然后,通过高斯混合回归(gmr)算法获取一条概率参考轨迹其中n表示该概率参考轨迹所包含的输入输出点对数,令sn表示概率参考轨迹中第个人手位置输入点,表示sn对应机器人末端执行器位置输出的估计值,每个输入点sn对应的均由条件概率分布描述,其中和分别为输入取sn时的均值和协方差估计值,概率参考轨迹概括了人机联合示教轨迹中的可变性以及输入与输出之间的相关性。

16、进一步地,所述步骤2的具体方法为:

17、利用概率参考轨迹以随机采样的方式在工作空间中提取m个人手位置采样点{sm,m=1,2,...,m}并计算其对应的机械臂末端位置均值及协方差作为核化运动基元模型的训练样本,然后学习出如公式(3)所示的人手位置与机械臂末端位置间的非线性关系,实现对于新的人手位置输入s*对应的机械臂末端响应期望位置e(ξ(s*))的推理;定义核函数k(·,·)为高斯核其中h和σf为超参数;定义核矩阵k(si,sj)=k(si,sj)io,其中io为o阶单位矩阵。进一步定义矩阵k为

18、

19、则可得

20、e(ξ(s*))=k*(k+λ∑)-1μ   (11)

21、其中k*=[k(s*,s1)k(s*,s2)…k(s*,sm)],λ为为避免过拟合而引入的惩罚项的系数。

22、进一步地,步骤3的具体方法为:

23、首先,训练基于unet的语义分割网络,以不同颜色油漆喷涂实物布料的边缘和角落区域,通过颜色识别的方法完成像素真实标签标注,定义布匹“外边缘”为布匹边缘1.5cm以内区域,“内边缘”为“外边缘”内1.5cm区域,“布角”为布料角落3*3cm区域,定义损失函数为每一类s∈s中像素点的二元交叉熵损失的均值,如公式(4)所示:

24、

25、其中i为输入深度图像i中的一个像素,ws为每一类标签的权重,yi是第i个像素的标签,为网络所预测第i个像素的标签;

26、其次,进行抓取点抓取方向分析,在对神经网络输出结果进行阈值化处理后,分别获得属于“外边缘”eo的点集p=[px,py]∈eo以及“内边缘”ei的点集q=[qx,qy]∈ei,其中px,py,qx,qy分别为“内、外边缘”中点在x,y轴上的坐标,对于每个“外边缘”中的点p,都可找到“内边缘”本文档来自技高网...

【技术保护点】

1.基于核化运动基元的人机协同铺盖轨迹模仿学习方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于核化运动基元的人机协同铺盖轨迹模仿学习方法,其特征在于,步骤1的具体方法为:

3.根据权利要求1所述的基于核化运动基元的人机协同铺盖轨迹模仿学习方法,其特征在于,所述步骤2的具体方法为:

4.根据权利要求1所述的基于核化运动基元的人机协同铺盖轨迹模仿学习方法,其特征在于,步骤3的具体方法为:

5.根据权利要求1所述的基于核化运动基元的人机协同铺盖轨迹模仿学习方法,其特征在于,步骤4的具体方法为:

【技术特征摘要】

1.基于核化运动基元的人机协同铺盖轨迹模仿学习方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于核化运动基元的人机协同铺盖轨迹模仿学习方法,其特征在于,步骤1的具体方法为:

3.根据权利要求1所述的基于核化运动基元的人机协同铺盖轨迹模仿学习方...

【专利技术属性】
技术研发人员:宋伟钱堃廖建峰孙轶楠岳照坤
申请(专利权)人:之江实验室
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1