【技术实现步骤摘要】
一种样本生成、模型训练方法、装置及系统
[0001]本申请涉及人工智能
,尤其涉及一种样本生成、模型训练方法、装置及系统。
技术介绍
[0002]为了使机器人能够模仿人的操作动作像是抓取,组装,开门等,操作员可以利用遥操作或是其他示教的方式实现正确的操作动作。在操作过程中,记录机器人实时的观测状态和动作变化。之后可以透过机器学习的方式让机器人学到状态和动作的映射,从而模仿操作员自动操作的动作。但是对于训练数据中没出现过的一些场景,比如:物体种类、物体位姿或物体的其他物理状态环境发生变换,在自动操作过程中,机器人都有可能给出错误的动作。
[0003]在目前已有技术方案里,一般会事先提供大量的和不同场景下的操作数据,以确保在机器人自动执行过程中遇到的场景是之前有在训练数据集出现过的。但是,此方法有以下几个不足的地方:一方面,有些同样或类似的操作场景下,机器人只需要少量的数据就足以学习自动操作,但现有的训练方式一般都会提供非常多类似的训练数据以确保机器人在自动操作中能顺利进行;另一方面,在采集训练数据过程中,很难事先 ...
【技术保护点】
【技术特征摘要】
1.一种样本生成方法,其特征在于,所述方法包括下述步骤:获取从端机器人基于观测数据得到的自主学习运动指令;基于所述自主学习运动指令生成可视化的自主学习预测轨迹;向操作者发送所述自主学习运动轨迹是否正确的询问;响应于操作者触发的自主学习运动轨迹为不正确的应答,启动遥操作模式;获取遥操作过程中与观测数据对应的操作者的动作数据,基于所述动作数据生成从端机器人可执行的遥操作运动指令,直到满足遥操作终止条件;以所述观测数据和对应的所述自主学习运动指令或所述遥操作运动指令构建所述样本。2.根据权利要求1所述样本生成方法,其特征在于,所述方法还包括下述步骤:响应于操作者触发的自主学习运动轨迹为正确的应答,将所述自主学习运动指令发送给从端机器人,以指示从端机器人执行所述自主学习运动指令;返回执行所述获取从端机器人基于观测数据得到的自主学习运动指令;所述基于所述自主学习运动指令生成可视化的自主学习预测轨迹;以及所述向操作者发送所述自主学习运动轨迹是否正确的询问的步骤,直到满足自主预设终止条件;和/或所述获取从端机器人基于观测数据得到的自主学习运动指令之前;所述基于所述自主学习运动指令生成可视化的自主学习预测轨迹之后,所述方法还包括下述步骤:将所述自主学习运动指令发送给从端机器人,以指示从端机器人执行所述自主学习运动指令;和/或响应于操作者触发的自主学习运动轨迹为正确的应答,维持原操作模式。3.根据权利要求1或2所述样本生成方法,其特征在于,所述获取从端机器人基于观测数据得到的自主学习运动指令之前,还包括下述步骤:将所述观测数据输入预设的映射模型,得到所述自主学习运动指令。4.根据权利要求3所述样本生成方法,其特征在于,所述以所述观测数据和对应的所述自主学习运动指令或所述遥操作运动指令构建所述样本之后,还包括下述步骤:以所述观测数据和对应的所述遥操作运动指令构建的所述样本作为补充训练样本,更新训练所述预设的映射模型。5.根据权利要求1或2所述样本生成方法,其特征在于,所述响应于操作者触发的自主学习运动轨迹为不正确的应答,启动遥操作模式;获取遥操作过程中与观测数据对应的操作者的动作数据,基于所述动作数据生成从端机器人可执行的遥操作运动指令,直到满足遥操作终止条件包括下述步骤:启动遥操作模式;获取遥操作过程中与所述观测数据对应的操作者的动作数据;基于所述动作数据生成从端机器人可执行的所述遥操作运动指令,以指示从端机器人模仿目标动作;返回执行所述获取遥操作过程中与所述观测数据对应的操作者的动作数据;所述基于所述动作数据生成从端机器人可执行的...
【专利技术属性】
技术研发人员:蔡亚谚,许晋诚,
申请(专利权)人:帕西尼感知科技张家港有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。