一种对练机器人训练方法及装置制造方法及图纸

技术编号:40966479 阅读:15 留言:0更新日期:2024-04-18 20:46
本申请提供了一种对练机器人训练方法及装置。所述方法包括:获取第一训练数据,第一训练数据包括表征动作类型的各动作轨迹的轨迹点,动作轨迹的轨迹点是按照时间步长从动作轨迹提取得到的;利用第一训练数据中各轨迹点,训练高斯混合模型,直至高斯混合模型收敛,获得高斯混合模型的最优模型参数;利用高斯混合回归,根据最优模型参数,生成各时间步的最优轨迹点,以获得期望轨迹,期望轨迹用于指示对练机器人沿着期望轨迹挥动以击打球。本申请使得对练机器人基于期望轨迹学习该动作类型,使得对练机器人基于期望轨迹实现使用该动作类型击打球,实现与用户对练,更好协助用户训练以应对不同情况。

【技术实现步骤摘要】

本申请属于机器人,尤其涉及一种对练机器人训练方法及装置


技术介绍

1、目前,对练机器人的功能为发球,根据预设的发球球速,发球频率和落点发射球,以与用户进行对练。但因这种对练机器人不具备除发球外其他功能,无法满足用户的其他对练需求。


技术实现思路

1、本申请实施例提供了一种对练机器人训练方法、装置、电子设备、可读存储介质和计算机程序产品,可以解决对练机器人只会发球而无法满足用户其他需求的问题。

2、第一方面,本申请实施例提供了一种对练机器人训练方法,包括:

3、获取第一训练数据,所述第一训练数据包括表征动作类型的各动作轨迹的轨迹点,所述动作轨迹的轨迹点是按照时间步长从所述动作轨迹提取得到的;

4、利用所述第一训练数据中各轨迹点,训练高斯混合模型,直至所述高斯混合模型收敛,获得所述高斯混合模型的最优模型参数;

5、利用高斯混合回归,根据所述最优模型参数,生成各时间步的最优轨迹点,以获得期望轨迹,所述期望轨迹用于指示对练机器人沿着所述期望轨迹挥动以击打球。

<本文档来自技高网...

【技术保护点】

1.一种对练机器人训练方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述获取第一训练数据,包括:

3.根据权利要求1所述的方法,其特征在于,获得期望轨迹之后,还包括:

4.根据权利要求2所述的方法,其特征在于,所述利用所述第二训练数据,训练强化学习模型,直至所述强化学习模型的预设损失函数的损失值小于预设阈值,获得已训练的强化学习模型,包括:

5.根据权利要求4所述的方法,其特征在于,所述场景状态包括环境状态、人的位置、对练机器人的位置和球的状态。

6.一种对练方法,其特征在于,包括:p>

7.根据权...

【技术特征摘要】

1.一种对练机器人训练方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述获取第一训练数据,包括:

3.根据权利要求1所述的方法,其特征在于,获得期望轨迹之后,还包括:

4.根据权利要求2所述的方法,其特征在于,所述利用所述第二训练数据,训练强化学习模型,直至所述强化学习模型的预设损失函数的损失值小于预设阈值,获得已训练的强化学习模型,包括:

5.根据权利要求4所述的方法,其特征在于,所述场景状态包括环境状态、人的位置、对练机器人的位置和球的状态。

6.一种对练方法,...

【专利技术属性】
技术研发人员:孙喜龙于非贺颖陈贞儒赵哲一
申请(专利权)人:人工智能与数字经济广东省实验室深圳
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1