【技术实现步骤摘要】
本申请属于机器人,尤其涉及一种对练机器人训练方法及装置。
技术介绍
1、目前,对练机器人的功能为发球,根据预设的发球球速,发球频率和落点发射球,以与用户进行对练。但因这种对练机器人不具备除发球外其他功能,无法满足用户的其他对练需求。
技术实现思路
1、本申请实施例提供了一种对练机器人训练方法、装置、电子设备、可读存储介质和计算机程序产品,可以解决对练机器人只会发球而无法满足用户其他需求的问题。
2、第一方面,本申请实施例提供了一种对练机器人训练方法,包括:
3、获取第一训练数据,所述第一训练数据包括表征动作类型的各动作轨迹的轨迹点,所述动作轨迹的轨迹点是按照时间步长从所述动作轨迹提取得到的;
4、利用所述第一训练数据中各轨迹点,训练高斯混合模型,直至所述高斯混合模型收敛,获得所述高斯混合模型的最优模型参数;
5、利用高斯混合回归,根据所述最优模型参数,生成各时间步的最优轨迹点,以获得期望轨迹,所述期望轨迹用于指示对练机器人沿着所述期望轨迹挥动
<本文档来自技高网...【技术保护点】
1.一种对练机器人训练方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述获取第一训练数据,包括:
3.根据权利要求1所述的方法,其特征在于,获得期望轨迹之后,还包括:
4.根据权利要求2所述的方法,其特征在于,所述利用所述第二训练数据,训练强化学习模型,直至所述强化学习模型的预设损失函数的损失值小于预设阈值,获得已训练的强化学习模型,包括:
5.根据权利要求4所述的方法,其特征在于,所述场景状态包括环境状态、人的位置、对练机器人的位置和球的状态。
6.一种对练方法,其特征在于,包括:
...【技术特征摘要】
1.一种对练机器人训练方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述获取第一训练数据,包括:
3.根据权利要求1所述的方法,其特征在于,获得期望轨迹之后,还包括:
4.根据权利要求2所述的方法,其特征在于,所述利用所述第二训练数据,训练强化学习模型,直至所述强化学习模型的预设损失函数的损失值小于预设阈值,获得已训练的强化学习模型,包括:
5.根据权利要求4所述的方法,其特征在于,所述场景状态包括环境状态、人的位置、对练机器人的位置和球的状态。
6.一种对练方法,...
【专利技术属性】
技术研发人员:孙喜龙,于非,贺颖,陈贞儒,赵哲一,
申请(专利权)人:人工智能与数字经济广东省实验室深圳,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。