足球机器人的控制方法及相关装置制造方法及图纸

技术编号:32634007 阅读:35 留言:0更新日期:2022-03-12 18:08
本申请提供足球机器人的控制方法及相关装置,控制方法包括:利用图像采集设备实时采集图像数据;针对每个所述足球机器人,利用所述图像数据和所述足球机器人对应的智能球员模型,获取所述足球机器人的动作策略;基于所述足球机器人的动作策略,控制所述足球机器人的动作,从而为所述真人球员提供陪练功能。本申请提供的足球机器人的控制方法及相关装置解决了现有技术中的足球机器人进行陪练时,仿真度不足,降低陪练效果的问题。降低陪练效果的问题。降低陪练效果的问题。

【技术实现步骤摘要】
足球机器人的控制方法及相关装置


[0001]本申请涉及深度学习
,尤其涉及足球机器人的控制方法及相关装置。

技术介绍

[0002]机器人已经广泛应用到竞技体育与国民素质教育的诸多领域,努力提高国内各种机器人的技术水平,特别是设计出适合于各种体育训练用途的智能机器人机构和提高其控制水平,发挥并普及其应用推广优势,将进一步促进国民健康水平及竞技体育事业的高效发展与稳健提升。
[0003]利用人工智能技术控制足球机器人进行真人球员的训练取得了一些成果,例如,中国专利技术专利CN109976330A中,利用图像处理模块对足球机器人采集到的图像进行处理以生成图像信息;利用定位模块对所述图像信息进行处理以生成足球机器人的位置与距离信息;利用通信模块将所述位置与距离信息发送给其他足球机器人和接收其他足球机器人发送的指令信息;利用运动控制器的运动状态管理及决策模块接收位置与距离信息和指令信息,并根据位置与距离信息和指令信息控制足球机器人动作。该专利技术专利所提供的技术方案可以实现多个足球机器人的团队协作。
[0004]然而,现有技术中,足球机器人仅仅能够完成简单的足球动作,无法实现对于真实球员的充分的模拟,使得利用现有技术中的足球机器人进行陪练时,仿真度不足,降低陪练效果。

技术实现思路

[0005]本申请的目的在于提供足球机器人的控制方法及相关装置,解决现有技术中,的足球机器人进行陪练时,仿真度不足,降低陪练效果的问题。
[0006]本申请的目的采用以下技术方案实现:
[0007]第一方面,本申请提供了一种足球机器人的控制方法,所述方法用于控制一个或多个足球机器人为真人球员提供陪练功能,所述方法包括:利用图像采集设备实时采集图像数据;针对每个所述足球机器人,利用所述图像数据和所述足球机器人对应的智能球员模型,获取所述足球机器人的动作策略;基于所述足球机器人的动作策略,控制所述足球机器人的动作,从而为所述真人球员提供陪练功能。
[0008]该技术方案的有益效果在于,采集图像数据并利用图像数据以及智能球员模型获取动作策略,并基于该动作策略控制足球机器人的动作;由于该动作策略的获取利用了智能球员模型,因此,该动作策略所对应的足球机器人的动作对于真实球员的动作的模拟程度高,能够给所陪练的真人球员带来高度拟人化的体验,提高了陪练效果。
[0009]在一些可选实施例中,所述图像数据是所述图像采集设备拍摄足球、所述真人球员和其他足球机器人中的一个或多个对象得到的。该技术方案的有益效果在于,通过实时拍摄真人球员和其他足球机器人中的一个或多个对象来获取图像数据,图像数据反映了陪练时的真实场景,提高真人球员的体验感。
[0010]在一些可选实施例中,所述足球机器人对应的智能球员模型的训练过程如下:利用训练数据和预设的强化学习模型,获取所述足球机器人的动作策略,所述足球机器人的动作策略用于在计算机虚拟环境中模拟所述足球机器人作为球员的动作,所述训练数据包括历史足球录像;确定所述足球机器人的动作策略的奖励值;基于所述足球机器人的动作策略的奖励值,对所述强化学习模型的参数进行更新,得到所述智能球员模型。
[0011]该技术方案的有益效果在于,利用包括历史足球录像的训练数据和预设的强化学习模型获取动作策略,然后在虚拟环境中模拟该动作策略对应的球员的动作,进而确定该动作策略的奖励值,依据该奖励值,训练智能球员模型;所得的智能球员模型的拟真程度高。
[0012]在一些可选实施例中,所述确定所述足球机器人的动作策略的奖励值,包括:以创造最多的射门机会数量为目标,确定所述足球机器人的动作策略的奖励值。该技术方案的有益效果在于,奖励值以创造最多的射门机会为目标,相比于其他目标,例如更多的传球机会、更高的射门准确度等,更加贴近真实足球对抗时的场景,能够最大限度地模拟真实球员的动作习惯;并且,由于智能球员模型是利用历史足球录像训练得到的,因此,以当前足球机器人创造最多的射门机会数量为目标,使得每个足球机器人的动作更贴近特定的运动员个体,尤其是部分特色鲜明的足球巨星的真实动作习惯,增加了用于陪练的足球机器人的个体特色,更受非专业运动员的消费者群体欢迎,商业前景更高。
[0013]在一些可选实施例中,所述确定所述足球机器人的动作策略的奖励值,包括:以创造预设难度模式对应的第一射门机会数量为目标,确定所述足球机器人的动作策略的奖励值。该技术方案的有益效果在于,通过设置预设难度模式以对应射门机会数量,使得智能球员模型能够模拟特定水平的真实球员,提高了智能球员模型的拟真程度。
[0014]在一些可选实施例中,所述预设难度模式分别是多个难度模式的每一个,每个所述智能球员模型与所述多个难度模式的其中一个相匹配,所述方法还包括:获取配置难度模式,所述配置难度模式是所述多个难度模式的其中一个;确定与所述配置难度模式相匹配的一个智能球员模型作为所述足球机器人对应的智能球员模型。
[0015]该技术方案的有益效果在于,获取多个难度模式中的一个配置难度模式,并将与配置难度模式匹配的智能球员模型作为足球机器人对应的智能球员模型,能够匹配得到与多个难度模式中的一个相匹配的智能球员模型,在陪练时,可依据训练状况选择合适的难度,适应不同的真人球员或训练场景或训练周期,提高了陪练效率。
[0016]在一些可选实施例中,所述确定所述足球机器人的动作策略的奖励值,包括:当多个所述智能球员模型联合训练时,以所有所述足球机器人创造所述预设难度模式对应的第二射门机会数量为目标,确定每个所述足球机器人的动作策略的奖励值。该技术方案的有益效果在于,当联合训练时,以所有所述足球机器人创造所述预设难度模式对应的第二射门机会数量为目标,确定每个所述足球机器人的动作策略的奖励值,相比于第一射门机会数量,第二射门机会数量更加贴近足球这一团队运动的真实状态,利用第二射门机会数量所训练得到的多个智能球员模型在联合训练时能够给真人球员带来更加真实的体验,提高了陪练效果;并且,第二射门机会数量,更加适用于特定团队的陪练,更符合专业运动员的消费群体的需求,相比于聘请真实的特定团队进行训练,成本大大降低。另外,还可以模拟直接竞争对手团队,从而真正起到以科技手段提高所陪练的足球团队的战斗力的作用。
[0017]在一些可选实施例中,所述方法用于控制多个所述足球机器人为所述真人球员提供陪练功能,所述预设难度模式分别是多个难度模式的每一个,每个所述智能球员模型与所述多个难度模式的其中一个相匹配,所述方法还包括:获取配置难度模式,所述配置难度模式是所述多个难度模式的其中一个;确定与所述配置难度模式相匹配的多个智能球员模型作为多个所述足球机器人对应的智能球员模型,以获取每个所述足球机器人对应的智能球员模型;其中,与所述配置难度模式相匹配的多个智能球员模型与多个所述足球机器人一一对应。
[0018]该技术方案的有益效果在于,获取多个难度模式中的一个配置难度模式,并将与配置难度模式匹配的智能球员模型作为足球机器人对应的智能球员模型,能够匹配得到与多个难度模本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种足球机器人的控制方法,其特征在于,所述方法用于控制一个或多个足球机器人为真人球员提供陪练功能,所述方法包括:利用图像采集设备实时采集图像数据;针对每个所述足球机器人,利用所述图像数据和所述足球机器人对应的智能球员模型,获取所述足球机器人的动作策略;基于所述足球机器人的动作策略,控制所述足球机器人的动作,从而为所述真人球员提供陪练功能。2.根据权利要求1所述的足球机器人的控制方法,其特征在于,所述图像数据是所述图像采集设备拍摄足球、所述真人球员和其他足球机器人中的一个或多个对象得到的。3.根据权利要求1所述的足球机器人的控制方法,其特征在于,所述足球机器人对应的智能球员模型的训练过程如下:利用训练数据和预设的强化学习模型,获取所述足球机器人的动作策略,所述足球机器人的动作策略用于在计算机虚拟环境中模拟所述足球机器人作为球员的动作,所述训练数据包括历史足球录像;确定所述足球机器人的动作策略的奖励值;基于所述足球机器人的动作策略的奖励值,对所述强化学习模型的参数进行更新,得到所述智能球员模型。4.根据权利要求3所述的足球机器人的控制方法,其特征在于,所述确定所述足球机器人的动作策略的奖励值,包括:以创造最多的射门机会数量为目标,确定所述足球机器人的动作策略的奖励值。5.根据权利要求3所述的足球机器人的控制方法,其特征在于,所述确定所述足球机器人的动作策略的奖励值,包括:以创造预设难度模式对应的第一射门机会数量为目标,确定所述足球机器人的动作策略的奖励值。6.根据权利要求5所述的足球机器人的控制方法,其特征在于,所述预设难度模式分别是多个难度模式的每一个,每个所述智能球员模型与所述多个难度模式的其中一个相匹配,所述方法还包括:获取配置难度模式,所述配置难度模式是所述多个难度模式的其中一个;确定与所述配置难度模式相匹配的一个智能球员模型作为所述足球机器人对应的智能球员模型。7.根据权利要求3所述的足球机器人的控制方法,其特征在于,所述确定所述足球机器人的动作策略的奖励值,包括:当多个所述智能球员模型联合训练时,以所有所述足球机器人创造所述预设难度模式对应的第二射门机会数量为目标,确定每个所述足球机器人的动作策略的奖励值。8.根据权利要求7所述的足球机器人的控制方法,其特征在于,所述方法用于控制多个所述足球机器人为所述真人球员提供陪练功能,所述预设难度模式分别是多个难度模式的每一个,每个所述智能球员模型与所述多个难度模式的其中一个相匹配,所述方法还包括:获取配置难度模式,所述配置难度模式是所述多个难度模式的其中一个;确定与所述配置难度模式相匹配的多个智能球员模型作为多个所述足球机器人对应
的智能球员模型,以获取每个所述足球机器人对应的智能球员模型;其中,与所述配置难度模式相匹配的多个智能球员模型与多个所述足球机器人一一对应。9.根据权利要求8所述的足球机器人的控制方法,其特征在于,与所述配置难度模式相匹配的多个智能球员模型包括多个相同的智能球员模型。10...

【专利技术属性】
技术研发人员:陈海波程巍吉文雅盛沿桥王帅
申请(专利权)人:深兰盛视科技苏州有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1