虚拟对象控制方法、装置、电子设备以及存储介质制造方法及图纸

技术编号:26835679 阅读:10 留言:0更新日期:2020-12-25 12:46
本申请公开了一种虚拟对象控制方法、装置、电子设备以及存储介质,包括:采集目标游戏的游戏图像,所述游戏图像包括虚拟对象和虚拟地图;从所述游戏图像中获取虚拟地图对应的第一图像,所述第一图像包括关键区域和背景区域;在所述第一图像中截取所述关键区域的图像,得到所述虚拟地图对应的第二图像;对所述目标游戏的游戏图像与虚拟地图对应的第二图像进行合成,得到目标图像;基于目标图像对预设控制模型进行训练,得到所述目标游戏的操作控制模型,以通过所述操作控制模型对所述目标游戏中的虚拟对象进行控制,该方案可以减少模型训练的时间,进而提高模型训练的效率。

【技术实现步骤摘要】
虚拟对象控制方法、装置、电子设备以及存储介质
本专利技术涉及计算机
,具体涉及一种虚拟对象控制方法、装置、电子设备以及存储介质。
技术介绍
人工智能(ArtificialIntelligence,AI)是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向,机器学习(MachineLearning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。例如,可以应用于游戏中,如多人在线战术竞技游戏或多人在线竞速游戏中,用户或服务器可通过控制虚拟角色执行调度策略以获得对局胜利,在目前的虚拟角色控制方案中,虚拟对象的自动控制可以通过训练好的操作控制模型进行控制,然而,在训练操作控制模型时,是以原图像作为输入,决策作为输出,由于原图像所包含的图像内容较多,导致需要较长时间的进行在线训练,因此,目前的模型训练效率较低。
技术实现思路
本申请提供一种虚拟对象控制方法、装置、电子设备以及存储介质,可以减少模型训练的时间,进而提高模型训练的效率。本申请提供了一种虚拟对象控制方法,包括:采集目标游戏的游戏图像,所述游戏图像包括虚拟对象和虚拟地图;从所述游戏图像中获取虚拟地图对应的第一图像,所述第一图像包括关键区域和背景区域;在所述第一图像中截取所述关键区域的图像,得到所述虚拟地图对应的第二图像;对所述目标游戏的游戏图像与虚拟地图对应的第二图像进行合成,得到目标图像;基于所述目标图像对预设控制模型进行训练,得到所述目标游戏的操作控制模型,以通过所述操作控制模型对所述目标游戏中的虚拟对象进行控制。相应的,本申请还提供了一种虚拟对象控制装置,包括:采集模块,用于采集目标游戏的游戏图像,所述游戏图像包括虚拟对象和虚拟地图;获取模块,用于从所述游戏图像中获取虚拟地图对应的图像第一图像,所述第一图像包括关键区域和背景区域;截取模块,用于从所述第一图像中截取所述关键区域的图像,得到所述虚拟地图对应的第二图像;合成模块,用于对所述目标游戏的游戏图像与虚拟地图对应的第二图像进行合成,得到目标图像;训练模块,用于基于所述目标图像对预设控制模型进行训练,得到所述目标游戏的操作控制模型;控制模块,用于通过所述操作控制模型对所述目标游戏中的虚拟对象进行控制。可选的,在本申请的一些实施例中,所述训练模块包括:获取子模块,用于获取预设控制模型;提取子模块,用于提取所述目标图像中虚拟对象的运动状态特征预测子模块,用于采用预设控制模型预测所述运动状态特征对应的操作评价值;调整子模块,用于基于所述虚拟对象在所述游戏地图中的速度信息以及预测的操作评价值对预设控制模型的参数进行调整,得到所述目标游戏的操作控制模型。可选的,在本申请的一些实施例中,所述调整子模块包括:获取单元,用于获取所述虚拟对象处于当前运动状态下的速度信息;选择单元,用于根据所述速度信息从预设参考操作集合中选择多个参考操作;预测单元,用于基于预设控制模型预测所述虚拟对象执行选择的参考操作后对应的操作评价值,得到所述虚拟对象执行各参考动作对应的参考操作评价值;调整单元,用于基于所述虚拟对象执行各参考动作对应的参考操作评价值对预设控制模型的参数进行调整,得到所述目标游戏的操作控制模型。可选的,在本申请的一些实施例中,所述调整单元包括:输出子单元,用于根据预设控制模型输出所述虚拟对象执行各参考动作对应的参考操作评价值;确定子单元,用于将操作评价值最高的参考操作确定为目标操作;更新子单元,用于根据所述目标操作对所述虚拟对象的运动状态进行更新,得到执行所述目标操作后所述虚拟对象对应的更新后运动状态;调整子单元,用于基于更新后运动状态对预设控制模型的参数进行调整,得到所述目标游戏的操作控制模型。可选的,在本申请的一些实施例中,所述调整子单元具体用于:根据更新后运动状态计算激励反馈数据;基于所述激励反馈数据调整预设控制模型的模型参数;将更新后运动状态更新为所述目标图像中所述虚拟对象的运动状态,并返回基于所述虚拟对象在所述游戏地图中的速度信息以及预测的操作评价值对预设控制模型的参数进行调整,以得到所述目标游戏的操作控制模型。可选的,在本申请的一些实施例中,所述获取模块具体用于:获取图像分割模型;根据所述尺寸信息对所述第二图像的尺寸进行调整;对所述目标游戏的游戏图像与调整后的第二图像进行拼接,得到目标图像。可选的,在本申请的一些实施例中,所述合成模块具体用于:获取所述游戏图像的尺寸信息;根据所述尺寸信息对所述第二图像的尺寸进行调整;对所述目标游戏的游戏图像与调整后的第二图像进行拼接,得到目标图像。本申请在采集目标游戏的游戏图像后,所述游戏图像包括虚拟对象和虚拟地图,从所述游戏图像中获取虚拟地图对应的第一图像,所述第一图像包括关键区域和背景区域,然后,在所述第一图像中截取所述关键区域的图像,得到所述虚拟地图对应的第二图像,接着,对对所述目标游戏的游戏图像与虚拟地图对应的第二图像进行合成,得到目标图像,最后,基于所述目标图像对预设控制模型进行训练,得到所述目标游戏的操作控制模型,以通过所述操作控制模型对所述目标游戏中的虚拟对象进行控制。因此,该方案可以减少模型训练的时间,进而提高模型训练的效率。附图说明为了更清楚地说明本申请中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1a是本申请提供的虚拟对象控制方法的场景示意图;图1b是本申请提供的虚拟对象控制方法的流程示意图;图1c是本申请提供的虚拟对象控制方法中图像拼接的示意图;图1d~图1e是本申请提供的虚拟对象控制方法中模板匹配的流程图;图2a是本申请提供的虚拟对象控制方法的另一流程示意图;图2b是本申请提供的语义分割网络的结构示意图;图2c是本申请提供的虚拟对象控制方法的另一场景示意图;图2d是虚拟对象控制系统中场景识别模块识别虚拟对象的速度值的示意图;图3是本申请提供的虚拟对象控制装置的结构示意图;图4是本申请提供的电子设备的结构示意图本文档来自技高网...

【技术保护点】
1.一种虚拟对象控制方法,其特征在于,包括:/n采集目标游戏的游戏图像,所述游戏图像包括虚拟对象和虚拟地图;/n从所述游戏图像中获取虚拟地图对应的第一图像,所述第一图像包括关键区域和背景区域;/n在所述第一图像中截取所述关键区域的图像,得到所述虚拟地图对应的第二图像;/n对所述目标游戏的游戏图像与虚拟地图对应的第二图像进行合成,得到目标图像;/n基于所述目标图像对预设控制模型进行训练,得到所述目标游戏的操作控制模型,以通过所述操作控制模型对所述目标游戏中的虚拟对象进行控制。/n

【技术特征摘要】
1.一种虚拟对象控制方法,其特征在于,包括:
采集目标游戏的游戏图像,所述游戏图像包括虚拟对象和虚拟地图;
从所述游戏图像中获取虚拟地图对应的第一图像,所述第一图像包括关键区域和背景区域;
在所述第一图像中截取所述关键区域的图像,得到所述虚拟地图对应的第二图像;
对所述目标游戏的游戏图像与虚拟地图对应的第二图像进行合成,得到目标图像;
基于所述目标图像对预设控制模型进行训练,得到所述目标游戏的操作控制模型,以通过所述操作控制模型对所述目标游戏中的虚拟对象进行控制。


2.根据权利要求1所述的方法,其特征在于,所述基于所述目标图像对预设控制模型进行训练,得到所述目标游戏的操作控制模型,包括:
获取预设控制模型;
提取所述目标图像中虚拟对象的运动状态特征;
采用预设控制模型预测所述运动状态特征对应的操作评价值;
基于所述虚拟对象在所述游戏图像中的速度信息以及预测的操作评价值对预设控制模型的参数进行调整,得到所述目标游戏的操作控制模型。


3.根据权利要求2所述的方法,其特征在于,所述基于所述虚拟对象在所述游戏图像中的速度信息以及预测的操作评价值对预设控制模型的参数进行调整,得到所述目标游戏的操作控制模型,包括:
获取所述虚拟对象处于当前运动状态下的速度信息;
根据所述速度信息从预设参考操作集合中选择多个参考操作;
基于预设控制模型预测所述虚拟对象执行选择的参考操作后对应的操作评价值,得到所述虚拟对象执行各参考动作对应的参考操作评价值;
基于所述虚拟对象执行各参考动作对应的参考操作评价值对预设控制模型的参数进行调整,得到所述目标游戏的操作控制模型。


4.根据权利要求3所述的方法,其特征在于,所述基于所述虚拟对象执行各参考动作对应的参考操作评价值对预设控制模型的参数进行调整,得到所述目标游戏的操作控制模型,包括:
根据预设控制模型输出所述虚拟对象执行各参考动作对应的参考操作评价值;
将操作评价值最高的参考操作确定为目标操作;
根据所述目标操作对所述虚拟对象的运动状态进行更新,得到执行所述目标操作后所述虚拟对象对应的更新后运动状态;
基于更新后运动状态对预设控制模型的参数进行调整,得到所述目标游戏的操作控制模型。


5.根据权利要求4所述的方法,...

【专利技术属性】
技术研发人员:王洁梅温少国李旭冬周大军王君乐
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1