【技术实现步骤摘要】
信息处理方法、计算机可读介质及电子设备
本公开涉及人工智能
,并涉及机器学习技术。具体而言,本公开涉及一种信息处理方法、信息处理装置计算机可读介质以及电子设备。
技术介绍
在电子游戏中通过配置能够模仿人类游戏行为的游戏AI(ArtificialIntelligence,人工智能),可以作为虚拟玩家参与到游戏进程中与真实的游戏用户进行互动,也可以帮助用户理解游戏规则或者在游戏过程中为用户提供游戏决策建议,另外还可以用于对电子游戏进行自动化测试。为了获得符合预期的游戏AI,一般需要花费大量的时间运行游戏以便采集游戏数据,进而利用采集到的游戏数据对游戏AI进行训练和优化。然而,这种训练和优化方式不仅耗费了大量的时间成本和计算资源,而且由于样本数据的限制而难以获得理想的优化效果。需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本申请的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
本公开的目的在于提供一种信息处理方法、信息处理装置、计算机可读介质 ...
【技术保护点】
1.一种信息处理方法,其特征在于,包括:/n确定游戏中的游戏行为主体以及行为交互对象,并获取用于控制所述游戏行为主体与所述行为交互对象进行行为交互的行为模型;/n创建与所述游戏行为主体相对应的模拟行为主体以及与所述行为交互对象相对应的模拟交互对象,并创建包括所述模拟行为主体和所述模拟交互对象的模拟游戏;/n通过所述行为模型控制所述模拟行为主体与所述模拟交互对象进行行为交互,以得到所述模拟游戏中形成的模拟游戏反馈信息;/n根据所述模拟游戏反馈信息训练所述行为模型,以更新所述行为模型的模型参数。/n
【技术特征摘要】
1.一种信息处理方法,其特征在于,包括:
确定游戏中的游戏行为主体以及行为交互对象,并获取用于控制所述游戏行为主体与所述行为交互对象进行行为交互的行为模型;
创建与所述游戏行为主体相对应的模拟行为主体以及与所述行为交互对象相对应的模拟交互对象,并创建包括所述模拟行为主体和所述模拟交互对象的模拟游戏;
通过所述行为模型控制所述模拟行为主体与所述模拟交互对象进行行为交互,以得到所述模拟游戏中形成的模拟游戏反馈信息;
根据所述模拟游戏反馈信息训练所述行为模型,以更新所述行为模型的模型参数。
2.根据权利要求1所述的信息处理方法,其特征在于,所述创建包括所述模拟行为主体和所述模拟交互对象的模拟游戏,包括:
获取所述游戏行为主体与所述行为交互对象在所述游戏中进行行为交互的行为交互速度;
基于所述行为交互速度创建包括所述模拟行为主体和所述模拟交互对象的模拟游戏;
将所述模拟行为主体和所述模拟交互对象在所述模拟游戏中的行为交互速度增大至目标速度。
3.根据权利要求1所述的信息处理方法,其特征在于,在创建包括所述模拟行为主体和所述模拟交互对象的模拟游戏之后,所述方法还包括:
获取所述行为交互对象在所述游戏的各帧游戏画面中的平均分布数量;
增加所述模拟交互对象在所述模拟游戏的各帧游戏画面中的分布数量,以使所述分布数量大于所述平均分布数量。
4.根据权利要求1所述的信息处理方法,其特征在于,在创建包括所述模拟行为主体和所述模拟交互对象的模拟游戏之后,所述方法还包括:
获取相邻两个行为交互对象在所述游戏的各帧游戏画面中的平均间隔距离;
减小相邻两个模拟交互对象在所述模拟游戏的各帧游戏画面中的间隔距离,以使所述间隔距离小于所述平均间隔距离。
5.根据权利要求1所述的信息处理方法,其特征在于,所述通过所述行为模型控制所述模拟行为主体与所述模拟交互对象进行行为交互,以得到所述模拟游戏中形成的模拟游戏反馈信息,包括:
获取所述模拟游戏中的当前游戏状态信息;
通过所述行为模型对所述当前游戏状态信息进行映射处理,以得到当前游戏行为信息;
根据所述当前游戏行为信息控制所述模拟行为主体与所述模拟交互对象进行行为交互,以得到行为交互结果;
获取与所述行为交互结果相对应的当前行为激励信息,并获取所述模拟游戏中的下一游戏状态信息;
对所述当前游戏状态信息、所述当前游戏行为信息、所述当前行为激励信息以及所述下一游戏状态信息进行关联以得到模拟游戏反馈信息。
6.根据权利要求5所述的信息处理方法,其特征在于,所述获取所述模拟游戏中的当前游戏状态信息,包括:
确定所述模拟游戏的当前帧游戏画面,并对所述当前帧游戏画面进行图像采集以得到当前游戏图像;
对所述当前游戏图像进行对象识别,并根据对象识别结果调整所述当前游戏图像中各个像素点的像素值;
对调整像素值后的当前游戏图像进行特征提取以得到当前游戏状态信息。
7.根据权利要求6所述的信息处理方法,其特征在于,所述对所述当前帧游戏画面进行图像采集以得到当前游戏图像,包括:
获取所述模拟游戏中的图像采集相机;
随机调整所述图像采集相机的图像采集位置;
通过调整图像采集位置后的所述图像采集相机获取所述当前帧游戏画面的当前游戏图像。
8.根据权利要求6所述的信息处理方法,其特征在于,所述根据对象识别结果调整所述当前游戏图像中各个像素点的像素值,包括:
根据对象识别结果确定所述当前游戏图像中的模拟游戏背景,并将所述模拟游戏背景所在像素点的像素值调整为第...
【专利技术属性】
技术研发人员:申俊峰,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。