信息处理方法、装置、介质及电子设备制造方法及图纸

技术编号：24508779 阅读：28 留言：0更新日期：2020-06-17 03:24

本公开涉及人工智能技术领域，具体涉及一种信息处理方法、信息处理装置、计算机可读介质以及电子设备。该信息处理方法包括：确定游戏场景中的游戏行为主体，并获取用于控制所述游戏行为主体执行游戏行为的行为模型；对所述游戏场景进行特征提取，以得到与所述游戏行为主体相关的模型游戏状态信息；通过所述行为模型对所述模型游戏状态信息进行映射处理，以得到与至少两种候选游戏行为相对应的模型游戏行为选取信息；根据所述模型游戏行为选取信息从所述至少两种候选游戏行为中选取由所述游戏行为主体执行的模型游戏行为。该方法可以提高游戏AI的决策能力，使得游戏AI具有更高的拟人化效果和智能化水平。

Information processing methods, devices, media and electronic equipment

全部详细技术资料下载

【技术实现步骤摘要】
信息处理方法、装置、介质及电子设备
本公开涉及人工智能
，并涉及机器学习技术。具体而言，本公开涉及一种信息处理方法、信息处理装置、计算机可读介质以及电子设备。
技术介绍
在电子游戏中通常会配置能够模仿人类游戏行为的游戏AI(ArtificialIntelligence，人工智能)，游戏AI可以作为虚拟玩家参与到游戏进程中与真实的游戏用户进行互动，也可以帮助用户理解游戏规则或者在游戏过程中为用户提供游戏决策建议，另外还可以用于对电子游戏进行自动化测试。随着电子游戏行业的发展，电子游戏中的游戏内容元素的种类和数量变得越来越多，而游戏环境状态也变得越来越复杂。游戏AI在面对多样化的且日益复杂的游戏内容和游戏环境时，往往难以做出符合真实用户行为习惯或者满足用户预期的游戏行为决策，因而普遍表现出智能化水平低、决策能力差等问题，严重影响真实用户的游戏体验。需要说明的是，在上述
技术介绍
部分公开的信息仅用于加强对本申请的背景的理解，因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
...

【技术保护点】
1.一种信息处理方法，其特征在于，包括：/n确定游戏场景中的游戏行为主体，并获取用于控制所述游戏行为主体执行游戏行为的行为模型；/n对所述游戏场景进行特征提取，以得到与所述游戏行为主体相关的模型游戏状态信息；/n通过所述行为模型对所述模型游戏状态信息进行映射处理，以得到与至少两种候选游戏行为相对应的模型游戏行为选取信息；/n根据所述模型游戏行为选取信息从所述至少两种候选游戏行为中选取由所述游戏行为主体执行的模型游戏行为。/n

【技术特征摘要】
1.一种信息处理方法，其特征在于，包括：
确定游戏场景中的游戏行为主体，并获取用于控制所述游戏行为主体执行游戏行为的行为模型；
对所述游戏场景进行特征提取，以得到与所述游戏行为主体相关的模型游戏状态信息；
通过所述行为模型对所述模型游戏状态信息进行映射处理，以得到与至少两种候选游戏行为相对应的模型游戏行为选取信息；
根据所述模型游戏行为选取信息从所述至少两种候选游戏行为中选取由所述游戏行为主体执行的模型游戏行为。

2.根据权利要求1所述的信息处理方法，其特征在于，所述对所述游戏场景进行特征提取，以得到与所述游戏行为主体相关的模型游戏状态信息，包括：
获取所述游戏场景中的场景状态信息以及所述游戏行为主体的主体状态信息；
对所述场景状态信息进行特征提取以得到场景特征向量，并对所述主体状态信息进行特征提取以得到主体特征向量；
对所述场景特征向量和所述主体特征向量进行拼接处理，以得到与所述游戏行为主体相关的模型游戏状态信息。

3.根据权利要求1所述的信息处理方法，其特征在于，所述通过所述行为模型对所述模型游戏状态信息进行映射处理，以得到与至少两种候选游戏行为相对应的模型游戏行为选取信息，包括：
确定与所述游戏行为主体相关的至少两种候选游戏行为；
通过所述行为模型对所述模型游戏状态信息进行映射处理，以得到每种所述候选游戏行为的选取概率；
获取每种所述候选游戏行为的行为可用状态信息，并根据所述行为可用状态信息确定与所述候选游戏行为相对应的行为筛选信息；
根据所述行为筛选信息调整所述候选游戏行为的选取概率，并将调整后的选取概率作为模型游戏行为选取信息。

4.根据权利要求3所述的信息处理方法，其特征在于，所述根据所述行为筛选信息调整所述候选游戏行为的选取概率，包括：
根据所述行为筛选信息确定所述候选游戏行为的行为类型，所述行为类型包括可用行为和不可用行为；
若所述候选游戏行为的行为类型为不可用行为，则将其选取概率调整为预设概率。

5.根据权利要求1所述的信息处理方法，其特征在于，所述根据所述游戏行为选取信息从所述至少两种候选游戏行为中选取由所述游戏行为主体执行的模型游戏行为，包括：
分别确定随机行为选取策略的第一概率和高概率行为选取策略的第二概率；
根据所述第一概率和所述第二概率确定用于选取模型游戏行为的模型选取策略；
若所述模型选取策略为随机行为选取策略，则从所述至少两种候选游戏行为中随机选取一种候选游戏行为作为模型游戏行为；
若所述模型选取策略为高价值行为选取策略，则从所述至少两种候选游戏行为中选取行为价值最高的一种候选游戏行为作为模型游戏行为。

6.根据权利要求1所述的信息处理方法，其特征在于，所述方法还包括：
将所述模型游戏状态信息和所述模型游戏行为的模型游戏行为信息组成模型游戏样本；
获取与所述游戏行为主体相关的用户游戏数据，并根据所述用户游戏数据确定由用户游戏状态信息和用户游戏行为信息组成的用户游戏样本；
将所述模型游戏样本和所述用户游戏样本作为训练样本，并将所述训练样本输入至鉴别模型中；
通过所述鉴别模型对所述训练样本进行映射处理，以得到样本鉴别信息；其中，所述样本鉴别信息用于鉴别所述训练样本为模型游戏样本或者用户游戏样本；
根据所述样本鉴别信息更新所述行为模型和所述鉴别模型的模型参数。

7.根据权利要求6所述的信息处理方法，其特征在于，所述将所述模型游戏状态信息和所述模型游戏行为的模型游戏行为信息组成模型游戏样本，包括：
确定一个游戏场景内的至少一个游戏轮次，并获取各个所述游戏轮次的游戏次序信息；
将对应于一个游戏轮次的模型游戏状态信息和模型游戏行为的模型游戏行为信息组成模型决策信息对；
根据所述游...

【专利技术属性】
技术研发人员：常天元，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人