操作控制方法、装置、设备及存储介质制造方法及图纸

技术编号:19915254 阅读:22 留言:0更新日期:2018-12-28 22:59
本发明专利技术公开了一种操作控制方法、装置、设备及存储介质,属于互联网技术领域。所述方法包括:提取离散特征、连续特征及组合特征,离散特征是指特征值具有离散性的特征,连续特征是指特征值具有连续性的特征,组合特征是指由多个具有关联性的离散特征组合而成的特征;将离散特征、连续特征及组合特征输入到操作策略确定模型中,输出目标对象和目标执行能力;控制指定对象向目标对象释放目标执行能力。本发明专利技术通过提取不同类型的特征,并将所提取的特征输入到操作策略确定模型中,由于操作策略确定模型能够根据不同类型的特征,决策出适合当前操作场景的目标对象和目标执行能力,因而基于目标对象和目标执行能力进行操作控制时,操作成功率较高。

【技术实现步骤摘要】
操作控制方法、装置、设备及存储介质
本专利技术涉及互联网
,特别涉及一种操作控制方法、装置、设备及存储介质。
技术介绍
MMO(MassivelyMultiplayerOnline,大型多人在线)类游戏中,每个玩家控制一个角色,每个角色具有多种技能,玩家以所控制的角色击败对方角色为胜利。在游戏过程中,当玩家在线时,玩家可通过自身操作经验确定所要释放的技能和攻击的目标,并通过向该目标释放该技能,以取得游戏胜利。然而,当玩家托管或者暂时离线时,如何进行操作控制,成为了提高用户游戏体验的关键。如果将MMO类游戏称为指定应用,将游戏类应用中的各个角色称为对象,将本次操作所要攻击的角色称为目标对象,将登录指定应用的用户账号所管理的角色称为指定对象,将本次操作时指定对象所释放的技能称为目标执行能力,现有技术在进行操作控制时,可采用如下方法:获取指定应用界面上各个对象的操作行为数据;从操作行为数据中,提取操作行为特征;将操作行为特征输入到策略决策模型中,输出目标对象和指定对象的目标执行能力,其中,策略决策模型用于基于历史操作行为数据,通过将操作行为特征与历史操作行为特征进行匹配,获取与操作行为特征相匹配的历史操作行为特征,并将该历史操作行为特征对应的目标对象和目标执行能力,作为本次操作的目标对象和目标执行能力;控制指定对象向目标对象释放目标执行能力。由于所确定的目标对象和目标属性完全依赖于历史操作行为数据,而在不同的操作场景下,所适用的目标对象和目标属性执行能力是不同的,因此,现有技术进行操作控制时操作成功率较低。
技术实现思路
为了解决现有技术的问题,本专利技术实施例提供了一种操作控制方法、装置、设备及存储介质。所述技术方案如下:一方面,提供了一种操作控制方法,所述方法包括:获取指定应用界面上包括指定对象在内的各个对象的操作行为数据,所述指定对象为登录指定应用的用户账号所管理的对象;从所述操作行为数据中,提取各个对象的离散特征、连续特征及组合特征,所述离散特征是指特征值具有离散性的特征,所述连续特征是指特征值具有连续性的特征,所述组合特征是指由多个具有关联性的离散特征组合而成的特征;将所述离散特征、所述连续特征及所述组合特征输入到操作策略确定模型中,输出目标对象和所述指定对象的目标执行能力,所述操作策略确定模型用于至少基于离散特征、连续特征及组合特征,确定目标对象和目标执行能力;控制所述指定对象向所述目标对象释放所述目标执行能力。另一方面,提供了一种操作控制装置,所述装置包括:获取模块,用于获取指定应用界面上包括指定对象在内的各个对象的操作行为数据,所述指定对象为登录指定应用的用户账号所管理的对象;提取模块,用于从所述操作行为数据中,提取各个对象的离散特征、连续特征及组合特征,所述离散特征是指特征值具有离散性的特征,所述连续特征是指特征值具有连续性的特征,所述组合特征是指由多个具有关联性的离散特征组合而成的特征;处理模块,用于至少将所述离散特征、所述连续特征及所述组合特征输入到操作策略确定模型中,输出目标对象和所述指定对象的目标执行能力,所述操作策略确定模型用于基于离散特征、连续特征及组合特征,确定目标对象和目标执行能力;释放模块,用于控制所述指定对象向所述目标对象释放所述目标执行能力。另一方面,提供了一种操作控制设备,所述设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或所述指令集由所述处理器加载并执行以实现操作控制方法。另一方面,提供了一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或所述指令集由处理器加载并执行以实现操作控制方法。本专利技术实施例提供的技术方案带来的有益效果是:通过提取不同类型的特征,并将所提取的特征输入到操作策略确定模型中,由于操作策略确定模型能够根据不同类型的特征,决策出适合当前操作场景的目标对象和目标执行能力,因而基于目标对象和目标执行能力进行操作控制时,操作成功率较高。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例提供的一种操作控制方法的应用场景示意图;图2是本专利技术实施例提供的一种操作策略确定模型的框架图;图3是本专利技术实施例提供的一种建立操作策略确定模型的方法流程图;图4是本专利技术实施例提供的一种操作策略确定模型的建立过程的示意图;图5是本专利技术实施例提供的一种操作控制方法的流程图;图6是本专利技术实施例提供的一种游戏界面的示意图;图7是本专利技术实施例提供的一种操作控制装置的结构示意图;图8示出了本专利技术一个示例性实施例提供的用于操作控制的终端的结构框图;图9是根据一示例性实施例示出的一种用于操作策略确定模型的建立服务器的结构框图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术实施方式作进一步地详细描述。在执行本专利技术实施例之前,先对本专利技术涉及到的名词进行解释。指定应用主要指游戏类应用,该指定应用所兼容的操作系统可以为安卓操作系统、IOS操作系统等。对象是指游戏类应用中的各个角色,包括游戏类应用的虚拟人物、虚拟动物等虚拟角色。对象包括操作对象和可选对象。指定对象是指登录指定应用的用户账号所管理的对象。可选对象是指指定应用界面上除指定对象以外的其他对象,可选对象可以为对方队伍中的英雄人物及当前场景中的小兵、怪兽、防御塔等,本专利技术实施例中所要确定的目标对象属于可选对象的范畴,为本次操作过程中需要被攻击的对象。执行能力是指各个对象在指定应用中所具有的技能,可以为加速技能、反转技能等。本专利技术实施例所要确定的目标执行能力为指定对象的一种执行能力,在本次操作过程中向目标对象进行释放。在现代生活中,为了缓解用户紧张的情绪,很多用户会在闲暇时间组队打游戏。而在游戏过程中,用户因这样或那样的原因,需要进行托管或者暂时离线,此时需要借助AI(ArtificialIntelligence,人工智能)控制用户所管理的角色与其他角色进行对战。目前,在借助AI进行操作控制时,主要有以下几种方法:第一种方法、随机选择需要待释放的技能和待攻击的目标,通过控制所管理的角色向该待攻击的目标释放该待释放的技能,实现对该所管理的角色的操作控制。第二种方法、选择消耗能量值最高的技能作为待释放技能,并选择血量最少的角色作为待攻击的目标,通过控制所管理的角色向该待攻击的目标释放该释放的技能,实现对该所管理的角色的操作控制。第三种方法、基于强化学习或深度学习等方法,通过采集样本数据训练策略决策模型,进而基于所训练的策略决策模型,确定待攻击的目标和待释放的技能,通过控制所管理的角色向该待攻击的目标释放所确定的技能,实现对该所管理角色的操作控制。然而,在采用上述几种方法进行操作控制,操作成功率较低。为了解决上述几种方法中操作成功率的问题,本专利技术实施例提供了一种操作控制方法,该方法基于Wide&Deep(宽&深本文档来自技高网...

【技术保护点】
1.一种操作控制方法,其特征在于,所述方法包括:获取指定应用界面上包括指定对象在内的各个对象的操作行为数据,所述指定对象为登录指定应用的用户账号所管理的对象;从所述操作行为数据中,提取各个对象的离散特征、连续特征及组合特征,所述离散特征是指特征值具有离散性的特征,所述连续特征是指特征值具有连续性的特征,所述组合特征是指由多个具有关联性的离散特征组合而成的特征;将所述离散特征、所述连续特征及所述组合特征输入到操作策略确定模型中,输出目标对象和所述指定对象的目标执行能力,所述操作策略确定模型用于基于离散特征、连续特征及组合特征,确定目标对象和目标执行能力;控制所述指定对象向所述目标对象释放所述目标执行能力。

【技术特征摘要】
1.一种操作控制方法,其特征在于,所述方法包括:获取指定应用界面上包括指定对象在内的各个对象的操作行为数据,所述指定对象为登录指定应用的用户账号所管理的对象;从所述操作行为数据中,提取各个对象的离散特征、连续特征及组合特征,所述离散特征是指特征值具有离散性的特征,所述连续特征是指特征值具有连续性的特征,所述组合特征是指由多个具有关联性的离散特征组合而成的特征;将所述离散特征、所述连续特征及所述组合特征输入到操作策略确定模型中,输出目标对象和所述指定对象的目标执行能力,所述操作策略确定模型用于基于离散特征、连续特征及组合特征,确定目标对象和目标执行能力;控制所述指定对象向所述目标对象释放所述目标执行能力。2.根据权利要求1所述的方法,其特征在于,所述从所述操作行为数据中,提取各个对象的离散特征、连续特征及组合特征,包括:从所述操作行为数据中,提取特征值具有离散性的离散特征;从所述操作行为数据中,提取特征值具有连续性的特征,并对提取的特征进行归一化处理,得到所述连续特征;将所述离散特征中具有关联性的特征组成所述组合特征。3.根据权利要求1所述的方法,其特征在于,所述将所述离散特征、所述连续特征及所述组合特征输入到操作策略确定模型中,输出目标对象和所述指定对象的目标属性,包括:获取所述指定对象所具有的每种执行能力及所述指定应用界面上除所述指定对象之外的每个可选对象,将所述指定对象的每种执行能力和每个可选对象作为一种待决策策略;将所述离散特征、所述连续特征、所述组合特征及每种待决策策略输入到所述操作策略确定模型中,输出每种待决策策略对应的策略分数,所述策略分数用于表征操作成功率;将策略分数最高的决策策略中的可选对象和所述指定对象的执行能力分别作为所述目标对象和所述目标执行能力。4.根据权利要求1至3中任一项所述的方法,其特征在于,所述至少将所述离散特征、所述连续特征及所述组合特征输入到操作策略确定模型中,输出目标对象和所述指定对象的目标执行能力之前,还包括:获取操作策略训练样本;从每个操作策略训练样本中,提取样本离散特征、样本连续特征及样本组合特征;获取初始操作策略确定模型,所述初始操作策略确定模型包括初始深度神经网络层和初始逻辑回归网络层;根据每个操作策略训练样本的样本连续特征和样本组合特征,训练所述初始深度神经网络层,得到深度神经网络层;根据每个操作策略训练样本的样本离散特征和样本组合特征及所述深度神经网络层,训练所述初始逻辑回归网络层,得到逻辑回归网络层。5.根据权利要求4所述的方法,其特征在于,所述根据每个操作策略训练样本的样本连续特征和样本组合特征,训练所述初始深度神经网络层,得到深度神经网络层,包括:对每个操作策略训练样本的样本连续特征和样本组合特征进行降维处理,得到每个操作策略训练样本对应的样本训练特征;将每个操作策略训练样本对应的样本训练特征输入到第一损失函数中;基于所述第一损失函数的函数值,对所述初始深度神经网络层的参数进行调整,得到所述深度神经网络层。6.根据权利要求4所述的方法,其特征在于,所述根据每个操作策略训练样本的样本离散特征、样本组合特征及所述深度神经网络层,训练所述初始逻辑回归网络层,得到逻辑回归网络层,包括:将每个操作策略训练样本的样本连续特征和样本组合特征输入到所述深度神经网络层,输出每个策略训练样本对应的已处理特征;将每个操作策略训练样本的样本离散特征、样本组合特征及已处理特征输入到第二损失函数中;基于所述第二损失函数的函数值,对所述初始逻辑回归网络层的参数进行调整,得到所述逻辑回归网络层。7.一种操作控制装置,其特征在于,所述装置包括:获取模块,用于获取指定应用界面上...

【专利技术属性】
技术研发人员:潘晖范奇艾长青张力柯何庆玮荆彦青
申请(专利权)人:深圳市腾讯网络信息技术有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1