一种策略信息确定的方法及装置制造方法及图纸

技术编号：18741928 阅读：28 留言：0更新日期：2018-08-24 23:55

本发明专利技术公开了一种策略信息确定的方法，包括：获取待处理数据，其中，待处理数据包括第一图像和第二图像，第一图像包含交互式应用的场景缩略数据，第二图像包含交互式应用的场景交互数据；通过策略信息模型对第一图像进行处理，得到目标行动数据，其中，策略信息模型为标签样本数据与样本行动数据之间的关系；根据第二图像确定目标对象的目标状态数据；根据目标行动数据以及目标状态数据确定目标对象所对应的策略信息，其中，策略信息用于控制目标对象行动。本发明专利技术还公开了一种策略信息确定装置。本发明专利技术可以实现游戏操作的自动化，对于复杂的游戏场景而言，利用策略信息模型得到的策略信息更接近真实玩家的行为，从而提升方案的灵活性。

Method and device for determining strategy information

The invention discloses a method for determining policy information, including: acquiring data to be processed, wherein the data to be processed includes a first image and a second image, the first image contains scene thumbnail data for interactive application, the second image contains scene interactive data for interactive application, and the first graph through a policy information model. Target action data are obtained by image processing, in which the policy information model is the relationship between the label sample data and the sample action data; the target state data of the target object is determined according to the second image; and the corresponding policy information of the target object is determined according to the target action data and the target state data. A little information is used to control target actions. The invention also discloses a device for determining the strategic information. The invention can realize the automation of game operation, and for complex game scenes, the strategy information obtained by using the strategy information model is closer to the real player's behavior, thereby improving the flexibility of the scheme.

全部详细技术资料下载

【技术实现步骤摘要】
一种策略信息确定的方法及装置
本专利技术涉及人工智能领域，尤其涉及一种策略信息确定的方法及装置。
技术介绍
目前，交互式应用中通常具有人机互动的模式，或者机器模拟用户操作的模式，比如，在交互式应用中，可以采用行为树进行动作策略的判断与输出。终端设备在判断动作策略时，需要通过一些条件自顶向下地搜索行为树，最终确定要执行的策略信息。然而，虽然可以通过判断行为树中的指定条件来输出策略信息，但是，由于行为树中指定条件是有限的，所以对于复杂的交互式应用场景而言，没有指定的情况而言则不能很好地进行处理，因此，采用行为树的灵活性较低。
技术实现思路
本专利技术实施例提供了一种策略信息确定的方法及装置，可以实现游戏操作的自动化，对于复杂的游戏场景而言，利用策略信息模型得到的策略信息更接近真实玩家的行为，从而提升方案的灵活性。本专利技术的第一方面提供了一种策略信息确定的方法，包括：获取待处理数据，其中，所述待处理数据包括第一图像和第二图像，所述第一图像包含交互式应用的场景缩略数据，所述第二图像包含所述交互式应用的场景交互数据；通过策略信息模型对所述第一图像进行处理，得到目标行动数据，其中，所述策略信息模型为标签样本数据与样本行动数据之间的关系；根据所述第二图像确定目标对象的目标状态数据；根据所述目标行动数据以及所述目标状态数据确定所述目标对象所对应的策略信息，其中，所述策略信息用于控制所述目标对象行动。本专利技术的第二方面提供了一种策略信息确定装置，包括：获取模块，用于获取待处理数据，其中，所述待处理数据包括第一图像和第二图像，所述第一图像包含交互式应用的场景缩略数据，所述第二...

【技术保护点】
1.一种策略信息确定的方法，其特征在于，包括：获取待处理数据，其中，所述待处理数据包括第一图像和第二图像，所述第一图像包含交互式应用的场景缩略数据，所述第二图像包含所述交互式应用的场景交互数据；通过策略信息模型对所述第一图像进行处理，得到目标行动数据，其中，所述策略信息模型为标签样本数据与样本行动数据之间的关系；根据所述第二图像确定目标对象的目标状态数据；根据所述目标行动数据以及所述目标状态数据，确定所述目标对象所对应的策略信息，其中，所述策略信息用于控制所述目标对象行动。

【技术特征摘要】
1.一种策略信息确定的方法，其特征在于，包括：获取待处理数据，其中，所述待处理数据包括第一图像和第二图像，所述第一图像包含交互式应用的场景缩略数据，所述第二图像包含所述交互式应用的场景交互数据；通过策略信息模型对所述第一图像进行处理，得到目标行动数据，其中，所述策略信息模型为标签样本数据与样本行动数据之间的关系；根据所述第二图像确定目标对象的目标状态数据；根据所述目标行动数据以及所述目标状态数据，确定所述目标对象所对应的策略信息，其中，所述策略信息用于控制所述目标对象行动。2.根据权利要求1所述的方法，其特征在于，所述通过策略信息模型对所述第一图像进行处理，得到目标行动数据之前，所述方法还包括：获取所述样本行动数据以及所述标签样本数据，其中，所述样本行动数据用于表示不同的行动策略，所述标签样本数据用于对所述不同的行动策略进行分类；对所述样本行动数据以及所述标签样本数据进行训练，以得到所述策略信息模型。3.根据权利要求1所述的方法，其特征在于，所述通过策略信息模型对所述第一图像进行处理，得到目标行动数据，包括：将所述第一图像输入至所述策略信息模型，并通过所述策略信息模型输出至少一个行动数据的概率；根据所述至少一个行动数据的概率确定所述目标行动数据，其中，所述目标行动数据属于所述至少一个行动数据。4.根据权利要求1所述的方法，其特征在于，所述根据所述第二图像确定目标对象的目标状态数据，包括：获取所述第二图像中的特征数据；对所述第二图像中的特征数据进行处理，得到所述目标对象的目标状态数据。5.根据权利要求1至4中任一项所述的方法，其特征在于，所述根据所述目标行动数据以及所述目标状态数据确定所述目标对象所对应的策略信息，包括：判断所述目标状态数据是否满足第一数据处理条件；若所述目标状态数据满足所述第一数据处理条件，则判断所述目标状态数据是否满足第二数据处理条件，若所述目标状态数据满足所述第二数据处理条件，则将第一行动数据确定为所述目标对象所对应的策略信息；若所述目标状态数据不满足所述第一数据处理条件，则将所述目标行动数据确定为所述目标对象所对应的策略信息。6.根据权利要求5所述的方法，其特征在于，所述判断所述目标状态数据是否满足第二数据处理条件，包括：若所述目标状态数据不满足所述第二数据处理条件，则将第二行动数据确定为所述目标对象所对应的策略信息。7.根据权利要求5所述的方法，其特征在于，所述方法还包括：若根据所述目标行动数据以及所述目标状态数据满足第三数据处理条件，则执行第三行动数据对应的策略信息；若根据所述目标行动数据以及所述目标状态数据满足第四数据处理条...

【专利技术属性】
技术研发人员：周大军，张力柯，荆彦青，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人