基于语言提示的任务处理方法及相关设备技术

技术编号：34364218 阅读：20 留言：0更新日期：2022-07-31 08:08

本申请提供了基于语言提示的任务处理方法及相关设备，涉及人工智能技术领域。其中，基于语言提示的任务处理方法包括：获取与目标语言信息对应的目标图像；基于目标图像与强化学习模型中当前时刻的观察图像，确定预期注意力信息；基于预期注意力信息，确定当前时刻的任务处理结果。基于本申请的实施，能够有效提升强化学习模型的学习效率。同时，由电子设备执行的上述基于语言提示的任务处理方法可以使用人工智能模型来执行。用人工智能模型来执行。用人工智能模型来执行。

Task processing method and related equipment based on language prompt

全部详细技术资料下载

【技术实现步骤摘要】
基于语言提示的任务处理方法及相关设备

[0001]本申请涉及人工智能
，具体而言，本申请涉及基于语言提示的任务处理方法及相关设备。

技术介绍

[0002]随着人工智能技术的发展，在一般强化学习算法的框架下，现有技术还提出了基于语言信息增强的强化学习技术，该技术一般分为语言条件的强化学习和语言辅助的强化学习。其中，语言条件的强化学习主要是通过输入语言描述，为强化学习设置新的奖励策略；语言辅助的强化学习主要是通过输入语言描述，为智能代理提供完成任务的辅助信息，以提升处理任务的效率。
[0003]然而，无论是语言条件的强化学习技术还是语言辅助的强化学习技术，其训练过程都较长，且学习训练而成的模型在新的应用场景中难以泛化，适应性较差。

技术实现思路

[0004]本申请的目的旨在提供一种基于语言提示的任务处理方法及相关设备，以解决上述至少一个技术问题。本申请实施例所提供的方案具体如下：
[0005]第一方面，本申请提供了一种基于语言提示的任务处理方法，包括：
[0006]获取与目标语言信息对应的目标图像；
[0007]基于目标图像与强化学习模型中当前时刻的观察图像，确定预期注意力信息；
[0008]基于预期注意力信息，确定当前时刻的任务处理结果。
[0009]结合第一方面，本申请在第一方面的第一种实施方式中，获取与目标语言信息对应的目标图像，包括：
[0010]基于预构建的语言信息与图像的关联关系，获取与目标语言信息对应的目标图像；
[001...

【技术保护点】

【技术特征摘要】
1.一种基于语言提示的任务处理方法，其特征在于，包括：获取与目标语言信息对应的目标图像；基于所述目标图像与强化学习模型中当前时刻的观察图像，确定预期注意力信息；基于所述预期注意力信息，确定当前时刻的任务处理结果。2.根据权利要求1所述的方法，其特征在于，所述获取与目标语言信息对应的目标图像，包括：基于预构建的语言信息与图像的关联关系，获取与目标语言信息对应的目标图像；其中，语言信息与图像的关联关系采用二分图或知识图谱进行构建。3.根据权利要求2所述的方法，其特征在于，当语言信息与图像的关联关系采用二分图进行构建时，二分图的构建包括：获取待构建的语言信息
‑
图像对；在语言信息集合中检测是否存在待构建的语言信息；若否，基于该待构建的语言信息在所述语言信息集合对应的图结构中新增节点；在图像集合中检测是否存在待构建的图像；若否，基于该待构建的图像在所述图像集合对应的图结构中新增节点；基于所述待构建的语言信息和待构建的图像的关联关系在分别对应的节点之间建立关联边。4.根据权利要求2所述的方法，其特征在于，当语言信息与图像的关联关系采用知识图谱进行构建时，知识图谱的构建包括：获取三元组数据，所述三元组数据包括表征语言信息、视觉关系、图像三者之间关联关系的数据；基于所述三元组数据，采用构建知识图谱的方式构建多模态知识图谱。5.根据权利要求1所述的方法，其特征在于，所述基于所述目标图像与强化学习模型中当前时刻的观察图像，确定预期注意力信息，包括：将所述目标图像与强化学习模型中当前时刻的观察图像进行匹配，确定所述目标图像在所述观察图像中的目标匹配区域；基于所述目标匹配区域，生成预期注意力信息。6.根据权利要求5所述的方法，其特征在于，所述将所述目标图像与强化学习模型中当前时刻的观察图...

【专利技术属性】
技术研发人员：刘洋，郭逸飞，刘松，
申请(专利权)人：三星电子株式会社，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人