基于语言提示的任务处理方法及相关设备技术

技术编号:34364218 阅读:20 留言:0更新日期:2022-07-31 08:08
本申请提供了基于语言提示的任务处理方法及相关设备,涉及人工智能技术领域。其中,基于语言提示的任务处理方法包括:获取与目标语言信息对应的目标图像;基于目标图像与强化学习模型中当前时刻的观察图像,确定预期注意力信息;基于预期注意力信息,确定当前时刻的任务处理结果。基于本申请的实施,能够有效提升强化学习模型的学习效率。同时,由电子设备执行的上述基于语言提示的任务处理方法可以使用人工智能模型来执行。用人工智能模型来执行。用人工智能模型来执行。

Task processing method and related equipment based on language prompt

【技术实现步骤摘要】
基于语言提示的任务处理方法及相关设备


[0001]本申请涉及人工智能
,具体而言,本申请涉及基于语言提示的任务处理方法及相关设备。

技术介绍

[0002]随着人工智能技术的发展,在一般强化学习算法的框架下,现有技术还提出了基于语言信息增强的强化学习技术,该技术一般分为语言条件的强化学习和语言辅助的强化学习。其中,语言条件的强化学习主要是通过输入语言描述,为强化学习设置新的奖励策略;语言辅助的强化学习主要是通过输入语言描述,为智能代理提供完成任务的辅助信息,以提升处理任务的效率。
[0003]然而,无论是语言条件的强化学习技术还是语言辅助的强化学习技术,其训练过程都较长,且学习训练而成的模型在新的应用场景中难以泛化,适应性较差。

技术实现思路

[0004]本申请的目的旨在提供一种基于语言提示的任务处理方法及相关设备,以解决上述至少一个技术问题。本申请实施例所提供的方案具体如下:
[0005]第一方面,本申请提供了一种基于语言提示的任务处理方法,包括:
[0006]获取与目标语言信息对应的目标图像;
[0007]基于目标图像与强化学习模型中当前时刻的观察图像,确定预期注意力信息;
[0008]基于预期注意力信息,确定当前时刻的任务处理结果。
[0009]结合第一方面,本申请在第一方面的第一种实施方式中,获取与目标语言信息对应的目标图像,包括:
[0010]基于预构建的语言信息与图像的关联关系,获取与目标语言信息对应的目标图像;
[0011]其中,语言信息与图像的关联关系采用二分图或知识图谱进行构建。
[0012]结合第一方面的第一种实施方式,本申请在第一方面的第二种实施方式中,当语言信息与图像的关联关系采用二分图进行构建时,二分图的构建包括:
[0013]获取待构建的语言信息

图像对;
[0014]在语言信息集合中检测是否存在待构建的语言信息;若否,基于该待构建的语言信息在语言信息集合对应的图结构中新增节点;
[0015]在图像集合中检测是否存在待构建的图像;若否,基于该待构建的图像在图像集合对应的图结构中新增节点;
[0016]基于待构建的语言信息和待构建的图像的关联关系在分别对应的节点之间建立关联边。
[0017]结合第一方面的第一种实施方式,本申请在第一方面的第三种实施方式中,当语言信息与图像的关联关系采用知识图谱进行构建时,知识图谱的构建包括:
[0018]获取三元组数据,三元组数据包括表征语言信息、视觉关系、图像三者之间关联关系的数据;
[0019]基于三元组数据,采用构建知识图谱的方式构建多模态知识图谱。
[0020]结合第一方面,本申请在第一方面的第四种实施方式中,基于目标图像与强化学习模型中当前时刻的观察图像,确定预期注意力信息,包括:
[0021]将目标图像与强化学习模型中当前时刻的观察图像进行匹配,确定目标图像在观察图像中的目标匹配区域;
[0022]基于目标匹配区域,生成预期注意力信息。
[0023]结合第一方面的第四种实施方式,本申请在第一方面的第五种实施方式中,将目标图像与强化学习模型中当前时刻的观察图像进行匹配,确定目标图像在观察图像中的目标匹配区域,包括:
[0024]采用模板匹配方式计算目标图像在强化学习模型中当前时刻的观察图像中各个匹配区域的匹配度;
[0025]基于匹配度,确定目标图像在观察图像中的目标匹配区域。
[0026]结合第一方面,本申请在第一方面的第六种实施方式中,基于预期注意力信息,确定当前时刻的任务处理结果,包括:
[0027]基于当前时刻的观察图像生成自注意力信息;
[0028]融合预期注意力信息和自注意力信息,得到融合注意力信息;
[0029]基于融合注意力信息确定当前时刻的任务处理结果。
[0030]结合第一方面的第六种实施方式,本申请在第一方面的第七种实施方式中,基于当前时刻的观察图像生成自注意力信息,包括:
[0031]对当前时刻和上一时刻的观察图像进行视觉编码,基于视觉编码结果确定键信息keys和值信息values;
[0032]基于上一时刻的查询信息与键信息生成自注意力信息。
[0033]结合第一方面的第七种实施方式,本申请在第一方面的第八种实施方式中,基于融合注意力信息确定当前时刻的任务处理结果,包括:
[0034]加权合并融合注意力信息与值信息,并基于权合并后得到的信息确定当前时刻的任务处理结果。
[0035]第二方面,本申请提供了一种基于语言提示的任务处理装置,包括:
[0036]获取模块,用于获取与目标语言信息对应的目标图像;
[0037]第一确定模块,用于基于目标图像与强化学习模型中当前时刻的观察图像,确定预期注意力信息;
[0038]第二确定模块,用于基于预期注意力信息,确定当前时刻的任务处理结果。
[0039]第三方面,本申请提供了一种电子设备,该电子设备包括存储器和处理器;存储器中存储有计算机程序;处理器,用于在运行计算机程序时,执行本申请实施例所提供的基于语言提示的任务处理方法。
[0040]第四方面,本申请提供了一种计算机可读存储介质,该存储介质中存储有计算机程序,计算机程序在被处理器运行时,执行本申请实施例所提供的基于语言提示的任务处理方法。
[0041]本申请提供的技术方案带来的有益效果包括:
[0042]本申请提出一种基于语言提示的任务处理方法,通过获取与目标语言信息对应的目标图像,基于目标图像与强化学习模型中当前时刻的观察图像确定与任务相关的预期注意力信息,可以通过目标图像将与目标语言信息相关联的环境状态信息引入至强化学习模型中;并且预期注意力信息是根据环境状态信息得到的预期与任务相关的信息,基于该预期注意力信息确定当前时刻的任务处理结果,有利于提高强化学习模型在新的应用场景中的适应性,且通过预期注意力信息强化学习模型可以在当前时刻的观察图像中有效地注意到与任务相关的信息,其无需在强化学习模型的基础上从零开始训练模型的注意力机制,有效提升了强化学习模型的学习效率。
[0043]另一方面,本申请是基于预构建的语言信息与图像的关联关系,获取的与目标语言信息对应的目标图像,其中,语言信息与图像的关联关系可以采用二分图或知识图谱进行构建。本申请中可以根据相应的使用场景预构建相应的语言信息和图像的关联关系,可以有效提高本申请技术方案的适应性和灵活性;另,本申请采用二分图构建语言信息与图像的关联关系时,由于采用的是图结构且为解耦的语言结构,使得语言信息与图像之间的关联关系是可解释、可修改的,有效提高了该解耦的语言结构的灵活性。
附图说明
[0044]为了更清楚地说明本申请实施例中的技术方案,下面将对本申请实施例描述中所需要使用的附图作简单地介绍。
[0045]图1为本申请的一种实施例提供的基于语本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于语言提示的任务处理方法,其特征在于,包括:获取与目标语言信息对应的目标图像;基于所述目标图像与强化学习模型中当前时刻的观察图像,确定预期注意力信息;基于所述预期注意力信息,确定当前时刻的任务处理结果。2.根据权利要求1所述的方法,其特征在于,所述获取与目标语言信息对应的目标图像,包括:基于预构建的语言信息与图像的关联关系,获取与目标语言信息对应的目标图像;其中,语言信息与图像的关联关系采用二分图或知识图谱进行构建。3.根据权利要求2所述的方法,其特征在于,当语言信息与图像的关联关系采用二分图进行构建时,二分图的构建包括:获取待构建的语言信息

图像对;在语言信息集合中检测是否存在待构建的语言信息;若否,基于该待构建的语言信息在所述语言信息集合对应的图结构中新增节点;在图像集合中检测是否存在待构建的图像;若否,基于该待构建的图像在所述图像集合对应的图结构中新增节点;基于所述待构建的语言信息和待构建的图像的关联关系在分别对应的节点之间建立关联边。4.根据权利要求2所述的方法,其特征在于,当语言信息与图像的关联关系采用知识图谱进行构建时,知识图谱的构建包括:获取三元组数据,所述三元组数据包括表征语言信息、视觉关系、图像三者之间关联关系的数据;基于所述三元组数据,采用构建知识图谱的方式构建多模态知识图谱。5.根据权利要求1所述的方法,其特征在于,所述基于所述目标图像与强化学习模型中当前时刻的观察图像,确定预期注意力信息,包括:将所述目标图像与强化学习模型中当前时刻的观察图像进行匹配,确定所述目标图像在所述观察图像中的目标匹配区域;基于所述目标匹配区域,生成预期注意力信息。6.根据权利要求5所述的方法,其特征在于,所述将所述目标图像与强化学习模型中当前时刻的观察图...

【专利技术属性】
技术研发人员:刘洋郭逸飞刘松
申请(专利权)人:三星电子株式会社
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1