对象处理方法、装置、可读介质及电子设备制造方法及图纸

技术编号:35413959 阅读:25 留言:0更新日期:2022-11-03 11:11
本公开涉及一种对象处理方法、装置、可读介质及电子设备。该方法包括:获取待处理的目标对象;将该目标对象输入预先训练的目标模型,得到该目标对象对应的处理结果;其中,该目标对象包括目标图像和/或目标文字;该目标模型为对待定模型进行目标压缩处理后得到的模型,该待定模型为根据第一训练样本对预先训练的第一教师模型进行知识蒸馏后得到的模型,该目标压缩处理可以包括剪枝处理。这样,通过知识蒸馏得到待定模型,然后在对待定模型进行目标压缩处理(例如剪枝处理),可以使训练得到的目标模型,在最大程度上保留第一教师模型在各种任务的表现的情况下,减少模型参数,加快模型的推理速度。型的推理速度。型的推理速度。

【技术实现步骤摘要】
对象处理方法、装置、可读介质及电子设备


[0001]本公开涉及计算机
,具体地,涉及一种对象处理方法、装置、可读介质及电子设备。

技术介绍

[0002]随着计算机技术的发展,通过同时理解视觉信息(vision)和语言信息(language)来解决相关问题的多模态理解任务逐渐得到应用,例如,图文检索任务(Image

Text Retrieval),视觉问答任务(Visual Question Answering),视觉推理任务(Visual Reasoning)等。
[0003]但是,在相关技术中,这种多模态理解任务对应的模型结构复杂,部署受限。

技术实现思路

[0004]提供该
技术实现思路
部分以便以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。该
技术实现思路
部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
[0005]根据本公开实施例的第一方面,提供一种对象处理方法,所述方法包括:
[0006]获取待处理的目标对象;所述目标对象包括目标图像和/或目标文字;
[0007]将所述目标对象输入预先训练的目标模型,得到所述目标对象对应的处理结果;
[0008]其中,所述目标模型为对待定模型进行目标压缩处理后得到的模型,所述待定模型为根据第一训练样本对预先训练的第一教师模型进行知识蒸馏后得到的模型;所述目标压缩处理包括剪枝处理。
[0009]根据本公开实施例的第二方面,提供一种对象处理装置,所述装置包括:
[0010]对象获取模块,用于获取待处理的目标对象;所述目标对象包括目标图像和/或目标文字;
[0011]对象处理模块,用于将所述目标对象输入预先训练的目标模型,得到所述目标对象对应的处理结果;其中,所述目标模型为对待定模型进行目标压缩处理后得到的模型,所述待定模型为根据第一训练样本对预先训练的第一教师模型进行知识蒸馏后得到的模型;所述目标压缩处理包括剪枝处理。
[0012]根据本公开实施例的第三方面,提供一种计算机可读介质,其上存储有计算机程序,所述计算机程序被处理装置执行时实现本公开第一方面所述方法的步骤。
[0013]根据本公开实施例的第四方面,提供一种电子设备,包括:
[0014]存储装置,其上存储有计算机程序;
[0015]处理装置,用于执行所述存储装置中的所述计算机程序,以实现本公开第一方面所述方法的步骤。
[0016]采用上述技术方案,获取待处理的目标对象;将该目标对象输入预先训练的目标模型,得到该目标对象对应的处理结果;其中,该目标对象包括目标图像和/或目标文字;该
目标模型为对待定模型进行目标压缩处理后得到的模型,该待定模型为根据第一训练样本对预先训练的第一教师模型进行知识蒸馏后得到的模型,该目标压缩处理可以包括剪枝处理。这样,通过知识蒸馏得到待定模型,然后在对待定模型进行目标压缩处理(如剪枝处理),可以使训练得到的目标模型,在最大程度上保留第一教师模型在各种任务的表现的情况下,减少模型参数,加快模型的推理速度,方便目标模型在各种场景下的部署和应用。
[0017]应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
[0018]结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,原件和元素不一定按照比例绘制。在附图中:
[0019]图1是根据一示例性实施例示出的一种对象处理方法的流程图。
[0020]图2是根据一示例性实施例示出的一种目标模型的训练方法的流程图。
[0021]图3是根据一示例性实施例示出的一种对待定模型进行剪枝的方法的示意图。
[0022]图4是根据一示例性实施例示出的另一种目标模型的训练方法的示意图。
[0023]图5是根据一示例性实施例示出的一种对象处理装置的框图。
[0024]图6是根据一示例性实施例示出的另一种对象处理装置的框图。
[0025]图7是根据一示例性实施例示出的一种电子设备的框图。
具体实施方式
[0026]下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
[0027]应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
[0028]本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。
[0029]需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
[0030]需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。在本公开的描述中,除非另有说明,“多个”是指两个或多于两个,其它量词与之类似;“以下至少一项
[0031](个)”、“一项(个)或多项(个)”或其类似表达,是指的这些项(个)中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b,或c中的一项(个)或多项(个),可以表
示:a,b,c,a

b,a

c,b

c,或a

b

c,其中a,b,c可以是单个,也可以是多个;“和/或”是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况,其中A,B可以是单数或者复数。
[0032]本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
[0033]可以理解的是,在使用本公开各实施例公开的技术方案之前,均应当依据相关法律法规通过恰当的方式对本公开所涉及个人信息的类型、使用范围、使用场景等告知用户并获得用户的授权。
[0034]例如,在响应于接收到用户的主动请求时,向用户发送提示信息,以明确地提示用户,其请求执行的操作将需要获取和使用到用户的个人本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种对象处理方法,其特征在于,所述方法包括:获取待处理的目标对象;所述目标对象包括目标图像和/或目标文字;将所述目标对象输入预先训练的目标模型,得到所述目标对象对应的处理结果;其中,所述目标模型为对待定模型进行目标压缩处理后得到的模型,所述待定模型为根据第一训练样本对预先训练的第一教师模型进行知识蒸馏后得到的模型;所述目标压缩处理包括剪枝处理。2.根据权利要求1所述的方法,其特征在于,所述目标模型通过以下方式训练得到:获取预先训练的第一教师模型;根据第一训练样本对所述第一教师模型进行知识蒸馏,得到待定模型;对所述待定模型进行所述目标压缩处理,得到所述目标模型。3.根据权利要求1所述的方法,其特征在于,所述目标压缩处理包括第一剪枝处理;所述对所述待定模型进行所述目标压缩处理,得到所述目标模型包括:确定目标模型对应的第一目标任务类型;根据所述第一目标任务类型对所述待定模型进行第一剪枝处理,得到所述第一目标任务类型对应的目标模型。4.根据权利要求3所述的方法,其特征在于,所述待定模型包括目标编码器,所述根据所述第一目标任务类型对所述待定模型进行第一剪枝处理,得到所述第一目标任务类型对应的目标模型包括:根据所述第一目标任务类型,对至少一个目标编码器的至少一个网络层进行第一剪枝处理。5.根据权利要求4所述的方法,其特征在于,所述目标编码器包括第一图像编码器、第一文字编码器和第一跨模态编码器中的一个或多个。6.根据权利要求5所述的方法,其特征在于,在所述目标编码器包括所述第一图像编码器或所述第一文字编码器的...

【专利技术属性】
技术研发人员:曾妍周王春澍王天楠
申请(专利权)人:北京有竹居网络技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1