模型更新方法、视觉任务处理方法、装置、设备及介质制造方法及图纸

技术编号：39730272 阅读：7 留言：0更新日期：2023-12-17 23:34

本申请属于人工智能技术领域，具体涉及一种模型更新方法、视觉任务处理方法、装置、设备及介质。所述方法包括：将样本数据分别输入原始视觉特征提取模型和初始更新视觉特征提取模型进行视觉特征提取处理，得到原始视觉特征数据和初始更新视觉特征数据，并对初始更新视觉特征提取模型中的初始数据转换模型进行训练，得到目标更新视觉特征提取模型；将原始视觉特征提取模型更新为目标更新视觉特征提取模型，目标更新视觉特征模型用于提取视觉特征数据，视觉特征数据用于执行视觉任务。该模型更新方法提高了模型更新效率，并降低了模型更新成本。新成本。新成本。

全部详细技术资料下载

【技术实现步骤摘要】
模型更新方法、视觉任务处理方法、装置、设备及介质

[0001]本申请属于人工智能
，具体涉及一种模型更新方法、视觉任务处理方法、装置、设备及介质。

技术介绍

[0002]随着人工智能技术的研究和进步，出现了很多计算机视觉(Computer Vision，CV)系统，比如图像识别系统、图像检索系统、视频处理系统等。计算机视觉系统的实现，离不开视觉基础模型。视觉基础模型一般以自监督的方式从海量数据中学习特征表达，可以应用于多种下游视觉任务，构成了视觉系统的基石。在视觉系统中，视觉模型通常作为上游特征提取器来提取视觉特征，通过设计不同的下游视觉任务模块来完成特定视觉任务。
[0003]由于计算机视觉技术发展迅猛，为了提升计算机视觉系统的性能，以改善用户体验，视觉基础模型需要进行不断地升级以满足发展需求。目前，视觉基础模型的升级方式多采用冷插拔式升级。在升级视觉基础模型的过程中，需要对所有的下游视觉任务模块重新进行训练。因此，这种升级方式具有低灵活性、低效率、高成本等弊端。

技术实现思路

[0004]为了解决上述技术问题，本申请提出了一种模型更新方法、视觉任务处理方法、装置、设备及介质。通过将训练好的预设视觉特征提取模型和初始数据转换模型进行融合得到初始更新视觉特征提取模型，利用原始视觉特征提取模型和初始更新视觉特征提取模型对同一样本多媒体数据处理得到的原始视觉特征数据和初始更新视觉特征数据，对初始更新视觉特征提取模型中的初始数据转换模型进行训练，使初始更新视觉特征数据与原始视觉特征数据在特征空...

【技术保护点】

【技术特征摘要】
1.一种模型更新方法，其特征在于，所述方法包括：获取样本多媒体数据；将所述样本多媒体数据输入原始视觉特征提取模型进行视觉特征提取处理，得到原始视觉特征数据；以及将所述样本多媒体数据输入到初始更新视觉特征提取模型进行视觉特征提取和数据转换处理，得到初始更新视觉特征数据；所述初始更新视觉特征提取模型为基于预设视觉特征提取模型和初始数据转换模型融合得到；所述预设视觉特征提取模型用于对所述样本多媒体数据进行视觉特征提取，得到预设视觉特征数据；所述初始数据转换模型用于对所述预设视觉特征数据进行数据转换，得到所述初始更新视觉特征数据；基于所述原始视觉特征数据和所述初始更新视觉特征数据，对所述初始更新视觉特征提取模型中的初始数据转换模型进行训练，直至所述原始视觉特征数据和所述初始更新视觉特征数据的差异满足预设条件，得到目标更新视觉特征提取模型；将所述原始视觉特征提取模型更新为所述目标更新视觉特征提取模型，所述目标更新视觉特征模型用于提取视觉特征数据，所述视觉特征数据用于执行视觉任务。2.根据权利要求1所述的方法，其特征在于，所述初始数据转换模型包括下采样层、激活层和上采样层；所述预设视觉特征数据的维度为第一预设维度；所述将所述样本多媒体数据输入到初始更新视觉特征提取模型进行视觉特征提取和数据转换处理，得到初始更新视觉特征数据，包括：将所述样本多媒体数据输入到所述预设视觉特征提取模型进行视觉特征提取，得到所述预设视觉特征数据；将所述预设视觉特征数据输入至所述下采样层进行下采样处理，得到维度为第二预设维度的下采样视觉特征处理结果；所述第二预设维度小于所述第一预设维度；将所述下采样视觉特征处理结果输入至所述激活层进行激活处理，得到视觉特征激活处理结果；将所述视觉特征激活处理结果输入至所述上采样层进行上采样处理，得到维度为所述第一预设维度的上采样视觉特征处理结果；基于所述上采样视觉特征处理结果，确定所述初始更新视觉特征数据。3.根据权利要求2所述的方法，其特征在于，所述原始视觉特征数据的维度为第三预设维度；所述初始更新视觉特征提取模型包括维度对齐层；所述基于所述上采样视觉特征处理结果，确定所述初始更新视觉特征数据，包括：将所述上采样视觉特征处理结果输入到所述维度对齐层进行维度对齐处理，得到维度为所述第三预设维度的所述初始更新视觉特征数据。4.根据权利要求1至3任意一项所述的方法，其特征在于，所述基于所述原始视觉特征数据和所述初始更新视觉特征数据，对所述初始更新视觉特征提取模型中的初始数据转换模型进行训练，直至所述原始视觉特征数据和所述初始更新视觉特征数据的差异满足预设条件，得到目标更新视觉特征提取模型，包括：基于所述原始视觉特征数据和所述初始更新视觉特征数据之间的差异，确定目标模型损失数据；基于所述目标模型损失数据，对所述初始更新视觉特征提取模型中的初始数据转换模型的参数进行调整，直至所述目标模型损失数据满足预设条件，得到所述目标更新视觉特
征提取模型。5.根据权利要求4所述的方法，其特征在于，所述样本多媒体数据包括样本图像数据和样本文本数据，所述样本文本数据用于描述所述样本图像数据；所述原始视觉特征提取模型包括原始图像特征提取子模型和原始文本特征提取子模型；所述将所述样本多媒体数据输入原始视觉特征提取模型进行视觉特征提取处理，得到原始视觉特征数据，包括：将所述样本图像数据输入至所述原始图像特征提取子模型进行图像视觉特征提取，得到原始图像视觉特征数据；将所述样本文本数据输入至所述原始文本特征提取子模型进行文本视觉特征提取，得到原始文本视觉特征数据；将所述原始图像视觉特征数据和所述原始文本视觉特征数据作为所述原始视觉特征数据。6.根据权利要求5所述的方法，其特征...

【专利技术属性】
技术研发人员：张斌杰，葛艺潇，单瀛，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人