实例检索模型微调方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:36097910 阅读:26 留言:0更新日期:2022-12-24 11:16
本发明专利技术实施例公开了实例检索模型微调方法、装置、计算机设备及存储介质。所述方法包括:获取新场景的训练数据;根据所述训练数据提取场景特征,并进行场景分类,以得到分类结果;根据所述分类结果检索微调策略,以得到微调方案;根据所述微调方案,利用训练数据对预训练模型进行再训练,以得到目标模型;输出所述目标模型。通过实施本发明专利技术实施例的方法可实现对模型的微调,达到少量的训练数据也可以获取到收敛的模型,且计算资源和时间成本低。且计算资源和时间成本低。且计算资源和时间成本低。

【技术实现步骤摘要】
实例检索模型微调方法、装置、计算机设备及存储介质


[0001]本专利技术涉及孪生网络,更具体地说是指实例检索模型微调方法、装置、计算机设备及存储介质。

技术介绍

[0002]在深度学习领域中,模型的性能极大地依赖于数据的数量;给定预训练模型,基于该模型进行训练和调整形成目标模型,正常情况下常用的预训练模型是已调试好的网络,无需再修改其网络结构,模型已经具备了提取浅层基础特征和深层抽象特征的能力。
[0003]但是在实际场景中,往往只拥有少量数据,但数据类型相似,直接使用预训练模型的效果不佳;而从头开始训练模型,数据量远远少于模型的参数,容易产生过拟合现象,并且重复训练浪费计算资源与时间成本。
[0004]因此,有必要设计一种新的方法,实现对模型的微调,达到少量的训练数据也可以获取到收敛的模型,且计算资源和时间成本低。

技术实现思路

[0005]本专利技术的目的在于克服现有技术的缺陷,提供实例检索模型微调方法、装置、计算机设备及存储介质。
[0006]为实现上述目的,本专利技术采用以下技术方案:实例检索模型本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.实例检索模型微调方法,其特征在于,包括:获取新场景的训练数据;根据所述训练数据提取场景特征,并进行场景分类,以得到分类结果;根据所述分类结果检索微调策略,以得到微调方案;根据所述微调方案,利用训练数据对预训练模型进行再训练,以得到目标模型;输出所述目标模型。2.根据权利要求1所述的实例检索模型微调方法,其特征在于,所述根据所述训练数据提取场景特征,并进行场景分类,以得到分类结果,包括:对所述训练数据进行物理特点和语义特点的提取,以确定场景特征;根据所述场景特征确定场景类别,以得到分类结果。3.根据权利要求1所述的实例检索模型微调方法,其特征在于,所述微调方案包括数据增强手段、模型超参数、损失函数以及训练策略。4.根据权利要求3所述的实例检索模型微调方法,其特征在于,所述根据所述分类结果检索微调策略,以得到微调方案,包括:根据所述分类结果确定数据增强手段;根据所述分类结果确定模型超参数;根据所述分类结果确定损失函数;根据所述分类结果确定训练策略。5.根据权利要求4所述的实例检索模型微调方法,其特征在于,所述根据所述分类结果确定损失函数,包括:根据所述分类结果确定所述场景与预训练模型场景的差异性;当差异性超过阈值,则确定损失函数为刻画样本类别间差异的函数,当差异性不超过阈值,则确定损失函数为刻画类内差距的函数。6.实例检索模型微调装置,其特...

【专利技术属性】
技术研发人员:邓星温展欧
申请(专利权)人:珠高智能科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1