一种弱监督学习驱动的大小模型协同进化方法及终端技术

技术编号：39326718 阅读：9 留言：0更新日期：2023-11-12 16:04

本发明专利技术提供一种弱监督学习驱动的大小模型协同进化方法及终端，引入现有大模型对当前任务进行初步检测，得到初始检测结果；获取一次研判所确认的初始检测结果的类别，类别为高质量结果或低质量结果，高质量结果为在正确答案集中的结果，低质量结果为在正确答案集之外的结果；判断类别是否为高质量结果，若是则根据高质量结果构建监督模型，并替代一次研判进行后续同类型任务的自动检测，否则进入步骤S4；获取并根据对低质量结果的二次标注，构建监督模型，替代一次研判进行后续同类型任务的自动检测。本发明专利技术整个过程仅需要引入两次人工参与，后续的任务检测均为自动化实现，无需再次引入人工，从而在确保检测质量的同时有效减少了人工参与。少了人工参与。少了人工参与。

全部详细技术资料下载

【技术实现步骤摘要】
一种弱监督学习驱动的大小模型协同进化方法及终端

[0001]本专利技术涉及深度学习
，尤其是涉及一种弱监督学习驱动的大小模型协同进化方法及终端。

技术介绍

[0002]大模型是指在深度学习中具有巨大规模参数和复杂结构的神经网络模型。这些模型通常包含数十亿至数万亿个参数，比传统的小模型(如传统的神经网络)要庞大得多。由于其规模庞大，大模型在众多场景拥有更强大的表示能力和学习能力。但在一些细分领域因为检测对象特异性较高，训练素材难以涵盖、提示词工程难以准确定位，导致其表现不佳。如果从根本上重新或迭代训练大模型，则会造成巨大的资源开销。
[0003]小模型主要是基于监督学习，通过少量的图像对人工预设标注的类别对象进行轻量级的训练，在细分领域可以在短期产出一个高质量的模型。但小模型在泛化性表现上差强人意，且准确率会随着目标或者环境变换产生巨大波动，从而导致模型需要频繁的人工迭代。
[0004]无论是大模型或小模型，本质上都是通过高质量素材驱动的。这些数据必须由人工标注员手动标记或注释，以供模型学习和理解。然而，由于许多任务对于准确的标注要求较高，这个过程非常耗时、复杂且费力。从数据收集、清洗到实际标注，都需要耗费大量的人力资源。特别是在涉及特定领域或领域知识的任务中，标注的复杂性和专业性进一步增加了成本。

技术实现思路

[0005]本专利技术所要解决的技术问题是：提供一种弱监督学习驱动的大小模型协同进化方法及终端，以减少人工参与的同时提高检测质量。
[0006]为了解决上述技术问...

【技术保护点】

【技术特征摘要】
1.一种弱监督学习驱动的大小模型协同进化方法，其特征在于，包括步骤：S1、引入现有大模型对当前任务进行初步检测，得到初始检测结果；S2、获取一次研判所确认的所述初始检测结果的类别，所述类别为高质量结果或低质量结果，所述高质量结果为在正确答案集中的结果，所述低质量结果为在正确答案集之外的结果；S3、判断所述类别是否为所述高质量结果，若是则根据所述高质量结果构建监督模型，并替代所述一次研判进行后续同类型任务的自动检测，否则进入步骤S4；S4、获取并根据对所述低质量结果的二次标注，构建所述监督模型，替代所述一次研判进行后续同类型任务的自动检测。2.根据权利要求1所述的一种弱监督学习驱动的大小模型协同进化方法，其特征在于，所述二次标注为使用Labelme或Labelimg标注工具对所述低质量结果的图像进行人工标注、得到标注好的数据集后将标注好的数据集与所述一次研判得到的数据集以及原有的数据集一起用于所述监督模型的训练。3.根据权利要求2所述的一种弱监督学习驱动的大小模型协同进化方法，其特征在于，所述步骤S3和S4中构建所述监督模型具体为：S41、获取原有的数据集、所述一次研判的数据集和/或所述二次标注的数据集，进行图像尺寸调整、图像归一化和数据增强的预处理，并将数据分为训练集、验证集和测试集；S42、根据任务类型选择不同的现有小模型，并选择随机梯度下降的优化算法和学习率调度器来控制小模型参数的更新；S43、根据任务的要求定义损失函数，衡量所述小模型预测与真实标签之间的差距；S44、将数据集中的数据馈送到所述小模型中进行前项传播，计算损失，然后通过反向传播计算梯度，并使用选择的优化算法更新所述小模型的参数，并最小化损失函数；S45、多次迭代执行步骤S43和S44，使用不同批次的训练集，直到达到预设迭代次数或训练集批次用完；S46、在每个训练周期结束时，使用验证集评估所述小模型的性能，监控损失和度量指标，并根据验证集的表现调整学习率和正则化参数，得到所述监督模型；S47、训练完成后，使用测试集评估得到所述监督模型性能。4.根据权利要求1所述的一种弱监督学习驱动的大小模型协同进化方法，其特征在于，所述步骤S3中还包括：将所述高质量结果反馈到所述大模型中，对所述大模型进行迭代训练；所述步骤S4中还包括：将进行所述二次标注的所述低质量结果作为所述高质量结果，并反馈到所述大模型中，对所述大模型进行迭代训练。5.根据权利要求4所述的一种弱监督学习驱动的大小模型协同进化方法，其特征在于，所述迭代训练具体为：Step1、整理原有的数据集、所述一次研判的数据集和/或所述二次标注的数据集，并按特定任务分类，每个类别中又分为训练集、验证集和测试集；Step2、加载现有所述大模型的参数作为初始权重，并选择随机梯度下降的优化算法和学习率调...

【专利技术属性】
技术研发人员：任飞，徐锦烽，王侨，
申请(专利权)人：福建万福信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人