一种多数据集的联合训练方法及终端技术

技术编号：39167576 阅读：8 留言：0更新日期：2023-10-23 15:05

本发明专利技术提供的一种多数据集的联合训练方法及终端，通过一个预设神经网络模型上同时对多个不同的数据集上进行联合训练，得到最优分类模型，以此方式避免维护多个模型，减少模型推理次数，提高模型训练效率。同时本发明专利技术根据所有所述标记数据的类型总数构建掩膜数据，使得多个数据集在进行联合训练时，无需补充标注某一数据集中未标注数据，减少数据标注的工作量；并且避免在不同数据集上生成伪标签，屏蔽训练过程中未标注数据所带来的误差，提高多数据集的联合训练模型的精度。据集的联合训练模型的精度。据集的联合训练模型的精度。

全部详细技术资料下载

【技术实现步骤摘要】
一种多数据集的联合训练方法及终端

[0001]本专利技术涉及图像处理
，尤其涉及一种多数据集的联合训练方法及终端。

技术介绍

[0002]在进行多标签分类时，其数据集通常是由一个样例和一个集合的标签所组成的样本，该样本可能同时属于多个类别，例如一张图片中同时含有行人、自行车、小汽车等多个目标，则在数据集A中对应的目标标签为行人，在数据集B中对应的目标标签为自行车，在数据集C中对应的目标标签为小汽车，此时数据集A、B、C中的图像虽然同时包含行人、自行车以及小汽车三个目标，但是在进行标注时，每个数据集仅标注该数据集当前关注的目标。而目前实现多数据集的联合训练方法主要包括以下三种方式：常规的方法：分别在不同的数据集上训练对应的模型，并将模型串联起来进行部署，同一个目标需要依次在多个模型上进行推理，得到对应的推理结果，最后将全部结果合并得到最终的输出；但是这种方法需要维护多个模型，且同一目标需要进行多次推理，存在大量的重复计算。
[0003]使用伪标签的方法：先使用大模型分别在不同的数据集上训练对应的分类模型(例如A模型、B模型、C模型等），然后使用训练好的大模型在其他未标注对应属性的数据上进行分类，生成伪标签；最后将标注的标签和生成的伪标签合并，即将多个数据集合并为一个数据集，再进行最终的分类模型训练，得到最终的联合分类模型；但是这种方法训练得到的大模型精度不是100%准确，在各个数据集全部生成伪标签以后，伪标签的数量远大于标注标签的数量，导致在最终的模型训练时，放大精度误差，影响最终输出的联合分类模型的精度...

【技术保护点】

【技术特征摘要】
1.一种多数据集的联合训练方法，其特征在于，包括：获取多个不同的数据集；所述数据集包括原始数据以及所述原始数据对应的标记数据；每一所述数据集对应一个标记数据的类型集合；不同数据集的所述类型集合不同；根据所有所述标记数据的类型总数构建每一所述原始数据对应的掩膜数据；所述掩膜数据标识所述标记数据的类型在所述原始数据对应的标记数据中是否存在；根据所述原始数据、原始数据对应的标记数据以及原始数据对应的掩膜数据构建训练数据集，并根据所述训练数据集训练预设神经网络模型，得到分类模型。2.根据权利要求1所述的一种多数据集的联合训练方法，其特征在于，所述根据所述训练数据集训练预设神经网络模型，得到分类模型，具体为：将所述原始数据输入预设神经网络模型进行分类，得到模型预测结果；根据所述模型预测结果、原始数据对应的标记数据以及原始数据对应的掩膜数据计算损失函数值；根据所述损失函数值更新所述预设神经网络模型的参数，得到迭代中的待选分类模型；从所有所述待选分类模型中确定分类模型。3.根据权利要求2所述的一种多数据集的联合训练方法，其特征在于，所述得到迭代中的待选分类模型之后，还包括：判断所述训练数据集是否完成预设次数的训练，若否，则返回执行根据损失函数值更新所述预设神经网络模型的参数的步骤，得到多个迭代中的待选分类模型。4.根据权利要求1或3所述的一种多数据集的联合训练方法，其特征在于，所述根据所述训练数据集训练预设神经网络模型之前，还包括：将所述训练数据集分为训练集和测试集；根据所述训练集中的所述原始数据、原始数据对应的标记数据以及原始数据对应的掩膜数据训练所述预设神经网络模型，得到所述分类模型；根据所述测试集评估所述分类模型的精确度。5.根据权利要求4所述的一种多数据集的联合训练方法，其特征在于，所述根据所述测试集评估所述分类模型的精确度，具体为：通过所述分类模型预测所述测试集中的每一测试数据得到模型预测结果；获取每一所述测试数据对应的标记数据；逐一判断所述...

【专利技术属性】
技术研发人员：梁浩，张宇，刘东剑，
申请(专利权)人：深圳金三立视频科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人