一种分类模型训练方法、图像分类方法及相关设备技术

技术编号：39261346 阅读：10 留言：0更新日期：2023-10-30 12:14

本申请提供一种分类模型训练方法、图像识别方法及相关设备，分类模型训练方法包括：使用图像分类模型分别对多个第一样本数据进行前向传播计算，以得到多个第一样本数据的第一损失值，图像分类模型包括多个出口，每一第一样本数据的第一损失值包括在多个出口的损失值，多个第一样本数据为第一采样得到的图像帧数据；使用权重预测模型对多个第一样本数据的第一损失值进行权重预测，得到多个第一样本数据分别在每一出口的目标权重；基于多个第一样本数据分别在每一出口的预测权重，以及多个第一样本数据的第一损失值，对图像分类模型进行训练，得到用于对图像进行分类的图像分类模型。本申请可以提升模型性能。本申请可以提升模型性能。本申请可以提升模型性能。

全部详细技术资料下载

【技术实现步骤摘要】
一种分类模型训练方法、图像分类方法及相关设备

[0001]本申请涉及人工智能
，尤其涉及一种分类模型训练方法、图像分类方法及相关设备。

技术介绍

[0002]视频监控场景下，由于带宽的限制，通常采用边缘设备进行收取摄像头发送的视频流，用深度学习模型进行推理，并将推理结果发送给客户端，或者将推理结果上传到云端服务器。
[0003]而边缘设备的功耗较低、运算能力较弱，可以采用动态“早退”机制的多出口网络，根据输入样本自适应的提前终止运算，从而减少不必要的冗余计算。然而，现有的动态“早退”神经网络模型往往采用和静态神经网络模型相同的训练策略，忽视了模型的自适应推理特性，导致模型性能较差。

技术实现思路

[0004]本申请提供一种分类模型训练方法、图像分类方法及相关设备，以解决模型性能较差的问题。
[0005]第一方面，本申请实施例提供了一种分类模型训练方法，包括：
[0006]使用图像分类模型分别对多个第一样本数据进行前向传播计算，以得到所述多个第一样本数据的第一损失值，所述分类模型包括多个出口，每一第一样本数据的第一损失值包括在所述多个出口的损失值，所述多个第一样本数据为第一采样得到的图像帧数据；
[0007]使用权重预测模型对所述多个第一样本数据的第一损失值进行权重预测，得到所述多个第一样本数据分别在每一出口的目标权重；
[0008]基于所述多个第一样本数据分别在每一出口的预测权重，以及所述多个第一样本数据的第一损失值，对所述图像分类模型进行训练，得到用于对...

【技术保护点】

【技术特征摘要】
1.一种分类模型训练方法，其特征在于，包括：使用图像分类模型分别对多个第一样本数据进行前向传播计算，以得到所述多个第一样本数据的第一损失值，所述图像分类模型包括多个出口，每一第一样本数据的第一损失值包括在所述多个出口的损失值，所述多个第一样本数据为第一采样得到的图像帧数据；使用权重预测模型对所述多个第一样本数据的第一损失值进行权重预测，得到所述多个第一样本数据分别在每一出口的目标权重；基于所述多个第一样本数据分别在每一出口的目标权重，以及所述多个第一样本数据的第一损失值，对所述图像分类模型进行训练，得到用于对图像进行分类的图像分类模型。2.如权利要求1所述的方法，其特征在于，所述使用权重预测模型对所述多个第一样本数据的第一损失值进行权重预测，得到所述多个第一样本数据分别在每一出口的目标权重，包括：使用权重预测模型对所述多个第一样本数据的第一损失值进行权重预测，得到所述多个第一样本数据分别在每一出口的预测权重；基于所述多个第一样本数据分别在每一出口的预测权重，以及所述多个第一样本数据的第一损失值，对所述图像分类模型的模型参数进行更新，得到参考分类模型；使用所述参考分类模型分别对多个第二样本数据进行分类预测，得到每一出口的样本数据集合以及每一第二样本数据的预测结果，所述多个第二样本数据为第二采样得到的图像帧数据，所述多个第二样本数据包括所述样本数据集合中的样本数据；基于所述每一出口的样本数据集合以及每一第二样本数据的预测结果，计算第二损失值；使用所述第二损失值对所述权重预测模型进行更新；使用更新后的权重预测模型对所述多个第一样本数据的第一损失值进行权重预测，得到所述多个第一样本数据分别在每一出口的目标权重。3.如权利要求2所述的方法，其特征在于，所述使用所述参考分类模型分别对多个第二样本数据进行分类预测，得到每一个出口的样本数据集合以及每一第二样本数据的预测结果，包括：获取所述每一出口的输出样本比例；使用所述参考分类模型分别对多个第二样本数据进行分类预测，得到每一第二样本数据分别在所述多个出口输出的结果；基于所述每一出口的输出样本比例，以及所述每一第二样本数据分别在所述多个出口输出的结果，确定所述每一出口的样本数据集合以及每一第二样本数据的预测结果。4.如权利要求3所述的方法，其特征在于，所述每一第二样本数据分别在所述多个出口输出的结果包括所述每一第二样本数据分别在所述多个出口输出的预测置信度；所述基于所述每一出口的输出样本比例，以及所述每一第二样本数据分别在所述多个出口输出的结果，确定所述每一出口的样本数据集合以及每一第二样本数据的预测结果，包括：获取所述多个出口在所述图像分类模型中的顺序；按照所述每一第二样本数据分别在所述多个出口输出的预测置信度和所述顺序，依次确定所述每一出口的样本数据集合以及每一第二样本数据的预测结果，每一出口的样本数
据集合中的样本数量与所述每一出口的输出样本比例匹配。5.一种图像分类方法，其特征在于，包括：将待识别视频的图像帧输入至图像分类模型进行类别预测，得到预测结果，所述图像分类模型包括多个出口；在所述预测结果表示所述多个出口中的目标出口输出的预测类别的置信度大于预设阈值的情况下，确定所述目标出口输出的预测类别为所述图像帧的类别；其中，所述图像分类模型利用权利要求1至4中任一项所述的分类模型训练方法进行训练得到。6.一种分类模型训练装置，其特征在于，包括：计算模块，用于使用图像分类模型分别对多个第一样本数据进行前向传播计算，以得到所述多个第一样本数据的第一损失值，所述图...

【专利技术属性】
技术研发人员：韩益增，齐鹏飞，浦一凡，王语霖，冯俊兰，邓超，黄高，
申请(专利权)人：清华大学中国移动通信集团有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人