分类模型训练方法和设备技术

技术编号：26378484 阅读：13 留言：0更新日期：2020-11-19 23:47

本申请实施例公开了分类模型训练方法和设备。分类模型训练方法的一具体实施方式包括：将样本信息输入至初始模型，得到样本信息的预测类别标签；将样本信息的预测类别标签和真实类别标签输入至损失函数，得到样本信息的损失；对样本信息的损失进行动态加权，得到样本信息的加权损失；基于加权损失调整初始模型的参数，得到分类模型。该实施方式在模型训练阶段对样本信息的损失进行动态加权，以调整模型对不同样本信息的学习程度，使得模型优化的方向更符合实际需求，进而提高模型的分类准确度。

全部详细技术资料下载

【技术实现步骤摘要】
分类模型训练方法和设备
本申请实施例涉及计算机
，具体涉及分类模型训练方法和设备。
技术介绍
在社交媒体中进行高效准确的色情图像识别对于为用户营造安全的网络空间具有十分重要的意义。目前，色情图像识别技术除了基于肤色检测等传统方法外，更主流的方案是采用基于深度学习的图像分类方法。然而，传统的深度学习模型只关注图像是否正确分类以及分类的置信度。
技术实现思路
本申请实施例提出了分类模型训练方法和设备。第一方面，本申请实施例提供了一种分类模型训练方法，包括：将样本信息输入至初始模型，得到样本信息的预测类别标签；将样本信息的预测类别标签和真实类别标签输入至损失函数，得到样本信息的损失；对样本信息的损失进行动态加权，得到样本信息的加权损失；基于加权损失调整初始模型的参数，得到分类模型。在一些实施例中，对样本信息的损失进行动态加权，得到样本信息的加权损失，包括：基于样本信息的损失，确定样本信息的损失权重；基于样本信息的损失权重对样本信息的损失加权，得到加权损失。在一些实施例中，样本信息的损失权重与样本信息的损失正相关。在一些实施例中，样本信息是样本文本、样本图像、样本语音和样本视频之一。在一些实施例中，损失函数是交叉熵损失函数。在一些实施例中，交叉熵损失函数定义为：其中，1≤i≤n，1≤j≤n，且i，j，n均为正整数，y是样本信息的真实类别标签的独热编码，样本信息属于n类，yi是样本信息属于第i个类别的真实概率的独热编码，z为初始模型的输出，p为z的归一化...

【技术保护点】
1.一种分类模型训练方法，包括：/n将样本信息输入至初始模型，得到所述样本信息的预测类别标签；/n将所述样本信息的预测类别标签和真实类别标签输入至损失函数，得到所述样本信息的损失；/n对所述样本信息的损失进行动态加权，得到所述样本信息的加权损失；/n基于所述加权损失调整所述初始模型的参数，得到分类模型。/n

【技术特征摘要】
1.一种分类模型训练方法，包括：
将样本信息输入至初始模型，得到所述样本信息的预测类别标签；
将所述样本信息的预测类别标签和真实类别标签输入至损失函数，得到所述样本信息的损失；
对所述样本信息的损失进行动态加权，得到所述样本信息的加权损失；
基于所述加权损失调整所述初始模型的参数，得到分类模型。

2.根据权利要求1所述的方法，其中，所述对所述样本信息的损失进行动态加权，得到所述样本信息的加权损失，包括：
基于所述样本信息的损失，确定所述样本信息的损失权重；
基于所述样本信息的损失权重对所述样本信息的损失加权，得到所述加权损失。

3.根据权利要求2所述的方法，其中，所述样本信息的损失权重与所述样本信息的损失正相关。

4.根据权利要求1-3之一所述的方法，其中，所述样本信息是样本文本、样本图像、样本语音和样本视频之一。

5.根据权利要求1-3之一所述的方法，其中，所述损失函数是交叉熵损失函数。

6.根据权利要求5所述的方法，其中，所述交叉熵损失函数定义为：

其中，1≤i≤n，1≤j≤n，且i，j，n均为正整数，y是所述样本信息的真实类别标签的独热编码，所述样本信息属于n类，yi是所述样本信息属于第i个类别的真实概率的独热编码，z为所述初始模型的输出，p为z的归一化，代表所述样本信息的预测类别标签，pi为所述样本信息属于第i个类别的预测概率。

7.根据权利要求6所述的方法，其中，所述样本信息只属于一个类别，交叉墒损失函数定义为：
CEL＝-lnpt；
其中，所述样本信息只属于第t个类别，1≤...

【专利技术属性】
技术研发人员：侯永杰，
申请(专利权)人：连尚新昌网络科技有限公司，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人