标签分类模型训练和对象筛选方法、设备及存储介质技术

技术编号：36609537 阅读：13 留言：0更新日期：2023-02-08 09:56

本申请实施例提供了一种标签分类模型训练和对象筛选方法、设备及存储介质，涉及人工智能技术领域，在该方法中，基于样本数据集合对待训练的标签分类模型进行迭代训练，输出目标标签分类模型，在一次迭代过程中，基于样本对象分别在多个预设等级标签下的真实标签值，将多个预设等级标签划分为正向等级标签和负向等级标签，而不是将样本对象绑定在一个等级标签上，故基于样本对象在正向等级标签下的第一预测标签值，以及在负向等级标签下的第二预测标签值，获得目标损失函数进行调参时，考虑了样本对象在多个等级标签下的偏序关系，使标签分类模型在实际意义中更具备合理性，从而提高基于标签分类模型筛选用户账号定向投放多媒体内容的效果。媒体内容的效果。媒体内容的效果。

全部详细技术资料下载

【技术实现步骤摘要】
标签分类模型训练和对象筛选方法、设备及存储介质

[0001]本申请实施例涉及人工智能
，尤其涉及一种标签分类模型训练和对象筛选方法、设备及存储介质。

技术介绍

[0002]随着互联网技术的发展，各种应用层出不穷，人们可以获知的多媒体内容也越来越多。为了满足不同目标对象对多媒体内容的需求，同时节约目标对象搜索多媒体内容的时间，需要向各个目标对象定向推送多媒体内容，以达到好的收益效果。
[0003]相关技术采用softmax函数和交叉熵损失函数训练模型，来预测目标对象的等级标签，然后基于获得的等级标签定向投放相关内容。然而，上述方法只学习提升目标对象实际等级标签的得分，并同时抑制其他等级的等级标签的得分，忽略了各个等级标签之间存在的偏序关系，从而导致模型的预测准确性较低，进而影响定向投放多媒体内容的效果。

技术实现思路

[0004]本申请实施例提供了一种标签分类模型训练和对象筛选方法、装置、设备及存储介质，用于提高标签分类模型的预测准确性，以及定向投放多媒体内容的效果。
[0005]一方面，本申请实施例提供了一种标签分类模型训练方法，该方法包括：
[0006]获得样本数据集合，其中，每个样本数据至少包含样本对象分别在多个预设等级标签下的真实标签值；
[0007]基于所述样本数据集合，对待训练的标签分类模型进行迭代训练，输出已训练的目标标签分类模型，其中，在一次迭代过程中，基于各个样本数据中的样本对象分别在对应的各个正向等级标签下的第一预测标签值，以及分别在对应的各个负...

【技术保护点】

【技术特征摘要】
1.一种标签分类模型训练方法，其特征在于，包括：获得样本数据集合，其中，每个样本数据至少包含样本对象分别在多个预设等级标签下的真实标签值；基于所述样本数据集合，对待训练的标签分类模型进行迭代训练，输出已训练的目标标签分类模型，其中，在一次迭代过程中，基于各个样本数据中的样本对象分别在对应的各个正向等级标签下的第一预测标签值，以及分别在对应的各个负向等级标签下的第二预测标签值，获得用于调参的目标损失函数，所述各个正向等级标签和所述各个负向等级标签，是基于相应的样本对象分别在多个预设等级标签下的真实标签值，对所述多个预设等级标签进行划分获得的。2.如权利要求1所述的方法，其特征在于，所述基于各个样本数据中的样本对象分别在对应的各个正向等级标签下的第一预测标签值，以及分别在对应的各个负向等级标签下的第二预测标签值，获得用于调参的目标损失函数，包括：针对所述各个样本数据，分别执行以下步骤：基于一个样本数据中的样本对象分别在对应的各个正向等级标签下的第一预测标签值，确定第一损失值；基于所述一个样本数据中的样本对象分别在对应的各个负向等级标签下的第二预测标签值，确定第二损失值；基于所述第一损失值和所述第二损失值，确定所述一个样本数据对应的目标损失值；基于获得的所述各个样本数据分别对应的目标损失值，获得用于调参的目标损失函数。3.如权利要求1所述的方法，其特征在于，每个样本数据还包括样本对象的特征数据；所述基于各个样本数据中的样本对象分别在对应的各个正向等级标签下的第一预测标签值，以及分别在对应的各个负向等级标签下的第二预测标签值，获得用于调参的目标损失函数之前，还包括：分别将所述各个样本数据包含的样本对象的特征数据，输入所述待训练的标签分类模型，获得相应的样本对象分别在对应的各个正向等级标签下的第一预测标签值，以及分别在对应的各个负向等级标签下的第二预测标签值。4.如权利要求1所述的方法，其特征在于，每个样本数据中的样本对象对应的各个正向等级标签和各个负向等级标签，是采用以下方式获得的：从一个样本数据对应的各个真实标签值中，确定出大于等于预设阈值的第一类真实标签值，以及小于所述预设阈值的第二类真实标签值；将所述第一类真实标签值对应的各个预设等级标签，作为所述一个样本数据中的样本对象对应的正向等级标签；将所述第二类真实标签值对应的各个预设等级标签，作为所述一个样本数据中的样本对象对应的负向等级标签。5.如权利要求1至4任一所述的方法，其特征在于，进一步包括：对所述多个预设等级标签分别设置相应的活跃等级；以及，在每个样本数据对应的各个正向等级标签和各个负向等级标签中，设置所述各个正向等级标签中的最大活跃等级，小于所述各个负向等级标签中的最小活跃等级。
6.如权利要求5所述的方法，其特征在于，所述获得样本数据集合之前，还包括：根据所述样本对象在目标应用中的留存时长，以及所述样本对象在所述目标应用中的活跃次数，确定所述样本对象分别在所述多个预设等级标签下的真实标签值。7.一种对象筛选方法，其特征在于，包括：获取各个候选对象的特征数据；分别将所述各个候选对象的特征数据，输入已训练的目标标签分类模型，获得所述各个候选对象各自在多个预设等级标签下的目标标签值，所述已训练的...

【专利技术属性】
技术研发人员：赵猛，徐振辉，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人