标签分类模型训练和对象筛选方法、设备及存储介质技术

技术编号:36609537 阅读:13 留言:0更新日期:2023-02-08 09:56
本申请实施例提供了一种标签分类模型训练和对象筛选方法、设备及存储介质,涉及人工智能技术领域,在该方法中,基于样本数据集合对待训练的标签分类模型进行迭代训练,输出目标标签分类模型,在一次迭代过程中,基于样本对象分别在多个预设等级标签下的真实标签值,将多个预设等级标签划分为正向等级标签和负向等级标签,而不是将样本对象绑定在一个等级标签上,故基于样本对象在正向等级标签下的第一预测标签值,以及在负向等级标签下的第二预测标签值,获得目标损失函数进行调参时,考虑了样本对象在多个等级标签下的偏序关系,使标签分类模型在实际意义中更具备合理性,从而提高基于标签分类模型筛选用户账号定向投放多媒体内容的效果。媒体内容的效果。媒体内容的效果。

【技术实现步骤摘要】
标签分类模型训练和对象筛选方法、设备及存储介质


[0001]本申请实施例涉及人工智能
,尤其涉及一种标签分类模型训练和对象筛选方法、设备及存储介质。

技术介绍

[0002]随着互联网技术的发展,各种应用层出不穷,人们可以获知的多媒体内容也越来越多。为了满足不同目标对象对多媒体内容的需求,同时节约目标对象搜索多媒体内容的时间,需要向各个目标对象定向推送多媒体内容,以达到好的收益效果。
[0003]相关技术采用softmax函数和交叉熵损失函数训练模型,来预测目标对象的等级标签,然后基于获得的等级标签定向投放相关内容。然而,上述方法只学习提升目标对象实际等级标签的得分,并同时抑制其他等级的等级标签的得分,忽略了各个等级标签之间存在的偏序关系,从而导致模型的预测准确性较低,进而影响定向投放多媒体内容的效果。

技术实现思路

[0004]本申请实施例提供了一种标签分类模型训练和对象筛选方法、装置、设备及存储介质,用于提高标签分类模型的预测准确性,以及定向投放多媒体内容的效果。
[0005]一方面,本申请实施例提供了一种标签分类模型训练方法,该方法包括:
[0006]获得样本数据集合,其中,每个样本数据至少包含样本对象分别在多个预设等级标签下的真实标签值;
[0007]基于所述样本数据集合,对待训练的标签分类模型进行迭代训练,输出已训练的目标标签分类模型,其中,在一次迭代过程中,基于各个样本数据中的样本对象分别在对应的各个正向等级标签下的第一预测标签值,以及分别在对应的各个负向等级标签下的第二预测标签值,获得用于调参的目标损失函数,所述各个正向等级标签和所述各个负向等级标签,是基于相应的样本对象分别在多个预设等级标签下的真实标签值,对所述多个预设等级标签进行划分获得的。
[0008]一方面,本申请实施例提供了一种对象筛选方法,该方法包括:
[0009]获取各个候选对象的特征数据;
[0010]分别将所述各个候选对象的特征数据,输入已训练的目标标签分类模型,获得所述各个候选对象各自在多个预设等级标签下的目标标签值,所述已训练的目标标签分类模型是采用上述标签分类模型训练方法获得的;
[0011]基于所述各个候选对象各自在多个预设等级标签下的目标标签值,分别确定所述各个候选对象各自对应的深度意向分值;
[0012]基于所述各个候选对象各自对应的深度意向分值,从所述各个候选对象中筛选出至少一个目标对象。
[0013]一方面,本申请实施例提供了一种标签分类模型训练装置,该装置包括:
[0014]第一获取模块,用于获得样本数据集合,其中,每个样本数据至少包含样本对象分
别在多个预设等级标签下的真实标签值;
[0015]训练模块,用于基于所述样本数据集合,对待训练的标签分类模型进行迭代训练,输出已训练的目标标签分类模型,其中,在一次迭代过程中,基于各个样本数据中的样本对象分别在对应的各个正向等级标签下的第一预测标签值,以及分别在对应的各个负向等级标签下的第二预测标签值,获得用于调参的目标损失函数,所述各个正向等级标签和所述各个负向等级标签,是基于相应的样本对象分别在多个预设等级标签下的真实标签值,对所述多个预设等级标签进行划分获得的。
[0016]可选地,所述训练模块还包括调参模块;
[0017]所述调参模块具体用于:
[0018]针对所述各个样本数据,分别执行以下步骤:
[0019]基于一个样本数据中的样本对象分别在对应的各个正向等级标签下的第一预测标签值,确定第一损失值;
[0020]基于所述一个样本数据中的样本对象分别在对应的各个负向等级标签下的第二预测标签值,确定第二损失值;
[0021]基于所述第一损失值和所述第二损失值,确定所述一个样本数据对应的目标损失值;
[0022]基于获得的所述各个样本数据分别对应的目标损失值,获得用于调参的目标损失函数。
[0023]可选地,每个样本数据还包括样本对象的特征数据;
[0024]所述训练模块还包括预测模块;
[0025]所述预测模块具体用于:
[0026]基于各个样本数据中的样本对象分别在对应的各个正向等级标签下的第一预测标签值,以及分别在对应的各个负向等级标签下的第二预测标签值,获得用于调参的目标损失函数之前,分别将所述各个样本数据包含的样本对象的特征数据,输入所述待训练的标签分类模型,获得相应的样本对象分别在对应的各个正向等级标签下的第一预测标签值,以及分别在对应的各个负向等级标签下的第二预测标签值。
[0027]可选地,所述调参模块还用于:
[0028]从一个样本数据对应的各个真实标签值中,确定出大于等于预设阈值的第一类真实标签值,以及小于所述预设阈值的第二类真实标签值;
[0029]将所述第一类真实标签值对应的各个预设等级标签,作为所述一个样本数据中的样本对象对应的正向等级标签;
[0030]将所述第二类真实标签值对应的各个预设等级标签,作为所述一个样本数据中的样本对象对应的负向等级标签。
[0031]可选地,所述训练模块还包括设置模块;
[0032]所述设置模块具体用于:
[0033]对所述多个预设等级标签分别设置相应的活跃等级;以及,
[0034]在每个样本数据对应的各个正向等级标签和各个负向等级标签中,设置所述各个正向等级标签中的最大活跃等级,小于所述各个负向等级标签中的最小活跃等级。
[0035]可选地,所述设置模块还用于:
[0036]根据所述样本对象在目标应用中的留存时长,以及所述样本对象在所述目标应用中的活跃次数,确定所述样本对象分别在所述多个预设等级标签下的真实标签值。
[0037]一方面,本申请实施例提供了一种对象筛选装置,该装置包括:
[0038]第二获取模块,用于获取各个候选对象的特征数据;
[0039]预测模块,用于分别将所述各个候选对象的特征数据,输入已训练的目标标签分类模型,获得所述各个候选对象各自在多个预设等级标签下的目标标签值,所述已训练的目标标签分类模型是采用上述标签分类模型训练装置获得的;
[0040]评估模块,用于基于所述各个候选对象各自在多个预设等级标签下的目标标签值,分别确定所述各个候选对象各自对应的深度意向分值;
[0041]筛选模块,用于基于所述各个候选对象各自对应的深度意向分值,从所述各个候选对象中筛选出至少一个目标对象。
[0042]可选地,所述评估模块具体用于:
[0043]针对所述各个候选对象,分别执行以下步骤:
[0044]对一个候选对象分别在多个预设等级标签下的目标标签值进行归一化处理,获得一个候选对象分别在所述多个预设等级标签下的候选概率;
[0045]基于获得的各个候选概率,以及所述多个预设等级标签分别对应权重,确定一个候选对象的深度意向分值。
[0046]可选地,所述筛选模块具体用于:本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种标签分类模型训练方法,其特征在于,包括:获得样本数据集合,其中,每个样本数据至少包含样本对象分别在多个预设等级标签下的真实标签值;基于所述样本数据集合,对待训练的标签分类模型进行迭代训练,输出已训练的目标标签分类模型,其中,在一次迭代过程中,基于各个样本数据中的样本对象分别在对应的各个正向等级标签下的第一预测标签值,以及分别在对应的各个负向等级标签下的第二预测标签值,获得用于调参的目标损失函数,所述各个正向等级标签和所述各个负向等级标签,是基于相应的样本对象分别在多个预设等级标签下的真实标签值,对所述多个预设等级标签进行划分获得的。2.如权利要求1所述的方法,其特征在于,所述基于各个样本数据中的样本对象分别在对应的各个正向等级标签下的第一预测标签值,以及分别在对应的各个负向等级标签下的第二预测标签值,获得用于调参的目标损失函数,包括:针对所述各个样本数据,分别执行以下步骤:基于一个样本数据中的样本对象分别在对应的各个正向等级标签下的第一预测标签值,确定第一损失值;基于所述一个样本数据中的样本对象分别在对应的各个负向等级标签下的第二预测标签值,确定第二损失值;基于所述第一损失值和所述第二损失值,确定所述一个样本数据对应的目标损失值;基于获得的所述各个样本数据分别对应的目标损失值,获得用于调参的目标损失函数。3.如权利要求1所述的方法,其特征在于,每个样本数据还包括样本对象的特征数据;所述基于各个样本数据中的样本对象分别在对应的各个正向等级标签下的第一预测标签值,以及分别在对应的各个负向等级标签下的第二预测标签值,获得用于调参的目标损失函数之前,还包括:分别将所述各个样本数据包含的样本对象的特征数据,输入所述待训练的标签分类模型,获得相应的样本对象分别在对应的各个正向等级标签下的第一预测标签值,以及分别在对应的各个负向等级标签下的第二预测标签值。4.如权利要求1所述的方法,其特征在于,每个样本数据中的样本对象对应的各个正向等级标签和各个负向等级标签,是采用以下方式获得的:从一个样本数据对应的各个真实标签值中,确定出大于等于预设阈值的第一类真实标签值,以及小于所述预设阈值的第二类真实标签值;将所述第一类真实标签值对应的各个预设等级标签,作为所述一个样本数据中的样本对象对应的正向等级标签;将所述第二类真实标签值对应的各个预设等级标签,作为所述一个样本数据中的样本对象对应的负向等级标签。5.如权利要求1至4任一所述的方法,其特征在于,进一步包括:对所述多个预设等级标签分别设置相应的活跃等级;以及,在每个样本数据对应的各个正向等级标签和各个负向等级标签中,设置所述各个正向等级标签中的最大活跃等级,小于所述各个负向等级标签中的最小活跃等级。
6.如权利要求5所述的方法,其特征在于,所述获得样本数据集合之前,还包括:根据所述样本对象在目标应用中的留存时长,以及所述样本对象在所述目标应用中的活跃次数,确定所述样本对象分别在所述多个预设等级标签下的真实标签值。7.一种对象筛选方法,其特征在于,包括:获取各个候选对象的特征数据;分别将所述各个候选对象的特征数据,输入已训练的目标标签分类模型,获得所述各个候选对象各自在多个预设等级标签下的目标标签值,所述已训练的...

【专利技术属性】
技术研发人员:赵猛徐振辉
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1