特征处理方法、模型训练方法及媒体资源处理方法技术

技术编号:30899052 阅读:29 留言:0更新日期:2021-11-22 23:42
本公开关于一种特征处理方法、模型训练方法及媒体资源处理方法,属于计算机技术领域。该特征处理方法包括:从多个媒体资源样本中,获取至少一个媒体资源特征的特征值,多个媒体资源样本包括属于目标类别的正样本和不属于目标类别的负样本;基于获取到的特征值确定至少一个媒体资源特征对应的相关参数,相关参数用于表示属于目标类别的媒体资源和不属于目标类别的媒体资源在至少一个媒体资源特征的维度上表现出的区分度;确定相关参数大于阈值的目标媒体资源特征,将目标媒体资源特征作为媒体资源处理模型的输入特征,提高了输入特征与媒体资源模型所预测的目标类别的相关度,从而能够提高模型预测的准确度。而能够提高模型预测的准确度。而能够提高模型预测的准确度。

【技术实现步骤摘要】
特征处理方法、模型训练方法及媒体资源处理方法


[0001]本公开涉及计算机
,尤其涉及一种特征处理方法、模型训练方法及媒体资源处理方法。

技术介绍

[0002]近年来,机器学习和深度学习技术已广泛应用在各个场景中,以机器学习和深度学习技术为基础,能够训练出具有判别能力的模型,来解决预测问题。例如,在媒体资源推荐场景中,通过训练预测模型,预测用户是否会点击待推荐的媒体资源。
[0003]随着所需预测的问题越来越复杂,涉及到的特征也越来越多,例如,在媒体资源推荐场景中,涉及到的特征包括与媒体资源有关的多个特征,如何从大量特征中选择合适的特征,作为模型输入,以促进模型有效学习,提高模型预测的准确度,是一个亟待解决的问题。

技术实现思路

[0004]本公开实施例提供了一种特征处理方法、模型训练方法及媒体资源处理方法,以选择合适的特征,作为模型输入,促进模型有效学习,提高模型预测的准确度。本公开的技术方案如下:
[0005]一方面,提供了一种特征处理方法,所述特征处理方法包括:
[0006]从多个媒体资源样本本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种特征处理方法,其特征在于,所述特征处理方法包括:从多个媒体资源样本中,获取至少一个媒体资源特征的特征值,每个媒体资源样本包括一个媒体资源对应的多个媒体资源特征的特征值,所述多个媒体资源样本包括属于目标类别的正样本和不属于所述目标类别的负样本;基于获取到的特征值,确定所述至少一个媒体资源特征对应的相关参数,所述相关参数用于表示属于所述目标类别的媒体资源和不属于所述目标类别的媒体资源在所述至少一个媒体资源特征的维度上,表现出的区分度;从所述多个媒体资源特征中,确定相关参数大于阈值的目标媒体资源特征,将所述目标媒体资源特征作为媒体资源处理模型的输入特征,所述媒体资源处理模型用于预测媒体资源是否属于所述目标类别。2.根据权利要求1所述的特征处理方法,其特征在于,所述至少一个媒体资源特征包括一个第一媒体资源特征;所述基于获取到的特征值,确定所述至少一个媒体资源特征对应的相关参数,包括:从所述第一媒体资源特征对应的多个第一特征值中的最大值和最小值之间,获取所述第一媒体资源特征对应的多个第一阈值;确定每个第一阈值对应的假正类率和真正类率;基于每个第一阈值对应的假正类率和真正类率,确定所述第一媒体资源特征对应的相关参数;其中,任一第一阈值对应的假正类率为所述多个媒体资源样本中第一目标负样本的数量与所述多个媒体资源样本中所述负样本的总数量的比值,所述第一目标负样本是指第一特征值大于所述第一阈值的所述负样本;任一第一阈值对应的真正类率为所述多个媒体资源样本中第一目标正样本的数量与所述多个媒体资源样本中所述正样本的总数量的比值,所述第一目标正样本是指第一特征值大于所述第一阈值的所述正样本。3.一种模型训练方法,其特征在于,所述模型训练方法包括:获取训练样本和所述训练样本对应的标注信息,所述训练样本包括媒体资源对应的多个媒体资源特征的特征值,所述标注信息用于表示所述训练样本是否属于目标类别;从所述训练样本中,获取目标媒体资源特征的特征值,所述目标媒体资源特征为相关参数大于阈值的媒体资源特征,所述相关参数用于表示属于所述目标类别的媒体资源和不属于所述目标类别的媒体资源,在包括所述目标媒体资源特征的至少一个媒体资源特征的维度上,表现出的区分度;将所述目标媒体资源特征的特征值作为媒体资源处理模型的输入,将所述标注信息作为所述媒体资源处理模型的输出目标,训练所述媒体资源处理模型。4.根据权利要求3所述的模型训练方法,其特征在于,所述从所述训练样本中,获取目标媒体资源特征的特征值之前,所述模型训练方法还包括:基于已存储的所述目标类别与所述目标媒体资源特征的对应关系,确定所述目标类别对应的所述目标媒体资源特征。5.一种媒体资源处理方法,其特征在于,所述媒体资源处理方法包括:从媒体资源对应的多个媒体资源特征的特征值中,获取目标媒体资源特征的特征值;
将所述目标媒体资源特征的特征值输入媒体资源处理模型,得到所述媒体资源处理模型输出的预测结果,所述媒体资源处理模型是基于训练样本和所述训练样本对应的标注信息训练得到的,所述预测结果用于表示所述媒体资源是否属于目标类别;其中,所述目标媒体资源特征为相关参数大于阈值的媒体资源特征,所述相关参数用于表示属于所述目标类别的媒体资源和不属于所述目标类别的媒体资源,在包括所述目标媒体资源特征的至少一...

【专利技术属性】
技术研发人员:曹效伦
申请(专利权)人:北京达佳互联信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1