投放信息质量预测模型训练方法、信息投放方法及装置制造方法及图纸

技术编号:33990757 阅读:51 留言:0更新日期:2022-07-02 09:37
本公开关于一种投放信息质量预测模型训练方法、信息投放方法及装置,该投放信息质量预测模型训练方法包括:获取多项已投放信息,以及每项已投放信息在初始投放阶段的回传数据;基于所述回传数据确定每项已投放信息的样本属性;所述样本属性包括正样本和负样本;其中,具有正样本属性的已投放信息的质量分均高于具有负样本属性的已投放信息的质量分;确定每项已投放信息的素材特征,基于各项已投放信息的素材特征,以及各项已投放信息的样本属性,对预设机器学习模型进行训练,得到投放信息质量预测模型。本公开能够解决对广告新创意的价值预估不准确的问题,提升信息投放的效率和准确性。和准确性。和准确性。

【技术实现步骤摘要】
投放信息质量预测模型训练方法、信息投放方法及装置


[0001]本公开涉及机器学习
,尤其涉及一种投放信息质量预测模型训练方法、信息投放方法及装置。

技术介绍

[0002]随着互联网技术的发展,通过互联网进行信息投放已经成为一种信息传播的新形态,以互联网广告为例,传统广告系统流程主要包括定向、召回、排序和展现四部分,其中排序是指对召回阶段选择出的广告按照广告预估价值进行排序,展现是指对在排序中胜出的广告进行曝光。
[0003]相关技术中在广告新创意冷启动时,通过广告新创意的行为数据对广告新创意的价值进行预估,并基于价值预估结果对广告新创意进行曝光;但是由于广告新创意的行为数据少,难以对广告新创意的价值进行准确预估,并且使得基于对广告新创意的价值预估结果进行广告新创意的投放存在投放不准确的问题;例如若对广告新创意的价值预估偏低,会导致广告新创意难以在排序中胜出,不能获得被曝光的机会。因此,需要提出一种能够准确地对广告新创意进行价值预估的方法。

技术实现思路

[0004]本公开提供一种投放信息质量预测模型训练方法、信息投放方法及装置,以至少解决相关技术中对广告新创意的价值预估不准确的问题。本公开的技术方案如下:
[0005]根据本公开实施例的第一方面,提供投放信息质量预测模型训练方法,包括:
[0006]获取多项已投放信息,以及每项已投放信息在初始投放阶段的回传数据;
[0007]基于所述每项已投放信息在初始投放阶段的回传数据,确定每项已投放信息的样本属性;所述样本属性包括正样本和负样本;其中,具有正样本属性的已投放信息的质量分均高于具有负样本属性的已投放信息的质量分;
[0008]确定每项已投放信息的素材特征,其中所述素材特征包括封面特征、文本特征和视频帧特征;
[0009]基于各项已投放信息的封面特征、文本特征、视频帧特征,以及各项已投放信息的样本属性,对预设机器学习模型进行训练,得到投放信息质量预测模型。
[0010]在一示例性实施例中,所述在初始投放阶段的回传数据包括在初始投放阶段的转化数据以及在初始投放阶段的播放时长数据;
[0011]所述基于所述每项已投放信息在初始投放阶段的回传数据,确定每项已投放信息的样本属性包括:
[0012]判断每项已投放信息在初始投放阶段的转化数据是否大于第一阈值,或者对每项已投放信息在初始投放阶段的转化数据和播放时长数据进行处理得到处理结果,判断所述处理结果是否大于第二阈值;
[0013]若是,确定已投放信息的样本属性为正样本;
[0014]若否,确定已投放信息的样本属性为负样本。
[0015]在一示例性实施例中,所述在初始投放阶段的播放时长数据包括对每项已投放信息的播放时长大于预设时长的概率;
[0016]所述对每项已投放信息在初始投放阶段的转化数据和播放时长数据进行处理得到处理结果,判断所述处理结果是否大于第二阈值包括:
[0017]计算每项已投放信息的转化数据与对所述每项已投放信息的播放时长大于预设时长的概率的第一乘积;
[0018]判断所述第一乘积是否大于所述第二阈值;
[0019]或者,
[0020]基于各项已投放信息的转化数据对各项已投放信息进行降序排序,得到第一排序列表;
[0021]基于各项已投放信息的播放时长大于预设时长的概率对各项已投放信息进行降序排序,得到第二排序列表;
[0022]对于每项已投放信息,从所述第一排序表中确定第一排序值,从所述第二排序表中确定第二排序值,计算所述第一排序值与所述第二排序值的第二乘积;
[0023]判断所述第二乘积是否大于所述第二阈值。
[0024]在一示例性实施例中,所述确定每项已投放信息的素材特征包括:
[0025]提取每项已投放信息的视频封面图,基于所述视频封面图生成每项已投放信息的封面特征;
[0026]对每项已投放信息中包含的文本信息进行识别,生成第一文本信息;对每项已投放信息中包含的音频信息进行识别,生成第二文本信息;基于每项已投放信息的第一文本信息和第二文本信息生成每项已投放信息的文本特征;
[0027]对每项已投放信息按帧进行划分,得到与每项已投放信息对应的视频帧集合,基于所述视频帧集合生成每项已投放信息的视频帧特征。
[0028]在一示例性实施例中,所述基于各项已投放信息的封面特征、文本特征、视频帧特征,以及各项已投放信息的样本属性,对预设机器学习模型进行训练,得到投放信息质量预测模型包括:
[0029]根据各项已投放信息的封面特征、文本特征和视频帧特征,分别生成各项已投放信息的封面特征编码信息、文本特征编码信息和视频帧特征编码信息;
[0030]基于各项已投放信息的封面特征编码信息、文本特征编码信息和视频帧特征编码信息,以及各项已投放信息的样本属性,对预设机器学习模型进行训练,得到所述投放信息质量预测模型。
[0031]在一示例性实施例中,所述根据各项已投放信息的封面特征、文本特征和视频帧特征,分别生成各项已投放信息的封面特征编码信息、文本特征编码信息和视频帧特征编码信息包括:
[0032]分别确定与所述封面特征、文本特征和视频帧特征对应的图像识别编码模型、文本识别编码模型和视觉属性识别编码模型;
[0033]采用所述图像识别编码模型对各项已投放信息的封面特征进行编码,分别生成各项已投放信息的封面特征编码信息;
[0034]采用所述文本识别编码模型对各项已投放信息的文本特征进行编码,分别生成各项已投放信息的文本特征编码信息;
[0035]采用所述视觉属性识别编码模型对各项已投放信息的视频帧特征进行编码,分别生成各项已投放信息的视频帧特征编码信息。
[0036]根据本公开实施例的第二方面,提供一种基于投放信息质量预测模型的信息投放方法,包括:
[0037]获取多项待投放信息;
[0038]确定每项待投放信息的素材特征,其中所述素材特征包括封面特征、文本特征和视频帧特征;
[0039]根据各项待投放信息的封面特征、文本特征和视频帧特征,分别生成各项待投放信息的封面特征编码信息、文本特征编码信息和视频帧特征编码信息;
[0040]将各项待投放信息的封面特征编码信息、文本特征编码信息和视频帧特征编码信息输入到所述投放信息质量预测模型,通过所述投放信息质量预测模型对各项待投放信息进行投放信息质量分的预测,得到各项待投放信息的投放信息质量分;
[0041]基于各项待投放信息的投放信息质量分,从所述多项待投放信息中确定目标投放信息;
[0042]投放所述目标投放信息。
[0043]在一示例性实施例中,所述确定每项待投放信息的素材特征包括:
[0044]提取每项待投放信息的视频封面图,基于所述视频封面图生成每项待投放信息的封面特征;
[0045]对每项待投放信息中包括的文本信息进行识别,生成第三文本信息;对每本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种投放信息质量预测模型训练方法,其特征在于,包括:获取多项已投放信息,以及每项已投放信息在初始投放阶段的回传数据;基于所述每项已投放信息在初始投放阶段的回传数据,确定每项已投放信息的样本属性;所述样本属性包括正样本和负样本;其中,具有正样本属性的已投放信息的质量分均高于具有负样本属性的已投放信息的质量分;确定每项已投放信息的素材特征,其中所述素材特征包括封面特征、文本特征和视频帧特征;基于各项已投放信息的封面特征、文本特征、视频帧特征,以及各项已投放信息的样本属性,对预设机器学习模型进行训练,得到投放信息质量预测模型。2.根据权利要求1所述的投放信息质量预测模型训练方法,其特征在于,所述在初始投放阶段的回传数据包括在初始投放阶段的转化数据以及在初始投放阶段的播放时长数据;所述基于所述每项已投放信息在初始投放阶段的回传数据,确定每项已投放信息的样本属性包括:判断每项已投放信息在初始投放阶段的转化数据是否大于第一阈值,或者对每项已投放信息在初始投放阶段的转化数据和播放时长数据进行处理得到处理结果,判断所述处理结果是否大于第二阈值;若是,确定已投放信息的样本属性为正样本;若否,确定已投放信息的样本属性为负样本。3.根据权利要求2所述的投放信息质量预测模型训练方法,其特征在于,所述在初始投放阶段的播放时长数据包括对每项已投放信息的播放时长大于预设时长的概率;所述对每项已投放信息在初始投放阶段的转化数据和播放时长数据进行处理得到处理结果,判断所述处理结果是否大于第二阈值包括:计算每项已投放信息的转化数据与对所述每项已投放信息的播放时长大于预设时长的概率的第一乘积;判断所述第一乘积是否大于所述第二阈值;或者,基于各项已投放信息的转化数据对各项已投放信息进行降序排序,得到第一排序列表;基于各项已投放信息的播放时长大于预设时长的概率对各项已投放信息进行降序排序,得到第二排序列表;对于每项已投放信息,从所述第一排序表中确定第一排序值,从所述第二排序表中确定第二排序值,计算所述第一排序值与所述第二排序值的第二乘积;判断所述第二乘积是否大于所述第二阈值。4.根据权利要求1所述的投放信息质量预测模型训练方法,其特征在于,所述确定每项已投放信息的素材特征包括:提取每项已投放信息的视频封面图,基于所述视频封面图生成每项已投放信息的封面特征;对每项已投放信息中包含的文本信息进行识别,生成第一文本信息;对每项已投放信息中包含的音频信息进行识别,生成第二文本信息;基于每项已投放信息的第一文本信息
和第二文本信息生成每项已投放信息的文本特征;对每项已投放信息按帧进行划分,得到与每项已投放信息对应的视频帧集合,基于所述视频帧集合生成每项已投放信息的视频帧特征。5.根据权利要求1所述的投放信息质量预测模型训练方法,其特征在于,所述基于各项已投放信息的封面特征、文本特征、视频帧特征,以及各项已投放信息的样本属性,对预设机器学习模型进行训练,得到投放信息质量预测模型包括:根据各项已投放信息的封面特征、文本特征和视频帧特征,分别生成各项已投放信息的封面特征编码信息、文本特征编码信息和视频帧特征编码信息;基于各项已投放信息的封面特征编码信息、文本特征编码信息和视频帧特征编码信息,以及各项已投放信息的样本属性,对预设机器学习模型进行训练,得到所述投放信息质量预测模型。6.根据权利要求5所述的投放信息质量预测模型训练方法,其特征在于,所述根据各项已投放信息的封面特征、文本特征和视频帧特征,分别生成各项已投放信息的封面特征编码信息、文本特征编码信息和视频帧特征编码信息包括:分别确定与所述封面特征、文本特征和视频帧特征对应的图像识别编码模型、文本识别编码模型和视觉属性识别编码模型;采用所述图像识别编码模型对各项已投放信息的封面特征进行编码,分别生成各项已...

【专利技术属性】
技术研发人员:李俊杰肖严赵惜墨
申请(专利权)人:北京达佳互联信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1