本发明专利技术公开了一种点击率预估方法,该方法通过至少两个不同类型的预估模型各自独立根据可点击项的属性信息进行点击率预估,融合多种模型,通过不同的方法提取特征,可以有效提升模型的表征能力和模型的泛化效果,在得到各预估模型分别输出的预估结果后,确定各预估结果分别对应的预估权重,通过权重区分了不同特征预估结果的重要性,对各模型预估结果进行加权融合,可以充分利用不同模型的预估贡献进行适当的结果融合,提升了预估结果的精准度。本发明专利技术还公开了一种点击率预估装置、设备及可读存储介质,具有相应的技术效果。具有相应的技术效果。具有相应的技术效果。
【技术实现步骤摘要】
一种点击率预估方法、装置、设备及可读存储介质
[0001]本专利技术涉及信息处理
,特别是涉及一种点击率预估方法、装置、设备及可读存储介质。
技术介绍
[0002]经过互联网多年的普及和发展,广告、链接、图片、文章等互联网可点击项以多种形式存在于各种各样的互联网产品中,成为互联网的重要组成部分。
[0003]精准互联网营销的核心是点击率预估技术。点击率越高,表明用户对可点击项越感兴趣,进而转化为交易的可能性也越大。因此通过模型算法对点击率进行预测,可以用于指导当前广告、链接、图片、文章等互联网可点击项的精准投放,实现经济效益产出的最大化。
[0004]伴随大数据、人工智能等技术的发展,使得投放商利用平台历史数据进行精准营销从技术上成为可能。目前,点击率预估主流技术主要包括两种:单一深度学习模型方法以及混合深度学习模型方法。单一深度学习模型方法常用经典的DNN(深度神经网络)方法进行点击率预估,该类模型则是利用深度学习对数据具有很好的表征能力,但是单一的线性模型泛化能力较差,导致模型精度不高。混合模型的方法主要有DeepFM(宽深模型)方法、AFM(Attentional Factorization Machine)模型、NFM(Neural Factorization Machine)模型等,混合模型结合了传统机器学习方法和深度学习方法的优点,但是其集成过程优化的程度有限,影响了最终模型预估的效果。
[0005]综上所述,如何提高点击率预估的精准度,是目前本领域技术人员急需解决的技术问题。
技术实现思路
[0006]本专利技术的目的是提供一种点击率预估方法、装置、设备及可读存储介质,以提高点击率预估的精准度。
[0007]为解决上述技术问题,本专利技术提供如下技术方案:
[0008]一种点击率预估方法,包括:
[0009]获取可点击项的属性信息;其中,所述属性信息包括:用户信息、对象信息以及场景信息中至少一种;
[0010]对所述属性信息进行数据预处理,得到预处理数据;
[0011]将所述预处理数据分别输入至至少两个不同类型的预估模型中,以便各所述预估模型分别根据所述预处理数据进行点击行为预测,生成预估结果;
[0012]确定各所述预估结果分别对应的预估权重;
[0013]根据所述预估权重,对所述预估结果进行加权融合,根据融合结果生成评估结果。
[0014]可选地,所述确定各所述预估结果分别对应的预估权重,包括:
[0015]将各所述预估结果输入至注意力机制网络中进行权重预估,生成各所述预估结果
分别对应的权值。
[0016]可选地,所述确定各所述预估结果分别对应的预估权重,包括:
[0017]对各所述预估结果进行归一化,生成各所述预估结果分别对应的权值。
[0018]可选地,所述对所述属性信息进行数据预处理,包括:
[0019]对所述属性信息中各信息项进行缺失值填充,得到填充信息;
[0020]对所述填充信息进行数字化编码处理,得到数字信息;
[0021]对所述数字信息进行归一化处理,得到归一化信息;
[0022]将所述归一化信息作为所述预处理数据。
[0023]可选地,在所述对所述属性信息中各信息项进行缺失值填充之前,还包括:
[0024]计算所述属性信息中各信息项的数据缺失率;
[0025]判断所述数据缺失率是否超过比例阈值;
[0026]若否,执行所述对所述属性信息中各信息项进行缺失值填充;
[0027]若是,从所述属性信息中删除所述信息项。
[0028]可选地,在所述根据融合结果生成评估结果之后,还包括:
[0029]获取各所述预估模型的中间计算特征;
[0030]按照特征处理顺序对所述中间计算特征以及所述评估结果进行可视化输出处理。
[0031]可选地,所述将所述预处理数据分别输入至至少两个不同类型的预估模型中,以便各所述预估模型分别根据所述预处理数据进行点击行为预测,生成预估结果,包括:
[0032]将所述预处理数据分别输入至线性预估模型、深度预估模型以及自定义预估模型中,以便所述线性预估模型提取线性特征进行点击行为预测,所述深度预估模型提取深度特征进行点击行为预测,所述自定义预估模型提取自定义特征进行点击行为预测,分别生成线性预估结果、深度预估结果以及自定义预估结果;
[0033]则相应地,所述确定各所述预估结果分别对应的预估权重,具体为:确定所述线性预估结果、所述深度预估结果以及所述自定义预估结果分别对应的预估权重;
[0034]所述根据所述预估权重,对所述预估结果进行加权融合,根据融合结果生成评估结果,具体为:根据所述预估权重对所述线性预估结果、所述深度预估结果以及所述自定义预估结果进行加权融合,根据融合结果生成评估结果。
[0035]一种点击率预估装置,包括:
[0036]信息获取单元,用于获取可点击项的属性信息;其中,所述属性信息包括:用户信息、对象信息以及场景信息中至少一种;
[0037]信息预处理单元,用于对所述属性信息进行数据预处理,得到预处理数据;
[0038]行为预测单元,用于将所述预处理数据分别输入至至少两个不同类型的预估模型中,以便各所述预估模型分别根据所述预处理数据进行点击行为预测,生成预估结果;
[0039]权重确定单元,用于确定各所述预估结果分别对应的预估权重;
[0040]加权融合单元,用于根据所述预估权重,对所述预估结果进行加权融合,根据融合结果生成评估结果。
[0041]一种计算机设备,包括:
[0042]存储器,用于存储计算机程序;
[0043]处理器,用于执行所述计算机程序时实现如上所述点击率预估方法的步骤。
[0044]一种可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述点击率预估方法的步骤。
[0045]本专利技术实施例所提供的方法,通过至少两个不同类型的预估模型各自独立根据可点击项的属性信息进行点击率预估,融合多种模型,通过不同的方法提取特征,可以有效提升模型的表征能力和模型的泛化效果,在得到各预估模型分别输出的预估结果后,确定各预估结果分别对应的预估权重,通过权重区分了不同特征预估结果的重要性,对各模型预估结果进行加权融合,可以充分利用不同模型的预估贡献进行适当的结果融合,提升了预估结果的精准度。
[0046]相应地,本专利技术实施例还提供了与上述点击率预估方法相对应的点击率预估装置、设备和可读存储介质,具有上述技术效果,在此不再赘述。
附图说明
[0047]为了更清楚地说明本专利技术实施例或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种点击率预估方法,其特征在于,包括:获取可点击项的属性信息;其中,所述属性信息包括:用户信息、对象信息以及场景信息中至少一种;对所述属性信息进行数据预处理,得到预处理数据;将所述预处理数据分别输入至至少两个不同类型的预估模型中,以便各所述预估模型分别根据所述预处理数据进行点击行为预测,生成预估结果;确定各所述预估结果分别对应的预估权重;根据所述预估权重,对所述预估结果进行加权融合,根据融合结果生成评估结果。2.根据权利要求1所述的点击率预估方法,其特征在于,所述确定各所述预估结果分别对应的预估权重,包括:将各所述预估结果输入至注意力机制网络中进行权重预估,生成各所述预估结果分别对应的权值。3.根据权利要求1所述的点击率预估方法,其特征在于,所述确定各所述预估结果分别对应的预估权重,包括:对各所述预估结果进行归一化,生成各所述预估结果分别对应的权值。4.根据权利要求1所述的点击率预估方法,其特征在于,所述对所述属性信息进行数据预处理,包括:对所述属性信息中各信息项进行缺失值填充,得到填充信息;对所述填充信息进行数字化编码处理,得到数字信息;对所述数字信息进行归一化处理,得到归一化信息;将所述归一化信息作为所述预处理数据。5.根据权利要求4所述的点击率预估方法,其特征在于,在所述对所述属性信息中各信息项进行缺失值填充之前,还包括:计算所述属性信息中各信息项的数据缺失率;判断所述数据缺失率是否超过比例阈值;若否,执行所述对所述属性信息中各信息项进行缺失值填充;若是,从所述属性信息中删除所述信息项。6.根据权利要求1所述的点击率预估方法,其特征在于,在所述根据融合结果生成评估结果之后,还包括:获取各所述预估模型的中间计算特征;按照特征处理顺序对所述中间计算特征以及所述评估结果进行可视化输出处理。7.根据权利要求1至6任一项所述的点击率预估方法,其特征在于,所述...
【专利技术属性】
技术研发人员:杨斌,
申请(专利权)人:度小满科技北京有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。