点击率预估方法、装置、计算机可读存储介质和设备制造方法及图纸

技术编号:23604952 阅读:48 留言:0更新日期:2020-03-28 05:58
本申请涉及一种点击率预估方法、装置、计算机可读存储介质和设备,方法包括:获取候选内容特征,并获取目标用户对应的用户画像特征、历史点击内容序列特征及相应的点击时间序列特征;将历史点击内容序列特征与点击时间序列特征融合,获得历史点击内容序列中各历史点击内容所对应的携带点击时间信息的融合特征;基于候选内容特征、各历史点击内容对应的融合特征,确定各历史点击内容对应的注意力权重系数,并依据注意力权重系数获得目标用户对应历史点击内容序列的聚合特征;根据候选内容特征、用户画像特征及聚合特征,提取输出特征,并根据输出特征确定目标用户对应候选内容的预估点击率。本申请提供的方案可以极大提升预估点击率的准确性。

Click rate estimation methods, devices, computer-readable storage media and devices

【技术实现步骤摘要】
点击率预估方法、装置、计算机可读存储介质和设备
本申请涉及计算机
,特别是涉及一种点击率预估方法、装置、计算机可读存储介质和计算机设备,还涉及一种分享率预估方法、装置、计算机可读存储介质和计算机设备。
技术介绍
随着互联网技术的发展,越来越多的用户通过互联网获取信息,比如,用户可以持续地从更新的图文公众号浏览文章、视频、新闻等内容,用户还可以从一些内容客户端获取内容。后台通常会结合用户的历史行为来预测该用户对候选内容的预估行为,比如预估点击率、预估分享率或是预估用户停留时长等,从而根据预测结果选取出推送至该用户的内容。用户的历史行为可以反映用户的偏好,每个用户的历史行为包括多方面的信息,传统技术中对用户在候选内容上采取的行为进行预估时,所参考的用户历史行为不够全面,导致对用户在候选内容上所采取行为的预估不够准确,存在较大的偏差。
技术实现思路
基于此,有必要针对现有技术中对用户在候选内容上所采取行为的预估不够准确的技术问题,提供一种点击率预估方法、装置、计算机可读存储介质和计算机设备,以及一种分享率预估方法、装置、计算机可读存储介质和计算机设备。一种点击率预估方法,包括:获取候选内容特征,并获取目标用户对应的用户画像特征、历史点击内容序列特征及相应的点击时间序列特征;将所述历史点击内容序列特征与所述点击时间序列特征融合,获得历史点击内容序列中各历史点击内容所对应的携带点击时间信息的融合特征;基于所述候选内容特征、各历史点击内容对应的融合特征,确定各历史点击内容对应的注意力权重系数,并依据所述注意力权重系数获得所述目标用户对应所述历史点击内容序列的聚合特征;根据所述候选内容特征、所述用户画像特征及所述聚合特征,提取输出特征,并根据所述输出特征确定所述目标用户对应所述候选内容的预估点击率。一种点击率预估装置,所述装置包括:获取模块,用于获取候选内容特征,并获取目标用户对应的用户画像特征、历史点击内容序列特征及相应的点击时间序列特征;融合模块,用于将所述历史点击内容序列特征与所述点击时间序列特征融合,获得历史点击内容序列中各历史点击内容所对应的携带点击时间信息的融合特征;聚合模块,用于基于所述候选内容特征、各历史点击内容对应的融合特征,确定各历史点击内容对应的注意力权重系数,并依据所述注意力权重系数获得所述目标用户对应所述历史点击内容序列的聚合特征;特征组合模块,用于根据所述候选内容特征、所述用户画像特征及所述聚合特征,提取输出特征;确定模块,用于根据所述输出特征确定所述目标用户对应所述候选内容的预估点击率。一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行上述点击率预估方法的步骤。一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行上述点击率预估方法的步骤。上述点击率预估方法、装置、计算机可读存储介质及计算机设备,在预估目标用户对候选内容的点击率时,将目标用户对应的历史点击内容序列特征与相应的点击时间序列特征融合,获得携带点击时间信息的融合特征,不仅考虑目标用户的历史点击行为,还充分考虑了用户历史点击行为的时间信息,从而更为准确地捕获了目标用户当前的兴趣;接着,基于该携带点击时间信息的融合特征、候选内容特征为目标用户的历史点击内容分配相应的注意力权重系数,并依据该注意力权重系数获得目标用户对应历史点击内容序列的聚合特征,该聚合特征可以反映目标用户当前兴趣的注意力分配情况,继而根据该聚合特征、候选内容特征、用户画像特征提取的输出特征,能够更为准确地表达目标用户的当前兴趣,使得根据输出特征确定的对应候选内容的预估点击率更为准确。一种分享率预估方法,包括:获取待推送的候选内容对应的候选内容稀疏数据,并获取目标用户对应的用户画像稀疏数据、历史分享内容序列稀疏数据及相应的分享时间序列稀疏数据;分别将所述候选内容稀疏数据、所述用户画像稀疏数据、所述历史分享内容序列稀疏数据及所述分享时间序列稀疏数据转化为候选内容特征、用户画像特征、历史分享内容序列特征及相应的分享时间序列特征;将所述历史分享内容序列特征与所述分享时间序列特征融合,获得历史分享内容序列中各历史分享内容所对应的携带分享时间信息的融合特征;基于所述候选内容特征、各历史分享内容对应的融合特征,确定各历史分享内容对应的注意力权重系数,并依据所述注意力权重系数获得所述目标用户对应所述历史分享内容序列的聚合特征;根据所述候选内容特征、所述用户画像特征及所述聚合特征,提取输出特征,并根据所述输出特征确定所述目标用户对应所述候选内容的预估分享率;获取所述目标用户对应各候选内容的预估分享率;当所述预估分享率满足预设推送条件时,向所述目标用户推送所述预估分享率对应的候选内容。一种分享率预估装置,包括:获取模块,用于获取待推送的候选内容对应的候选内容稀疏数据,并获取目标用户对应的用户画像稀疏数据、历史分享内容序列稀疏数据及相应的分享时间序列稀疏数据;分别将所述候选内容稀疏数据、所述用户画像稀疏数据、所述历史分享内容序列稀疏数据及所述分享时间序列稀疏数据转化为候选内容特征、用户画像特征、历史分享内容序列特征及相应的分享时间序列特征;融合模块,用于将所述历史分享内容序列特征与所述分享时间序列特征融合,获得历史分享内容序列中各历史分享内容所对应的携带分享时间信息的融合特征;聚合模块,用于基于所述候选内容特征、各历史分享内容对应的融合特征,确定各历史分享内容对应的注意力权重系数,并依据所述注意力权重系数获得所述目标用户对应所述历史分享内容序列的聚合特征;特征组合模块,用于根据所述候选内容特征、所述用户画像特征及所述聚合特征,提取输出特征;确定模块,用于根据所述输出特征确定所述目标用户对应所述候选内容的预估分享率;推送模块,用于获取所述目标用户对应各候选内容的预估分享率;当所述预估分享率满足预设推送条件时,向所述目标用户推送所述预估分享率对应的候选内容。一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行上述分享率预估方法的步骤。一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行上述分享率预估方法的步骤。上述分享率预估方法、装置、计算机可读存储介质和计算机设备,在预估目标用户对候选内容的分享率时,首先获取待推送的候选内容对应的候选内容稀疏数据,并获取目标用户对应的用户画像稀疏数据、历史分享内容序列稀疏数据及相应的分享时间序列稀疏数据,依次转化为候选内容特征、用户画像特征、历史分享内容序列特征及相应的分享时间序列特征后,将目标用户对应的历史分享内容序列特征与相应的分享时间序列特征融合,获得携带分享时间信息的融合特征,不仅考虑目标用户的历史分享行为本文档来自技高网...

【技术保护点】
1.一种点击率预估方法,包括:/n获取候选内容特征,并获取目标用户对应的用户画像特征、历史点击内容序列特征及相应的点击时间序列特征;/n将所述历史点击内容序列特征与所述点击时间序列特征融合,获得历史点击内容序列中各历史点击内容所对应的携带点击时间信息的融合特征;/n基于所述候选内容特征、各历史点击内容对应的融合特征,确定各历史点击内容对应的注意力权重系数,并依据所述注意力权重系数获得所述目标用户对应所述历史点击内容序列的聚合特征;/n根据所述候选内容特征、所述用户画像特征及所述聚合特征,提取输出特征,并根据所述输出特征确定所述目标用户对应所述候选内容的预估点击率。/n

【技术特征摘要】
1.一种点击率预估方法,包括:
获取候选内容特征,并获取目标用户对应的用户画像特征、历史点击内容序列特征及相应的点击时间序列特征;
将所述历史点击内容序列特征与所述点击时间序列特征融合,获得历史点击内容序列中各历史点击内容所对应的携带点击时间信息的融合特征;
基于所述候选内容特征、各历史点击内容对应的融合特征,确定各历史点击内容对应的注意力权重系数,并依据所述注意力权重系数获得所述目标用户对应所述历史点击内容序列的聚合特征;
根据所述候选内容特征、所述用户画像特征及所述聚合特征,提取输出特征,并根据所述输出特征确定所述目标用户对应所述候选内容的预估点击率。


2.根据权利要求1所述的方法,其特征在于,所述获取候选内容特征,并获取目标用户对应的用户画像特征、历史点击内容序列特征及相应的点击时间序列特征,包括:
获取待推送的候选内容对应的候选内容稀疏数据,并获取目标用户对应的用户画像稀疏数据、历史点击内容序列稀疏数据及相应的点击时间序列稀疏数据;
通过与各类稀疏数据对应的权重矩阵,分别将所述候选内容稀疏数据、所述用户画像稀疏数据、所述历史点击内容序列稀疏数据及所述点击时间序列稀疏数据转化为候选内容特征、用户画像特征、历史点击内容序列特征及相应的点击时间序列特征。


3.根据权利要求1所述的方法,其特征在于,所述将所述历史点击内容序列特征与所述点击时间序列特征融合,获得历史点击内容序列中各历史点击内容所对应的携带点击时间信息的融合特征,包括:
从所述历史点击内容序列特征获得各历史点击内容的历史点击内容特征;
从所述点击时间序列特征获得各历史点击内容的点击时间特征;
将各所述历史点击内容特征与相应的点击时间特征拼接后再通过全连接网络进行融合,获得各历史点击内容所对应的携带点击时间信息的融合特征。


4.根据权利要求1所述的方法,其特征在于,所述基于所述候选内容特征、各历史点击内容对应的融合特征,确定各历史点击内容对应的注意力权重系数,并依据所述注意力权重系数获得所述目标用户对应所述历史点击内容序列的聚合特征,包括:
获取所述候选内容特征与各历史点击内容对应的融合特征之间的相似度;
根据所述相似度确定各历史点击内容对应的注意力权重系数;
对各历史点击内容对应的注意力权重系数与相应的融合特征进行加权求和处理,获得所述目标用户对应所述历史点击内容序列的聚合特征。


5.根据权利要求1所述的方法,其特征在于,所述根据所述候选内容特征、所述用户画像特征及所述聚合特征,提取输出特征,包括:
提取所述候选内容特征、所述用户画像特征及所述聚合特征间的二阶组合特征;
提取所述候选内容特征、所述用户画像特征及所述聚合特征间的高阶组合特征;
将所述二阶组合特征与所述高阶组合特征拼接后获得输出特征。


6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
获取候选内容稀疏数据和用户画像稀疏数据;
将所述候选内容稀疏数据转化为候选内容一阶特征;
将所述用户画像稀疏数据转化为用户画像一阶特征;
所述将所述二阶组合特征与所述高阶组合特征拼接后获得输出特征,包括:
将所述候选内容一阶特征、所述用户画像一阶特征、所述二阶组合特征与所述高阶组合特征拼接后,获得输出特征。


7.根据权利要求1所述的方法,其特征在于,所述根据所述输出特征确定所述目标用户对应所述候选内容的预估点击率,包括:
将所述输出特征输入至点击率预估模型中的输出层;
通过所述点击率预估模型中的输出层,根据所述输出特征确定所述目标用户对应所述候选内容的预估点击率。


8.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取所述目标用户对应各候选内容的预估点击率;
当所述预估点击率满足预设推送条件时,向所述目标用户推送所述预估点击率对应的候选内容。


9.根据权利要求1至8任一项所述的方法,其特征在于,所述方法通过点击率预估模型执行,所述点击率预估模型的训练步骤包括:
获取训练样本集中的样本数据,所述样本数据包括候选内容稀疏数据、样本用户对应的用户画像稀疏数据、历史点击内容序列稀疏数据及相应的点击时间序列稀疏数据,还包括所述样本用户对候选内容所采取的真实点击行为所对应的真实点击率;
将所述样本数据中的候选内容稀疏数据、用户画像稀疏数据、历史点击内容序列稀疏数据及相应的点击时间序列稀疏数据输入至点击率预估模型进行训练,得到样本用户对候选内容的预测点击率;
根据所述真实点击率和所述预测点击率构建损失函数;
将所述损失函数最小化...

【专利技术属性】
技术研发人员:凌程王亚龙王瑞夏锋林乐宇张亚霏
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1