【技术实现步骤摘要】
点击率预估方法、装置、计算机可读存储介质和设备
本申请涉及计算机
,特别是涉及一种点击率预估方法、装置、计算机可读存储介质和计算机设备,还涉及一种分享率预估方法、装置、计算机可读存储介质和计算机设备。
技术介绍
随着互联网技术的发展,越来越多的用户通过互联网获取信息,比如,用户可以持续地从更新的图文公众号浏览文章、视频、新闻等内容,用户还可以从一些内容客户端获取内容。后台通常会结合用户的历史行为来预测该用户对候选内容的预估行为,比如预估点击率、预估分享率或是预估用户停留时长等,从而根据预测结果选取出推送至该用户的内容。用户的历史行为可以反映用户的偏好,每个用户的历史行为包括多方面的信息,传统技术中对用户在候选内容上采取的行为进行预估时,所参考的用户历史行为不够全面,导致对用户在候选内容上所采取行为的预估不够准确,存在较大的偏差。
技术实现思路
基于此,有必要针对现有技术中对用户在候选内容上所采取行为的预估不够准确的技术问题,提供一种点击率预估方法、装置、计算机可读存储介质和计算机设备,以及一种分享率预估方法、装置、计算机可读存储介质和计算机设备。一种点击率预估方法,包括:获取候选内容特征,并获取目标用户对应的用户画像特征、历史点击内容序列特征及相应的点击时间序列特征;将所述历史点击内容序列特征与所述点击时间序列特征融合,获得历史点击内容序列中各历史点击内容所对应的携带点击时间信息的融合特征;基于所述候选内容特征、各历史点击内容对应的融合特征,确定各历史 ...
【技术保护点】
1.一种点击率预估方法,包括:/n获取候选内容特征,并获取目标用户对应的用户画像特征、历史点击内容序列特征及相应的点击时间序列特征;/n将所述历史点击内容序列特征与所述点击时间序列特征融合,获得历史点击内容序列中各历史点击内容所对应的携带点击时间信息的融合特征;/n基于所述候选内容特征、各历史点击内容对应的融合特征,确定各历史点击内容对应的注意力权重系数,并依据所述注意力权重系数获得所述目标用户对应所述历史点击内容序列的聚合特征;/n根据所述候选内容特征、所述用户画像特征及所述聚合特征,提取输出特征,并根据所述输出特征确定所述目标用户对应所述候选内容的预估点击率。/n
【技术特征摘要】
1.一种点击率预估方法,包括:
获取候选内容特征,并获取目标用户对应的用户画像特征、历史点击内容序列特征及相应的点击时间序列特征;
将所述历史点击内容序列特征与所述点击时间序列特征融合,获得历史点击内容序列中各历史点击内容所对应的携带点击时间信息的融合特征;
基于所述候选内容特征、各历史点击内容对应的融合特征,确定各历史点击内容对应的注意力权重系数,并依据所述注意力权重系数获得所述目标用户对应所述历史点击内容序列的聚合特征;
根据所述候选内容特征、所述用户画像特征及所述聚合特征,提取输出特征,并根据所述输出特征确定所述目标用户对应所述候选内容的预估点击率。
2.根据权利要求1所述的方法,其特征在于,所述获取候选内容特征,并获取目标用户对应的用户画像特征、历史点击内容序列特征及相应的点击时间序列特征,包括:
获取待推送的候选内容对应的候选内容稀疏数据,并获取目标用户对应的用户画像稀疏数据、历史点击内容序列稀疏数据及相应的点击时间序列稀疏数据;
通过与各类稀疏数据对应的权重矩阵,分别将所述候选内容稀疏数据、所述用户画像稀疏数据、所述历史点击内容序列稀疏数据及所述点击时间序列稀疏数据转化为候选内容特征、用户画像特征、历史点击内容序列特征及相应的点击时间序列特征。
3.根据权利要求1所述的方法,其特征在于,所述将所述历史点击内容序列特征与所述点击时间序列特征融合,获得历史点击内容序列中各历史点击内容所对应的携带点击时间信息的融合特征,包括:
从所述历史点击内容序列特征获得各历史点击内容的历史点击内容特征;
从所述点击时间序列特征获得各历史点击内容的点击时间特征;
将各所述历史点击内容特征与相应的点击时间特征拼接后再通过全连接网络进行融合,获得各历史点击内容所对应的携带点击时间信息的融合特征。
4.根据权利要求1所述的方法,其特征在于,所述基于所述候选内容特征、各历史点击内容对应的融合特征,确定各历史点击内容对应的注意力权重系数,并依据所述注意力权重系数获得所述目标用户对应所述历史点击内容序列的聚合特征,包括:
获取所述候选内容特征与各历史点击内容对应的融合特征之间的相似度;
根据所述相似度确定各历史点击内容对应的注意力权重系数;
对各历史点击内容对应的注意力权重系数与相应的融合特征进行加权求和处理,获得所述目标用户对应所述历史点击内容序列的聚合特征。
5.根据权利要求1所述的方法,其特征在于,所述根据所述候选内容特征、所述用户画像特征及所述聚合特征,提取输出特征,包括:
提取所述候选内容特征、所述用户画像特征及所述聚合特征间的二阶组合特征;
提取所述候选内容特征、所述用户画像特征及所述聚合特征间的高阶组合特征;
将所述二阶组合特征与所述高阶组合特征拼接后获得输出特征。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
获取候选内容稀疏数据和用户画像稀疏数据;
将所述候选内容稀疏数据转化为候选内容一阶特征;
将所述用户画像稀疏数据转化为用户画像一阶特征;
所述将所述二阶组合特征与所述高阶组合特征拼接后获得输出特征,包括:
将所述候选内容一阶特征、所述用户画像一阶特征、所述二阶组合特征与所述高阶组合特征拼接后,获得输出特征。
7.根据权利要求1所述的方法,其特征在于,所述根据所述输出特征确定所述目标用户对应所述候选内容的预估点击率,包括:
将所述输出特征输入至点击率预估模型中的输出层;
通过所述点击率预估模型中的输出层,根据所述输出特征确定所述目标用户对应所述候选内容的预估点击率。
8.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取所述目标用户对应各候选内容的预估点击率;
当所述预估点击率满足预设推送条件时,向所述目标用户推送所述预估点击率对应的候选内容。
9.根据权利要求1至8任一项所述的方法,其特征在于,所述方法通过点击率预估模型执行,所述点击率预估模型的训练步骤包括:
获取训练样本集中的样本数据,所述样本数据包括候选内容稀疏数据、样本用户对应的用户画像稀疏数据、历史点击内容序列稀疏数据及相应的点击时间序列稀疏数据,还包括所述样本用户对候选内容所采取的真实点击行为所对应的真实点击率;
将所述样本数据中的候选内容稀疏数据、用户画像稀疏数据、历史点击内容序列稀疏数据及相应的点击时间序列稀疏数据输入至点击率预估模型进行训练,得到样本用户对候选内容的预测点击率;
根据所述真实点击率和所述预测点击率构建损失函数;
将所述损失函数最小化...
【专利技术属性】
技术研发人员:凌程,王亚龙,王瑞,夏锋,林乐宇,张亚霏,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。