【技术实现步骤摘要】
一种推送内容推荐方法及装置
本专利技术涉及终端推送
,更具体地,涉及一种推送内容推荐方法及装置。
技术介绍
现有技术将离线模型训练与在线服务独立,每小时批量获取用户行为日志,导入到持久化储存中;完成一个小时的数据收集任务后,启动离线的模型训练任务,并导出完整的服务模型,这些模型需要通过内网发送到线上的多台服务机器,需要消耗大量的网络带宽和时间。另外,现有的日志收集服务采用离线批量处理模型,由于部分用户的行为日志会较长时间滞后于曝光,为了保证日志收集的完整性,需要等待较长的时间才能开始收集前一段时间的日志,极大影响日志收集的时效性。完成日志收集后,模型需要一次性训练较长时段内的全部日志,日志量达到千万级甚至亿级,对模型的训练效率带来极大的挑战,也需要耗费大量的时间。线上服务需要多台机器保证服务稳定和分担压力,因此需要将训练好的服务模型传输到所有的服务机器;大规模离散特征的模型体积巨大,高达几个G甚至几十个G,通过网络传输需要消耗大量的网络带宽和时间,影响更新稳定性和时效性。 ...
【技术保护点】
1.一种推送内容推荐方法,其特征在于,用于服务器,所述方法包括:/n根据实时获取的用户的历史行为信息和上下文信息确定用户当前感兴趣的候选集;/n接收客户端实时采集并发送的用户对上一次推荐的推送内容的行为日志;/n获取上一次推荐的推送内容的曝光日志;/n将所述行为日志和所述曝光日志拼接,并结合用户相关信息输出实时模型训练所需的全部特征;/n根据所述全部特征和实时模型进行mini-batch模型训练,以确定所述实时模型的最新模型参数,并根据所述最新模型参数更新所述实时模型;/n当接收到候选集排序请求时,获取当前的实时模型对所述候选集进行排序,得到排序结果;/n根据所述排序结果选 ...
【技术特征摘要】
1.一种推送内容推荐方法,其特征在于,用于服务器,所述方法包括:
根据实时获取的用户的历史行为信息和上下文信息确定用户当前感兴趣的候选集;
接收客户端实时采集并发送的用户对上一次推荐的推送内容的行为日志;
获取上一次推荐的推送内容的曝光日志;
将所述行为日志和所述曝光日志拼接,并结合用户相关信息输出实时模型训练所需的全部特征;
根据所述全部特征和实时模型进行mini-batch模型训练,以确定所述实时模型的最新模型参数,并根据所述最新模型参数更新所述实时模型;
当接收到候选集排序请求时,获取当前的实时模型对所述候选集进行排序,得到排序结果;
根据所述排序结果选取目标推送内容,并推送所述目标推送内容至所述客户端。
2.根据权利要求1所述的方法,其特征在于,所述用户相关信息包括以下至少一项:用户画像信息、内容画像信息和上下文信息。
3.根据权利要求1所述的方法,其特征在于,所述行为日志采用拉链式回传,所述行为日志包括用户对所述推送内容的点击、播放、评论、转发、点赞中的任一项。
4.根据权利要求1所述的方法,其特征在于,根据所述排序结果选取目标推送内容,包括:
根据排序结果选取排名靠前的预设数量的候选集作为所述目标推送内容。
5.一种推送内容推荐装置,其特征在于,用于服务器,所述装置包括:
推荐模块,用于根据实时获取的用户的历史行为信息和上下文信息确定用户当前感兴趣的候选集;
日志收集模块,用于接收客户端实时采集并发送的用户对上一次推荐的推送内容的行为日志;
获取模块,用于获取上一次推荐的推送内容的曝光日志;
特征输出模块,用于将所述行为日志和所述曝光日志拼接,并结合用户相关信息输出实时模型训练所需的全部特征;
模型训练模块,用于根据所述全部特征和实时模型进行mini-batch模型训练,以确定所述实时模型的最新模型参数,并根据所述最新模型参数更新所述实时模型;
排序模块,用于当接收到候选集排序请求时,获取当前的实时模型对所述候选集进行排序,得到排序结果;
选取模块,用于根据所述排序结果选取目标推送内容,并推送所述目标推送内容至所述客户端。
6.根据权利要求5所述的装置,其特征在于,所述用户相关信息包括以下至少一项:用户画像信息、内容画像信...
【专利技术属性】
技术研发人员:张德恩,李小松,朱明亮,熊永平,
申请(专利权)人:北京小川科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。