推荐视频去重的方法技术

技术编号:39404912 阅读:7 留言:0更新日期:2023-11-19 15:57
本申请公开一种推荐视频去重的方法,包括:服务器接收到第一用户的视频推荐请求后,根据第一用户的用户画像,生成预推荐视频信息集合;根据当前时刻前预设时间段内已向第一用户推荐的视频信息,生成已推荐视频信息集合,已向第一用户推荐的视频信息存储在第一数据库中;根据针对第一用户已曝光的视频信息,生成已曝光视频信息集合,已曝光的视频信息存储在第二数据库中;在预推荐视频信息集合中过滤掉与已推荐视频信息集合和已曝光的视频信息集合中相同的视频信息,生成推荐视频信息集合;以及在推荐视频信息集合中的视频并发送至第一用户的终端设备上

【技术实现步骤摘要】
推荐视频去重的方法、装置及电子设备


[0001]本申请涉及互联网
,具体涉及视频推荐技术,尤其涉及一种推荐视频去重的方法

装置

电子设备及计算机可读存储介质


技术介绍

[0002]随着在线视频平台的普及和用户观看视频的增加,用户通过在视频平台上观看视频,丰富了人们的日常生活

视频平台在向用户推荐视频前,需要对推荐视频进行去重处理,去重处理旨在推荐视频中剔除用户看过的视频,优化用户使用体验

[0003]已有的去重方式大多主要基于客户端上报的曝光日志,系统中的去重过滤器将推荐视频中与曝光日志中相同的数据进行剔除,达到去重的目的

比如,在名称为“去重方法

装置

设备

介质及产品”,申请号为“202211468917.5”的专利文献中,将去重请求中的待去重数据输入到去重过滤器中,分别得到的
N

Hash
函数对应的哈希值,根据该哈希值在对应一维数组中查询对应哈希值位的值,可确定该请求中的待去重数据是否在去重过滤器对应的去重周期内重复出现

但是,客户端上报曝光日志时,因为各种原因经常出现延迟送达的问题,导致去重过滤器无法得到完整的曝光日志,该问题尚未得到妥善的解决,用户重复刷到相同的视频的情况仍然存在,降低用户的满意度


技术实现思路

[0004]有鉴于此,本申请实施例提供一种推荐视频去重的方法

装置

电子设备及计算机可读存储介质,用于解决至少一种技术问题

[0005]第一方面,本申请实施例提供一种推荐视频去重的方法,包括:服务器接收到第一用户的视频推荐请求后,根据第一用户的用户画像,生成预推荐视频信息集合;根据当前时刻前预设时间段内已向第一用户推荐的视频信息,生成已推荐视频信息集合,所述已向第一用户推荐的视频信息存储在第一数据库中,所述已向第一用户推荐的视频信息是服务端已发送至第一用户终端设备上的视频信息;根据针对所述第一用户已曝光的视频信息,生成已曝光视频信息集合,所述已曝光的视频信息存储在第二数据库中;在所述预推荐视频信息集合中过滤掉与所述已推荐视频信息集合和所述已曝光的视频信息集合中相同的视频信息,生成推荐视频信息集合;以及在所述推荐视频信息集合中筛选出预设数量的视频并发送至所述第一用户的终端设备上以及若第一用户的下一次与本次视频推荐请求之间的时间间隔小于预定阈值,则在第一数据库中筛选出一个或多个未曝光视频信息

[0006]根据本申请实施例的方法,所述若第一用户的下一次与本次视频推荐请求之间的时间间隔小于预定阈值,则在第一数据库中筛选出一个或多个未曝光视频信息包括:将所述预设数量的视频作为已推荐的视频信息存储至第一数据库中;若第一用户的下一次视频推荐请求与本次视频推荐请求之间的时间间隔小于预定阈值,则将所述已推荐的视频信息按照推荐的先后顺序倒序排列;将排序后的已推荐的视频信息中前
K
个视频标记为未曝光视频,并从所述第一数据库中移除,以在下一次视频推荐中对所述标记为未曝光视频予以
放行

[0007]根据本申请实施例的方法,所述
K
数值的大小与所述预定阈值成反比,所述预定阈值越大,所述
K
的取值越小

[0008]根据本申请实施例的方法,将所述预设数量的视频作为已推荐的视频信息存储至第一数据库中包括:所述第一数据库利用滑窗选择距离当前时刻前
N
秒内的已推荐视频信息,当第一数据库中的已推荐视频信息保存时间超过
N
秒时,已推荐视频信息失效,其中
10s≤N≤30s。
[0009]根据本申请实施例的方法,当所述第二数据库中包括与所述
K
个视频相同的视频信息,则将相同的视频取消标记,保留在第一数据库中

[0010]根据本申请实施例的方法,所述第二数据库接收终端设备自动上传的曝光日志,所述第二数据库包括布隆过滤器,所述布隆过滤器中存储用户1‑3个月的曝光日志,所述曝光日志包括已展示的视频信息

[0011]根据本申请实施例的方法,所述第一数据库采用键值存储方式,或者,所述第一数据库包括以下至少一者:
Redis
数据库
、hbase
数据库
、cassandra
数据库

[0012]第二方面,本申请实施例提供一种推荐视频去重的装置,包括:第一生成模块,用于服务器接收到第一用户的视频推荐请求后,根据第一用户的用户画像,生成预推荐视频信息集合;第二生成模块,用于根据所述视频推荐请求之前的预设时间段内已向第一用户推荐的视频信息,生成已推荐视频信息集合,所述已向第一用户推荐的视频信息存储在第一数据库中,所述已向第一用户推荐的视频信息是服务端已发送至第一用户终端设备上的视频信息;第三生成模块,用于根据针对所述第一用户已曝光的视频信息,生成已曝光视频信息集合,所述已曝光的视频信息存储在第二数据库中;过滤模块,用于在所述预推荐视频信息集合中过滤掉与所述已推荐视频信息集合和所述已曝光的视频信息集合中相同的视频信息,生成推荐视频信息集合;第一筛选模块,用于在所述推荐视频信息集合中筛选出预设数量的视频并发送至所述第一用户的终端设备上;以及第二筛选模块,用于若第一用户的下一次与本次视频推荐请求之间的时间间隔小于预定阈值,则在第一数据库中筛选出一个或多个未曝光视频信息

[0013]第三方面,本申请的实施例提供一种电子设备,所述电子设备包括:处理器以及存储有计算机程序指令的存储器;所述电子设备执行所述计算机程序指令时实现如上所述的方法

[0014]第四方面,本申请的实施例一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如上所述的方法

[0015]本申请在服务器上设置有第一数据库和第二数据库,将已推荐视频信息集合存储在第一数据库中,将已曝光视频信息存储在第二数据库中

在进行去重操作时,同时利用已推荐视频信息和已曝光视频信息对预推荐视频进行去重处理,弥补了因用户终端设备上传延迟导致已曝光视频信息不完整的问题,避免用户重复看到相同的视频,达到精准去重的目的,提高用户使用满意度

附图说明
[0016]为了更清楚地说明本申请实施例的技术方案,以下对本申请实施例中的附图作简
单介绍

[0017]图1是本申请实施例的系统架构的示意图

[0018]图2是本申请实施例的推荐视频去重方法的流程框图

[0019]图3是本申请实施例的预标记未曝光视频方法的流程框图
...

【技术保护点】

【技术特征摘要】
1.
一种推荐视频去重的方法,其特征在于,包括:服务器接收到第一用户的视频推荐请求后,根据第一用户的用户画像,生成预推荐视频信息集合;根据当前时刻前预设时间段内已向第一用户推荐的视频信息,生成已推荐视频信息集合,所述已向第一用户推荐的视频信息存储在第一数据库中,所述已向第一用户推荐的视频信息是服务端已发送至第一用户终端设备上的视频信息;根据针对所述第一用户已曝光的视频信息,生成已曝光视频信息集合,所述已曝光的视频信息存储在第二数据库中;在所述预推荐视频信息集合中过滤掉与所述已推荐视频信息集合和所述已曝光的视频信息集合中相同的视频信息,生成推荐视频信息集合;在所述推荐视频信息集合中筛选出预设数量的视频并发送至所述第一用户的终端设备上;以及若第一用户的下一次与本次视频推荐请求之间的时间间隔小于预定阈值,则在第一数据库中筛选出一个或多个未曝光视频信息
。2.
根据权利要求1所述的方法,其特征在于,所述若第一用户的下一次与本次视频推荐请求之间的时间间隔小于预定阈值,则在第一数据库中筛选出一个或多个未曝光视频信息包括:将所述预设数量的视频作为已推荐的视频信息存储至第一数据库中;若第一用户的下一次视频推荐请求与本次视频推荐请求之间的时间间隔小于预定阈值,则将所述已推荐的视频信息按照推荐的先后顺序倒序排列;将排序后的已推荐的视频信息中前
K
个视频标记为未曝光视频,并从所述第一数据库中移除,以在下一次视频推荐中对所述标记为未曝光视频予以放行
。3.
根据权利要求2所述的方法,其特征在于,其中,所述
K
数值的大小与所述预定阈值成反比,所述预定阈值越大,所述
K
的取值越小
。4.
根据权利要求2所述的方法,其特征在于,将所述预设数量的视频作为已推荐的视频信息存储至第一数据库中包括:所述第一数据库利用滑窗选择距离当前时刻前
N
秒内的已推荐视频信息,当第一数据库中的已推荐视频信息保存时间超过
N
秒时,已推荐视频信息失效,其中
10s≤N≤30s。5.
根据权利要求2所述的方法,其特征在于,进一步包括:当所述第二...

【专利技术属性】
技术研发人员:潘世铭张远章动
申请(专利权)人:北京小糖科技有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1