【技术实现步骤摘要】
商品数据处理方法、系统、电子设备及存储介质
[0001]本专利技术涉及计算机
,特别涉及一种商品数据处理方法、系统、电子设备及存储介质。
技术介绍
[0002]在商品个性化推荐场景中,曝光过滤以及曝光打散等都是经常用到的多样性规则,然而规则用到的用户曝光数据往往需要耗费大量的存储空间来放置;例如要存储1000万用户7天的曝光数据,如果每个用户每天曝光100个商品,用商品id存储需要52GB空间。
[0003]为了减少存储资源浪费,在接收一定误判率的情况下,现有技术利用布隆过滤器(BloomFilter)来存储大量的用户曝光数据,前述例子如果使用布隆过滤器,在误判率为1e
‑
4的情况下,只需要15.6GB空间,把整个布隆过滤器加载到应用内存中也成为了可能,从而也收获了延时上的优势;因此布隆过滤器(是一个很好的解决方案;然而布隆过滤器并不能解决一切问题;在曝光过滤规则中,往往会带上曝光次数的约束,例如针对当天已经曝光过3次的商品进行过滤,传统的布隆过滤器是无法适用的。
[0004]因此,亟 ...
【技术保护点】
【技术特征摘要】
1.一种商品数据处理方法,其特征在于,所述方法包括:获取预设时间段内访问应用程序的历史访问用户对应的用户历史曝光数据,所述用户历史曝光数据包括用户标识及曝光商品;基于计数布隆过滤器构建存储数据库并更新所述历史访问用户对应的用户历史曝光数据至所述存储数据库,并生成每一所述历史访问用户对应的商品曝光数据,其中所述商品曝光数据包括曝光商品以及对应的曝光次数;获取所述应用程序内实时访问用户的用户标识,根据所述实时访问用户的用户标识查询所述存储数据库内所述实时访问用户对应的目标商品曝光数据;基于所述实时访问用户对应的目标商品曝光数据、待显示商品列表以及预设规则过滤所述待显示商品列表以确定展示商品列表。2.根据权利要求1所述的方法,其特征在于,所述获取预设时间段内访问应用程序的历史访问用户对应的用户历史曝光数据,所述用户历史曝光数据包括用户标识及曝光商品,包括:获取应用程序内每一历史访问用户浏览的商品对应的商品展示时长、商品内容加载率以及用户标识;若所述商品对应的展示时长超过预设阈值且所述商品的商品内容有效加载,则确定所述商品为所述曝光商品,并将所述曝光商品与所述用户标识对应记录至所述用户历史曝光数据中。3.根据权利要求1所述的方法,其特征在于,所述基于计数布隆过滤器构建存储数据库并更新所述历史访问用户对应的用户历史曝光数据至所述存储数据库,并生成每一所述历史访问用户对应的商品曝光数据,其中所述商品曝光数据包括曝光商品以及对应的曝光次数,包括:基于所述用户历史曝光数据中的用户标识,分别将对应的所述曝光商品放入计数布隆过滤器中;计算出每一所述曝光商品在所述计数布隆过滤器中对应的至少一个目标位数并使所述目标位数对应的计数器随相同曝光商品出现的次数进行自增;获取每一所述目标位数对应的计数器的计数值,并将所有所述计数器的计数值中的最小值作为所述曝光商品对应的曝光次数并存储。4.根据权利要求3所述的方法,其特征在于,所述基于计数布隆过滤器构建存储数据库,还包括:将所述计数布隆过滤器拆分为预设数量的计数布隆子过滤器;若当前采用的计数布隆子过滤器对应的存储空间不足,则调用未使用的计数布隆子过滤器来存储用户标识及历史曝光商品数据。5.根据权利要求4所述的方法,其特征在于,所述计...
【专利技术属性】
技术研发人员:朱健锋,刘兴华,肖湘,
申请(专利权)人:唯品会广州软件有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。