【技术实现步骤摘要】
推荐系统离线推理方法、装置、计算机设备及存储介质
[0001]本专利技术涉及计算机,更具体地说是指推荐系统离线推理方法、装置、计算机设备及存储介质。
技术介绍
[0002]推荐系统是指用于预测不同广告对于用户的推荐的概率值,推荐系统的推理在架构上可以分为离线推理和在线推理,由于在线推理的价格昂贵,所以离线推理仍然被广泛运用。离线推理的基本思路是先训练一个模型,然后把每个用户与每一个广告的组合对应的概率值计算出来,然后将用户和广告的组合存放到redis,每次广告请求来了就调用对应用户和对应广告的概率值,乘以每个广告主愿意为该广告出价的系数,然后选出对平台价值最高的广告对用户投放。
[0003]由于离线推理要计算的数据量是用户数乘以广告数,在大数据的情况下,用户数可以达到千万到亿级,广告数可以达到千或万级别,所以最终要计算的数据量是千亿级别,需要大量的时间和计算资源来算出这些概率值,redis也无法存储下如此规模的数据,这两点缺陷使得海量数据下的离线推理成为不可能。
[0004]因此,有必要设计一种新的方法,实现 ...
【技术保护点】
【技术特征摘要】
1.推荐系统离线推理方法,其特征在于,包括:获取带有广告特征数据以及用户特征数据的表格,以得到特征数据表;对所述特征数据表内用户特征数据的特征值进行拼接处理,以得到处理结果;对所述处理结果与所述特征数据表内广告特征数据进行拼接,以得到待预测数据;利用推荐系统对所述待预测数据进行预测,以得到预测值;将所述处理结果与所述预测值组合形成推理表;当有新广告请求时,根据请求从所述处理结果以及推理表中确定所要推送的广告。2.根据权利要求1所述的推荐系统离线推理方法,其特征在于,所述对所述特征数据表内用户特征数据的特征值进行拼接处理,以得到处理结果,包括:对所述特征数据表内用户特征数据的特征值采用字符拼接和逗号隔开的方式进行拼接处理,以得到拼接结果;剔除拼接结果中重复的内容,以得到处理结果;保存所述处理结果。3.根据权利要求2所述的推荐系统离线推理方法,其特征在于,所述将所述处理结果与所述预测值组合形成推理表,包括:将所述处理结果的标识ID值与所述预测值组合形成推理表。4.根据权利要求1所述的推荐系统离线推理方法,其特征在于,所述当有新广告请求时,根据请求从所述处理结果以及推理表中确定所要推送的广告,包括:当有新广告请求时,根据请求从所述处理结果确定对应的标识ID值;根据所述标识ID值从推理表中确定对应的概率值;根据所述概率值与出价系数相乘,以得到乘积;确定所述乘积最高的广告为所要推送的广告。5.根据权利要求4所述的推荐系统离线推理方法,其特征在于,所述当有新广告请求时,根据请求从所述处理结果确定对应的标识ID值,包括:当有广告请...
【专利技术属性】
技术研发人员:陈光炎,张晋铭,
申请(专利权)人:吉浦斯信息咨询深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。