【技术实现步骤摘要】
一种推荐方法及在线预测模型的发布方法和装置
本申请实施例涉及数据推荐技术,尤其涉及一种推荐方法及在线预测模型的发布方法和装置。
技术介绍
随着互联网技术的飞速发展,爆炸式增长的信息导致用户想要获取感兴趣的有效内容越来越困难。为了帮助用户快速地获取感兴趣的有效内容,个性化推荐系统应运而生,并在新闻、短视频和音乐等产品中发挥着越来越重要的作用。在相关技术中,个性化推荐系统一般使用高性能分布式存储系统(如Redis(RemoteDictionaryServer,远程字典服务))来存储用户和物料的原始信息,在进行推荐时,个性化推荐系统按需从Redis中获取原始特征,并对原始特征进行预处理后输入给数据模型进行预测打分,然后根据打分结果进行推荐。然而,这样的推荐系统会存在如下问题:(1)对于具有海量用户和物料的推荐场景,用户和物料的原始特征消耗大量的高性能分布式存储空间,成本高昂。(2)随着原始特征越来越多,在高QPS(Queries-per-second,每秒查询率)的场景下,推荐系统访问Redis的耗时增加,且多网络I/O(Input/Output,输入/输出)给带宽带来巨大压力。(3)在进行预测打分时,数据模型复杂的计算量使得耗时较高。
技术实现思路
本申请提供一种推荐方法及在线预测模型的发布方法和装置,以解决现有的在线预测模型中原始特征数据量大导致的耗费存储空间、访问耗时以及计算量大等问题。第一方面,本申请实施例提供了一种推荐方法,所述方法包括: ...
【技术保护点】
1.一种推荐方法,其特征在于,所述方法包括:/n确定输入至已训练的在线预测模型中的目标用户标识以及多个候选条目标识,其中,所述在线预测模型中存储有多个样本用户标识对应的中间用户特征向量,以及多个样本条目标识对应的中间条目特征向量;/n在所述在线预测模型的多个样本用户标识中查找所述目标用户标识,获得所述目标用户标识对应的中间用户特征向量;/n在所述在线预测模型的多个样本条目标识中查找各候选条目标识,获得各候选条目标识对应的中间条目特征向量;/n在所述在线预测模型中,对所述目标用户标识对应的中间用户特征向量以及各候选条目标识对应的中间条目特征向量进行预测处理,输出各候选条目标识与所述目标用户标识的匹配度;/n根据各候选条目标识与所述目标用户标识的匹配度,从所述候选条目标识中确定用于推荐至所述目标用户标识的目标条目标识。/n
【技术特征摘要】
1.一种推荐方法,其特征在于,所述方法包括:
确定输入至已训练的在线预测模型中的目标用户标识以及多个候选条目标识,其中,所述在线预测模型中存储有多个样本用户标识对应的中间用户特征向量,以及多个样本条目标识对应的中间条目特征向量;
在所述在线预测模型的多个样本用户标识中查找所述目标用户标识,获得所述目标用户标识对应的中间用户特征向量;
在所述在线预测模型的多个样本条目标识中查找各候选条目标识,获得各候选条目标识对应的中间条目特征向量;
在所述在线预测模型中,对所述目标用户标识对应的中间用户特征向量以及各候选条目标识对应的中间条目特征向量进行预测处理,输出各候选条目标识与所述目标用户标识的匹配度;
根据各候选条目标识与所述目标用户标识的匹配度,从所述候选条目标识中确定用于推荐至所述目标用户标识的目标条目标识。
2.根据权利要求1所述的推荐方法,其特征在于,在所述在所述在线预测模型中,对所述目标用户标识对应的中间用户特征向量以及各候选条目标识对应的中间条目特征向量进行预测处理,输出各候选条目标识与所述目标用户标识的匹配度之前,所述方法还包括:
若在所述在线预测模型的多个样本用户标识中查找不到所述目标用户标识,则将所述目标用户标识对应的中间用户特征向量设置为第一预设向量;
或者,
若在所述在线预测模型的多个样本条目标识中查找不到所述候选条目标识,则将该候选条目标识对应的中间条目特征向量设置为第二预设向量。
3.一种在线预测模型的发布方法,其特征在于,所述方法包括:
获取在线预测模型的模型参数;
获取预设的离线预测模型针对各样本用户标识生成的中间用户特征向量,以及针对各样本条目标识生成的中间条目特征向量;
将各样本用户标识对应的中间用户特征向量、各样本条目标识对应的中间条目特征向量与所述模型参数存储至预设数据库中;
基于所述预设数据库对所述在线预测模型进行发布。
4.根据权利要求3所述的在线预测模型的发布方法,其特征在于,所述获取在线预测模型的模型参数包括:
训练预测模型;
对所述预测模型按照预设裁剪规则进行裁剪,获得在线预测模型的模型参数以及离线预测模型的模型参数。
5.根据权利要求4所述的在线预测模型的发布方法,其特征在于,所述训练预测模型包括:
将预先建立的标识数据库、用户属性数据库以及条目属性数据库加载进内存,其中,所述标识数据库用于存储多个样本用户标识及各样本用户标识发生交互的样本条目标识;所述用户属性数据库用于存储各样本用户标识对应的用户属性信息;所述条目属性数据库用于存储各样本条目标识对应的条目属性信息;
根据所述标识数据库中记录的样本用户标识及样本条目标识,分别从所述用户属性数据库与所述条目属性数据库中查找出...
【专利技术属性】
技术研发人员:杨晚鹏,
申请(专利权)人:有半岛北京信息科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。