一种推荐方法及在线预测模型的发布方法和装置制造方法及图纸

技术编号:26171384 阅读:21 留言:0更新日期:2020-10-31 13:43
本申请公开了一种推荐方法及在线预测模型的发布方法和装置,其中该推荐方法包括:确定输入至在线预测模型中的目标用户标识以及多个候选条目标识;在在线预测模型的多个样本用户标识中查找目标用户标识以及各候选条目标识,获得目标用户标识对应的中间用户特征向量,以及各候选条目标识对应的中间条目特征向量;对目标用户标识对应的中间用户特征向量以及各候选条目标识对应的中间条目特征向量进行预测处理,输出各候选条目标识与目标用户标识的匹配度;根据各匹配度,从候选条目标识中确定用于推荐至目标用户标识的目标条目标识,预测过程省略了获取原始特征并对原始特征进行预处理的过程,有效地降低了在线预测模型的计算量和耗时。

A recommendation method and online prediction model publishing method and device

【技术实现步骤摘要】
一种推荐方法及在线预测模型的发布方法和装置
本申请实施例涉及数据推荐技术,尤其涉及一种推荐方法及在线预测模型的发布方法和装置。
技术介绍
随着互联网技术的飞速发展,爆炸式增长的信息导致用户想要获取感兴趣的有效内容越来越困难。为了帮助用户快速地获取感兴趣的有效内容,个性化推荐系统应运而生,并在新闻、短视频和音乐等产品中发挥着越来越重要的作用。在相关技术中,个性化推荐系统一般使用高性能分布式存储系统(如Redis(RemoteDictionaryServer,远程字典服务))来存储用户和物料的原始信息,在进行推荐时,个性化推荐系统按需从Redis中获取原始特征,并对原始特征进行预处理后输入给数据模型进行预测打分,然后根据打分结果进行推荐。然而,这样的推荐系统会存在如下问题:(1)对于具有海量用户和物料的推荐场景,用户和物料的原始特征消耗大量的高性能分布式存储空间,成本高昂。(2)随着原始特征越来越多,在高QPS(Queries-per-second,每秒查询率)的场景下,推荐系统访问Redis的耗时增加,且多网络I/O(Input/Output,输入/输出)给带宽带来巨大压力。(3)在进行预测打分时,数据模型复杂的计算量使得耗时较高。
技术实现思路
本申请提供一种推荐方法及在线预测模型的发布方法和装置,以解决现有的在线预测模型中原始特征数据量大导致的耗费存储空间、访问耗时以及计算量大等问题。第一方面,本申请实施例提供了一种推荐方法,所述方法包括:确定输入至已训练的在线预测模型中的目标用户标识以及多个候选条目标识,其中,所述在线预测模型中存储有多个样本用户标识对应的中间用户特征向量,以及多个样本条目标识对应的中间条目特征向量;在所述在线预测模型的多个样本用户标识中查找所述目标用户标识,获得所述目标用户标识对应的中间用户特征向量;在所述在线预测模型的多个样本条目标识中查找各候选条目标识,获得各候选条目标识对应的中间条目特征向量;在所述在线预测模型中,对所述目标用户标识对应的中间用户特征向量以及各候选条目标识对应的中间条目特征向量进行预测处理,输出各候选条目标识与所述目标用户标识的匹配度;根据各候选条目标识与所述目标用户标识的匹配度,从所述候选条目标识中确定用于推荐至所述目标用户标识的目标条目标识。第二方面,本申请实施例提供了一种在线预测模型的发布方法,所述方法包括:获取在线预测模型的模型参数;获取预设的离线预测模型针对各样本用户标识生成的中间用户特征向量,以及针对各样本条目标识生成的中间条目特征向量;将各样本用户标识对应的中间用户特征向量、各样本条目标识对应的中间条目特征向量与所述模型参数存储至预设数据库中;基于所述预设数据库对所述在线预测模型进行发布。第三方面,本申请实施例提供了一种推荐装置,所述装置包括:输入信息确定模块,用于确定输入至已训练的在线预测模型中的目标用户标识以及多个候选条目标识,其中,所述在线预测模型中存储有多个样本用户标识对应的中间用户特征向量,以及多个样本条目标识对应的中间条目特征向量;中间用户特征向量查找模块,用于在所述在线预测模型的多个样本用户标识中查找所述目标用户标识,获得所述目标用户标识对应的中间用户特征向量;中间条目特征向量查找模块,用于在所述在线预测模型的多个样本条目标识中查找各候选条目标识,获得各候选条目标识对应的中间条目特征向量;预测处理模块,用于在所述在线预测模型中,对所述目标用户标识对应的中间用户特征向量以及各候选条目标识对应的中间条目特征向量进行预测处理,输出各候选条目标识与所述目标用户标识的匹配度;目标条目标识确定模块,用于根据各候选条目标识与所述目标用户标识的匹配度,从所述候选条目标识中确定用于推荐至所述目标用户标识的目标条目标识。第四方面,本申请实施例提供了一种在线预测模型的发布装置,所述装置包括:模型参数获取模块,用于获取在线预测模型的模型参数;中间向量获取模块,用于获取预设的离线预测模型针对各样本用户标识生成的中间用户特征向量,以及针对各样本条目标识生成的中间条目特征向量;存储模块,用于将各样本用户标识对应的中间用户特征向量、各样本条目标识对应的中间条目特征向量与所述模型参数存储至预设数据库中;模型发布模块,用于基于所述预设数据库对所述在线预测模型进行发布。第五方面,本申请实施例提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述的方法。第六方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述的方法。本申请具有如下有益效果:在本实施例中,在进行条目推荐时,在线预测模型根据输入的目标用户标识以及多个候选条目标识,可以直接从模型的缓存中查找对应的中间用户特征向量以及中间条目特征向量,省略了获取目标用户标识以及多个候选条目标识对应的原始特征并对原始特征进行预处理的过程,从而有效地降低了在线预测模型的计算量,减少机器成本的同时,降低了模型的预估耗时和响应延时,提升了推荐系统中模型预测的性能。另外,由于在在线预测模型中预先存储有多个样本用户标识对应的中间用户特征向量,以及多个样本条目标识对应的中间条目特征向量,这样在线预测模型在进行推荐时,针对同一用户的不同推荐场景,或者同一条目的不同推荐场景,可以直接查找对应的中间用户特征向量或者中间条目特征向量,无需重复计算中间向量,进一步降低了在线预测模型的计算量。进一步地,在本实施例中,在发布在线预测模型时,可以将中间用户特征向量和中间条目特征向量随着模型参数一起发布,使得在线预测模型在进行预测处理时无需重复计算中间用户特征向量和中间条目特征向量,从而降低了在线预测模型的计算量,提高了在线预测模型的预估效率。附图说明图1是本申请实施例一提供的一种推荐方法实施例的流程图;图2是本申请实施例二提供的一种在线预测模型的发布方法实施例的流程图;图3是本申请实施例三提供的另一种在线预测模型的发布方法实施例的流程图;图4是本申请实施例三中的预测模型示意图;图5是本申请实施例四提供的一种预测模型的训练方法实施例的流程图;图6是本申请实施例四中的标识数据库示意图;图7是本申请实施例四中的用户属性数据库示意图;图8是本申请实施例四中的条目属性数据库示意图;图9是本申请实施例四中的训练数据集示意图;图10是本申请实施例五提供的一种在线预测模型的训练和预测场景示例性实施例的流程示意图;图11是本申请实施例六提供的一种推荐装置实施例的结构框图;图12是本申请实施例六提供的一种在线预测模型的发布装置实施例的结构框图;图13是本申请实施例八提供的一种计算机设备的结构示意图。具本文档来自技高网...

【技术保护点】
1.一种推荐方法,其特征在于,所述方法包括:/n确定输入至已训练的在线预测模型中的目标用户标识以及多个候选条目标识,其中,所述在线预测模型中存储有多个样本用户标识对应的中间用户特征向量,以及多个样本条目标识对应的中间条目特征向量;/n在所述在线预测模型的多个样本用户标识中查找所述目标用户标识,获得所述目标用户标识对应的中间用户特征向量;/n在所述在线预测模型的多个样本条目标识中查找各候选条目标识,获得各候选条目标识对应的中间条目特征向量;/n在所述在线预测模型中,对所述目标用户标识对应的中间用户特征向量以及各候选条目标识对应的中间条目特征向量进行预测处理,输出各候选条目标识与所述目标用户标识的匹配度;/n根据各候选条目标识与所述目标用户标识的匹配度,从所述候选条目标识中确定用于推荐至所述目标用户标识的目标条目标识。/n

【技术特征摘要】
1.一种推荐方法,其特征在于,所述方法包括:
确定输入至已训练的在线预测模型中的目标用户标识以及多个候选条目标识,其中,所述在线预测模型中存储有多个样本用户标识对应的中间用户特征向量,以及多个样本条目标识对应的中间条目特征向量;
在所述在线预测模型的多个样本用户标识中查找所述目标用户标识,获得所述目标用户标识对应的中间用户特征向量;
在所述在线预测模型的多个样本条目标识中查找各候选条目标识,获得各候选条目标识对应的中间条目特征向量;
在所述在线预测模型中,对所述目标用户标识对应的中间用户特征向量以及各候选条目标识对应的中间条目特征向量进行预测处理,输出各候选条目标识与所述目标用户标识的匹配度;
根据各候选条目标识与所述目标用户标识的匹配度,从所述候选条目标识中确定用于推荐至所述目标用户标识的目标条目标识。


2.根据权利要求1所述的推荐方法,其特征在于,在所述在所述在线预测模型中,对所述目标用户标识对应的中间用户特征向量以及各候选条目标识对应的中间条目特征向量进行预测处理,输出各候选条目标识与所述目标用户标识的匹配度之前,所述方法还包括:
若在所述在线预测模型的多个样本用户标识中查找不到所述目标用户标识,则将所述目标用户标识对应的中间用户特征向量设置为第一预设向量;
或者,
若在所述在线预测模型的多个样本条目标识中查找不到所述候选条目标识,则将该候选条目标识对应的中间条目特征向量设置为第二预设向量。


3.一种在线预测模型的发布方法,其特征在于,所述方法包括:
获取在线预测模型的模型参数;
获取预设的离线预测模型针对各样本用户标识生成的中间用户特征向量,以及针对各样本条目标识生成的中间条目特征向量;
将各样本用户标识对应的中间用户特征向量、各样本条目标识对应的中间条目特征向量与所述模型参数存储至预设数据库中;
基于所述预设数据库对所述在线预测模型进行发布。


4.根据权利要求3所述的在线预测模型的发布方法,其特征在于,所述获取在线预测模型的模型参数包括:
训练预测模型;
对所述预测模型按照预设裁剪规则进行裁剪,获得在线预测模型的模型参数以及离线预测模型的模型参数。


5.根据权利要求4所述的在线预测模型的发布方法,其特征在于,所述训练预测模型包括:
将预先建立的标识数据库、用户属性数据库以及条目属性数据库加载进内存,其中,所述标识数据库用于存储多个样本用户标识及各样本用户标识发生交互的样本条目标识;所述用户属性数据库用于存储各样本用户标识对应的用户属性信息;所述条目属性数据库用于存储各样本条目标识对应的条目属性信息;
根据所述标识数据库中记录的样本用户标识及样本条目标识,分别从所述用户属性数据库与所述条目属性数据库中查找出...

【专利技术属性】
技术研发人员:杨晚鹏
申请(专利权)人:有半岛北京信息科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1