信息推荐方法、模型训练方法、装置、设备及存储介质制造方法及图纸

技术编号:32784577 阅读:22 留言:0更新日期:2022-03-23 19:43
本申请公开了一种信息推荐方法、模型训练方法、装置、设备及存储介质,属于人工智能技术领域。该方法包括:从参数表中获取用户标识对应的第一降维向量、以及n个候选内容的n个第二降维向量;基于第一降维向量与n个第二降维向量计算每个候选内容的推荐分数;基于n个推荐分数从n个候选内容中确定推荐信息,向用户标识对应的用户设备发送推荐信息,n为正整数。其中,第一降维向量与第二降维向量是在线下分别对历史浏览内容序列与候选内容进行特征降维提取得到的,这使得线上信息推荐时可以直接获取预设维度上的特征向量进行计算,获得用户历史行为序列对用户兴趣的准确表达的同时,也不再受限于线上服务资源限制。再受限于线上服务资源限制。再受限于线上服务资源限制。

【技术实现步骤摘要】
信息推荐方法、模型训练方法、装置、设备及存储介质


[0001]本申请涉及人工智能
,特别涉及一种信息推荐方法、模型训练方法、装置、设备及存储介质。

技术介绍

[0002]用户兴趣建模是个性化推荐系统的重要组成部分,所谓“人以群分”,对用户兴趣进行全面、多样地刻画,对于提升个性化推荐系统的用户满意度具有重要意义。
[0003]其中,用户历史行为序列是表达用户兴趣的重要组成部分。示例性的,推荐系统可以采集用户历史行为序列作为输入数据,然后从用户历史行为序列中提取兴趣特征来表征用户兴趣,基于兴趣特征筛选用户感兴趣的推荐内容。
[0004]但是,由于受限于线上服务资源的限制,推荐系统所能支持的用户历史行为序列的长度和维度都十分有限,使得用户兴趣表达受限。

技术实现思路

[0005]本申请实施例提供了一种信息推荐方法、模型训练方法、装置、设备及存储介质,该方法在线下完成对历史浏览内容序列的特征降维提取、以及候选内容的特征降维提取,使得线上信息推荐时可以直接获取预设维度上的特征向量进行计算,按照提供的线上服务资源来控制预设维度的大小,能够获得用户历史行为序列对用户兴趣的准确表达的同时,也不再受限于线上服务资源的限制,实现符合用户兴趣的精准信息推荐。所述技术方案如下:
[0006]根据本申请的一个方面,提供了一种信息推荐方法,该方法包括:
[0007]从参数表中获取用户标识对应的第一降维向量,以及从参数表中获取n个内容标识对应的n个第二降维向量;第一降维向量是预先对第一高维向量离线降维得到的预设维度上的第一降维向量,第一高维向量是从用户标识对应的历史浏览内容序列中提取得到的用户兴趣的表征向量;第二降维向量是预先对内容标识对应的候选内容的第二高维向量离线降维得到的预设维度上的第二降维向量;预设维度小于第一高维向量与第二高维向量的维度;
[0008]基于第一降维向量与n个第二降维向量,计算每个第二降维向量对应的候选内容的推荐分数,得到n个内容标识对应的n个候选内容的n个推荐分数;
[0009]基于n个推荐分数从n个候选内容中确定推荐信息,向用户标识对应的用户设备发送推荐信息,n为正整数。
[0010]根据本申请的另一个方面,提供了一种模型训练方法,该方法用于对降维模型和排序模型的联合训练,降维模型用于特征向量的离线降维,排序模型用于内容评分,该方法包括:
[0011]获取训练样本,每组训练样本包括至少两个浏览内容样本对应的浏览内容序列和推荐内容样本,推荐内容样本标记有参考推荐分数;
[0012]调用降维模型对浏览内容序列进行降维处理,得到第一样本降维向量;以及调用降维模型对推荐内容样本进行降维处理,得到第二样本降维向量;
[0013]调用排序模型基于第一样本降维向量和第二样本降维向量进行评分计算,得到推荐内容样本的预测推荐分数;
[0014]基于预测推荐分数与参考推荐分数之间的误差,对降维模型和排序模型进行参数调整。
[0015]根据本申请的另一个方面,提供了一种信息推荐装置,该装置包括:
[0016]第一获取模块,用于从参数表中获取用户标识对应的第一降维向量,以及从参数表中获取n个内容标识对应的n个第二降维向量;第一降维向量是预先对第一高维向量离线降维得到的预设维度上的第一降维向量,第一高维向量是从用户标识对应的历史浏览内容序列中提取得到的用户兴趣的表征向量;第二降维向量是预先对内容标识对应的候选内容的第二高维向量离线降维得到的预设维度上的第二降维向量;预设维度小于第一高维向量与第二高维向量的维度;
[0017]第一计算模块,用于基于第一降维向量与n个第二降维向量,计算每个第二降维向量对应的候选内容的推荐分数,得到n个内容标识对应的n个候选内容的n个推荐分数;
[0018]信息推荐模块,用于基于n个推荐分数从n个候选内容中确定推荐信息,向用户标识对应的用户设备发送推荐信息,n为正整数。
[0019]根据本申请的另一个方面,提供了一种模型训练装置,该装置用于对降维模型和排序模型的联合训练,降维模型用于特征向量的离线降维,排序模型用于内容评分,该装置包括:
[0020]第二获取模块,用于获取训练样本,每组训练样本包括至少两个浏览内容样本对应的浏览内容序列和推荐内容样本,推荐内容样本标记有参考推荐分数;
[0021]第二提取模块,用于调用降维模型对浏览内容序列进行降维处理,得到第一样本降维向量;以及调用降维模型对推荐内容样本进行降维处理,得到第二样本降维向量;
[0022]第二计算模块,用于调用排序模型基于第一样本降维向量和第二样本降维向量进行评分计算,得到推荐内容样本的预测推荐分数;
[0023]参数调整模块,用于基于预测推荐分数与参考推荐分数之间的误差,对降维模型和排序模型进行参数调整。
[0024]根据本申请的另一个方面,提供了一种计算机设备,上述计算机设备包括:处理器和存储器,上述存储器存储有计算机程序,上述计算机程序由上述处理器加载并执行以实现如上所述的信息推荐方法,或者,如上所述的模型训练方法。
[0025]根据本申请的另一个方面,提供了一种计算机可读存储介质,上述计算机可读存储介质中存储有计算机程序,上述计算机程序由处理器加载并执行以实现如上所述的信息推荐方法,或者,如上所述的模型训练方法。
[0026]根据本申请的另一个方面,提供了一种计算机程序(或计算机程序产品),上述计算机程序(或计算机程序产品)包括计算机指令,上述计算机指令存储在计算机可读存储介质中。计算机设备的处理器从上述计算机可读存储介质读取上述计算机指令,上述处理器执行上述计算机指令,使得上述计算机设备执行如上所述的信息推荐方法,或者,如上所述的模型训练方法。
[0027]本申请实施例提供的技术方案带来的有益效果至少包括:
[0028]计算机设备中设置有参数表,参数表中存储有第一降维向量与第二降维向量,第一降维向量用于表达用户浏览信息的长期兴趣点,第二降维向量是信息推荐时可供选择内容的特征向量。计算机设备在进行线上的信息推荐时,从参数表中获取用户标识对应的第一降维向量、以及n个内容标识对应的n个第二降维向量;基于第一降维向量与第二降维向量,对每个第二降维向量对应的候选内容进行评分,得到n个内容标识对应的n个候选内容的推荐分数,再基于n个推荐分数从n个候选内容中筛选出推荐信息,向用户标识对应的用户设备发送该推荐信息,为用户标识对应的用户的信息浏览提供推荐信息。这一信息推荐过程中采用的第一降维向量和第二降维向量,都是预先降维处理后的预设维度上的向量,因此,可以获得用户的长期兴趣表征的同时,还避免了由于线上资源有限,无法支持超长与超高维度的用户兴趣表达序列的处理这一问题;其次,这一信息推荐过程还减少了对用户兴趣特征的提取步骤、以及对候选内容的特征提取步骤,进而减少了计算机设备上运算资源的占用,提高了信息推荐的效率。
附图说明
[0029]为了更清楚地说明本申请实施本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种信息推荐方法,其特征在于,所述方法包括:从参数表中获取用户标识对应的第一降维向量,以及从所述参数表中获取n个内容标识对应的n个第二降维向量;所述第一降维向量是预先对第一高维向量离线降维得到的预设维度上的第一降维向量,所述第一高维向量是从所述用户标识对应的历史浏览内容序列中提取得到的用户兴趣的表征向量;所述第二降维向量是预先对所述内容标识对应的候选内容的第二高维向量离线降维得到的所述预设维度上的第二降维向量;所述预设维度小于所述第一高维向量与所述第二高维向量的维度;基于所述第一降维向量与所述n个第二降维向量,计算每个所述第二降维向量对应的候选内容的推荐分数,得到所述n个内容标识对应的n个候选内容的n个推荐分数;基于所述n个推荐分数从所述n个候选内容中确定推荐信息,向所述用户标识对应的用户设备发送所述推荐信息,n为正整数。2.根据权利要求1所述的方法,其特征在于,所述基于所述第一降维向量与所述n个第二降维向量,计算每个所述第二降维向量对应的候选内容的推荐分数,得到所述n个内容标识对应的n个候选内容的n个推荐分数,包括:对于每个所述第二降维向量,将所述第二降维向量与所述第一降维向量合并,得到合并后的降维向量;调用排序模型从m个评分方向上对所述合并后的降维向量进行评分计算,得到所述m个评分方向上的m个子推荐分数;所述评分方向是指对所述候选内容评分的参考点,所述排序模型用于内容评分;基于所述m个子推荐分数确定所述第二降维向量对应的候选内容的推荐分数,所述m为大于1的正整数。3.根据权利要求2所述的方法,其特征在于,所述排序模型包括m个门限网络、专家网络、m个评分网络和输出网络;所述m个子推荐分数包括第i个评分方向上的子推荐分数,i为小于或者等于m的正整数;所述调用排序模型从m个评分方向上对所述合并后的降维向量进行评分计算,得到所述m个评分方向上的m个子推荐分数,包括:将所述合并后的降维向量输入第i个门限网络,得到所述第i个评分方向对应的第i组权重;以及将所述合并后的降维向量输入所述专家网络,得到学习后的评分特征向量;将所述第i组权重与所述评分特征向量相乘,得到所述第i个评分方向上的评分特征向量;将所述第i个评分方向上的评分特征向量输入第i个评分网络,得到所述第i个评分方向上的子推荐分数;采用上述四个步骤计算得到所述m个子推荐分数之后,所述基于所述m个子推荐分数确定所述第二降维向量对应的候选内容的推荐分数,包括:通过所述输出网络基于所述m个子推荐分数确定所述第二降维向量对应的候选内容的推荐分数。4.根据权利要求1至3任一所述的方法,其特征在于,所述从参数表中获取用户标识对应的第一降维向量之前,还包括:获取第一时间段内所述用户标识对应的至少两个历史浏览内容,生成所述第一时间段
内的历史浏览内容序列;调用降维模型对所述第一时间段内的历史浏览内容序列进行离线特征提取,得到所述预设维度上的所述第一降维向量;其中,所述降维模型用于对特征向量进行降维提取;将所述第一降维向量与所述用户标识对应加载至所述参数表。5.根据权利要求4所述的方法,其特征在于,所述方法还包括:获取第三时间段内所述用户标识对应的至少两个历史浏览内容,生成所述第三时间段内的历史浏览内容序列;调用所述降维模型对所述第三时间段内的历史浏览内容序列进行离线特征提取,得到所述预设维度上的第三降维向量;根据所述第三降维向量对所述参数表中所述用户标识对应的所述第一降维向量进行更新;其中,所述第一时间段内的最大时刻先于所述第三时间段内的最大时刻。6.根据权利要求1至3任一所述的方法,其特征在于,所述从所述参数表中获取n个内容标识对应的n个第二降维向量之前,还包括:获取第二时间段内的所述n个候选内容;调用降维模型对每个所述候选内容进行离线特征提取,得到所述预设维度上的所述第二降维向量;其中,所述降维模型用于对特征向量进行降维提取;将所述第二降维向量与所述内容标识对应加载至所述参数表。7.根据权利要求6所述的方法,其特征在于,所述方法还包括:获取第四时间段内的k个新增候选内容;调用所述降维模型对每个所述新增候选内容进行离线特征提取,得到所述预设维度上的第四降维向量;将所述新增候选内容的第四降维向量与所述内容标识对应更新至所述参数表;其中,所述第二时间段内的最大时刻先于所述第四时间段内的最大时刻,k为正整数。8.根据权利要求1至3任一所述的方法,其特征在于,所述基于所述n个推荐分数从所述n个候选内容中确定推荐信息,包括:调用排序模型对所述n个推荐分数排序,将排序后的所述n个推荐分数中前g个推荐分数对应的候选内容确定为g个所述推荐信息,g为正整数。9.一种模型训练方法,其特征在于,所述方法用于对降维模型和...

【专利技术属性】
技术研发人员:程晓娜高山彭冲范将科程兵
申请(专利权)人:北京三快在线科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1