当前位置: 首页 > 专利查询>天津大学专利>正文

一种基于非采样张量分解的商品推荐系统及方法技术方案

技术编号:38255834 阅读:8 留言:0更新日期:2023-07-27 10:19
本发明专利技术公开了一种基于非采样张量分解的商品推荐系统,该系统内设基于非采样张量分解的商品推荐模型;该模型包括共享嵌入层、行为嵌入层、异构块项交互层及输出层;共享嵌入层输入用户ID向量及物品ID向量;行为嵌入层输入行为向量;异构块项交互层,其从共享嵌入层调入用户ID向量、物品ID向量,其从行为嵌入层调入行为向量,其采用物品ID向量、用户ID向量及行为向量的张量模乘的方法,得到任一用户和任一物品的关联度并输出至输出层;输出层处理后输出任一用户对应多个物品的关联度。本发明专利技术能够自动建立多种行为数据间的联系,自适应调整特征向量的值,最小化模型预测值和真实值之间的误差,可提供与用户高相关性的商品推荐。可提供与用户高相关性的商品推荐。可提供与用户高相关性的商品推荐。

【技术实现步骤摘要】
一种基于非采样张量分解的商品推荐系统及方法


[0001]本专利技术涉及自然语言处理和信息检索领域,涉及张量分解技术和协同过滤技术,尤其是一种基于非采样张量分解的商品推荐系统及方法。

技术介绍

[0002]目前,推荐系统已经广泛应用于各种在线服务中,特别是电商平台。面对电商平台海量的商品信息,仅仅依靠用户主动搜索,会导致用户淹没在信息过载的问题中。在电商平台上,推荐系统根据用户在平台上的历史互动信息向用户推送商品信息与建议,帮助用户决定应该购买的物品,辅助用户决策。推荐系统建立在海量的用户行为信息上,单一利用历史购买记录日益不能满足需求,急需新技术融合利用多种用户行为信息,提高推荐效果。
[0003]张量分解是机器学习的技术和研究领域之一,通过建立并分解由多个维度数据决定的元素值构成的张量,在计算系统中实现人工智能。由于多维张量大量元素值缺失,因此可以通过一系列低秩分解逼近的方法获得表示不同维度的因子矩阵,使得张量分解具有表征学习能力,可以实现缺失值的预测与填补。张量分解所使用的分解方法具有多种形态,按分解使用的因子形式,张量分解的方法包括CP分解、Tucker分解、BTD分解、链式分解。张量分解使用数据对其构筑中的参数进行更新以达成训练目标,该过程被通称为“学习”。学习过程需要使用训练数据,根据是否需要对数据采样分为负采样方法和非采样方法。非采样方法使用全部数据进行训练,使用非采样方法的张量分解称为非采样张量分解。
[0004]现有的商品推荐系统,采用协同过滤的算法,根据计算用户或物品的相似性评分为用户推荐商品。尤其是基于物品相似性的协同过滤思想,已经成为电商平台推荐系统的主流思想。但在用户兴趣指标不明确、历史购买数据不足、候选商品数量多的情况下,不能帮助用户快速、准确地做出购买决策。

技术实现思路

[0005]本专利技术为解决公知技术中存在的技术问题而提供一种基于非采样张量分解的商品推荐系统及方法。
[0006]本专利技术为解决公知技术中存在的技术问题所采取的技术方案是:一种基于非采样张量分解的商品推荐系统,该系统内设基于非采样张量分解的商品推荐模型;该模型包括共享嵌入层、行为嵌入层、异构块项交互层及输出层;共享嵌入层输入用户ID向量及物品ID向量;行为嵌入层输入行为向量;用户ID向量用于表示用户专属编码及用户特征;物品ID向量用于表示物品专属编码及物品特征;行为向量用于表示行为专属编码及行为特征;异构块项交互层,其从共享嵌入层调入用户ID向量、物品ID向量,其从行为嵌入层调入行为向量,其采用物品ID向量、用户ID向量及行为向量的张量模乘的方法,得到任一用户和任一物品的关联度并输出至输出层;输出层处理后输出任一用户对应多个物品的关联度。
[0007]进一步地,共享嵌入层包括用于存储用户ID向量的用户存储器组件及用于存储物品ID向量的物品存储器组件;行为嵌入层包括用于存储行为向量的行为存储组件;用户ID
向量包括用户的偏好信息,用户的偏好信息被存储在用户存储器组件的切片中,物品ID向量包括物品的特征,物品的特征被存储在物品存储器组件的切片中,行为的特征被存储在行为存储组件的切片中。
[0008]进一步地,异构块项交互层包括独立性块项、联合性块项及流行度块项;设由独立性块项计算用户与物品的关联度为设由联合性块项计算用户与物品的关联度为设由流行度块项计算用户与物品的关联度为则计算方法如下:
[0009][0010][0011][0012]式中:
[0013]m
uk
表示第u个用户的ID向量的第k个元素;
[0014]m
ux
表示第u个用户的ID向量的第x个元素;
[0015]表示第b个行为用于独立性块项的向量的第k个元素;
[0016]表示第b个行为用于联合性块项的向量的第k个元素;
[0017]表示第b个行为用于流行度块项的向量的第k个元素;
[0018]e
ix
表示第i个物品的ID向量的第x个元素;
[0019]e
iy
表示第i个物品的ID向量的第y个元素;
[0020]表示联合性块项的核心张量下标为y,x,k的元素;
[0021]表示流行度块项的核心张量下标为x,1,k的元素。
[0022]本专利技术还提供了一种上述的基于非采样张量分解的商品推荐系统的基于非采样张量分解的商品推荐方法,其特征在于,该方法包括如下步骤:
[0023]步骤一:建立基于非采样张量分解的商品推荐模型;
[0024]步骤二:读取用户历史行为数据进行预处理,生成包括用户、行为和物品三维信息的三维数据,将三维数据按照行为类别划分为若干个行为数据块;每个行为数据块包括对应该行为的用户ID向量及物品ID向量;从每个行为数据块中选取一部分用户ID向量及物品ID向量做成训练集;从购买行为的行为数据块中选取一部分用户ID向量及物品ID向量作为验证集;
[0025]步骤三:将模型内数据随机初始化;设定模型参数及损失函数;
[0026]步骤四:将训练集中的用户ID向量、物品ID向量输入至共享嵌入层;将行为类别编辑为行为向量输入至行为嵌入层,对模型进行训练;
[0027]步骤五:采用验证集对训练后的模型进行验证,如果验证结果没有达到预定指标,则进行步骤六;如果验证结果达到预定指标,则进行步骤七;
[0028]步骤六:调整模型参数;重复步骤四至步骤五;
[0029]步骤七:将任一用户ID向量输入训练完成的模型中,得到该用户对应多个物品的关联度;
[0030]步骤八:根据关联度的大小排序,提供对应该用户的推荐物品列表。
[0031]进一步地,训练时,采用dropout方法随机丢弃部分输入的用户ID向量。
[0032]进一步地,对损失函数进行优化,将损失函数计算数据拆分为:有历史行为记录的用户、行为、物品三元组数据及其他数据两部分,通过抛弃梯度无关的常数项以及改变累加和计算顺序,加速模型训练过程。
[0033]进一步地,损失函数采用平方损失函数;设为优化后的平方损失函数;的计算方法如下:
[0034][0035][0036]式中:
[0037]B为训练过程中分批次送入模型的用户ID向量集合;
[0038]V为所有的物品ID向量集合;
[0039]为对应存在历史记录三元组数据设置的常数值;
[0040]为对应其他数据设置的常数值;
[0041]r
iub
为三元组数据的真实关联度;
[0042]为模型计算的三元组数据的关联度;
[0043]为模型计算的三元组数据的关联度的平方;
[0044]t
uj
为关联度计算过程中与用户ID向量相关部分的预先计算结果的第j个元素;
[0045]t
uk
为关联度计算过程中与用户ID向量相关部分的预先计算结果的第k个元素;
[0046]e...

【技术保护点】

【技术特征摘要】
1.一种基于非采样张量分解的商品推荐系统,其特征在于,该系统内设基于非采样张量分解的商品推荐模型;该模型包括共享嵌入层、行为嵌入层、异构块项交互层及输出层;共享嵌入层输入用户ID向量及物品ID向量;行为嵌入层输入行为向量;用户ID向量用于表示用户专属编码及用户特征;物品ID向量用于表示物品专属编码及物品特征;行为向量用于表示行为专属编码及行为特征;异构块项交互层,其从共享嵌入层调入用户ID向量、物品ID向量,其从行为嵌入层调入行为向量,其采用物品ID向量、用户ID向量及行为向量的张量模乘的方法,得到任一用户和任一物品的关联度并输出至输出层;输出层处理后输出任一用户对应多个物品的关联度。2.根据权利要求1所述的基于非采样张量分解的商品推荐系统,其特征在于,共享嵌入层包括用于存储用户ID向量的用户存储器组件及用于存储物品ID向量的物品存储器组件;行为嵌入层包括用于存储行为向量的行为存储组件;用户ID向量包括用户的偏好信息,用户的偏好信息被存储在用户存储器组件的切片中,物品ID向量包括物品的特征,物品的特征被存储在物品存储器组件的切片中,行为的特征被存储在行为存储组件的切片中。3.根据权利要求1所述的基于非采样张量分解的商品推荐系统,其特征在于,异构块项交互层包括独立性块项、联合性块项及流行度块项;设由独立性块项计算用户与物品的关联度为设由联合性块项计算用户与物品的关联度为设由流行度块项计算用户与物品的关联度为则计算方法如下:计算方法如下:计算方法如下:式中:m
uk
表示第u个用户的ID向量的第k个元素;m
ux
表示第u个用户的ID向量的第x个元素;表示第b个行为用于独立性块项的向量的第k个元素;表示第b个行为用于联合性块项的向量的第k个元素;表示第b个行为用于流行度块项的向量的第k个元素;e
ix
表示第i个物品的ID向量的第x个元素;e
iy
表示第i个物品的ID向量的第y个元素;表示联合性块项的核心张量下标为y,x,k的元素;表示流行度块项的核心张量下标为x,1,k的元素。4.一种利用权利要求1至3任一所述的基于非采样张量分解的商品推荐系统的基于非采样张量分解的商品推荐方法,其特征在于,该方法包括如下步骤:步骤一:建立基于非采样张量分解的商品推荐模型;步骤二:读取用户历史行为数据进行预处理,生成包括用户、行为和物品三维信息的三维数据,将三维数据按照行为类别划分为若干个行为数据块;每个行为数据块包括对应该
行为的用户ID向量及物品ID向量;从每个行为数据块中选取一部分用户ID向量及物品ID向...

【专利技术属性】
技术研发人员:李雪威曾晨许林英
申请(专利权)人:天津大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1