基于多维度特征嵌入和特征提取网络的物品推荐方法技术

技术编号:31926427 阅读:18 留言:0更新日期:2022-01-15 13:11
本发明专利技术提出了一种基于多维度特征嵌入和特征提取网络的物品推荐方法,实现步骤为:(1)提取用户属性数据和物品属性数据;(2)提取用户对物品的隐式评分数据;(3)生成训练样本集与测试样本集;(4)构建基于多维度特征嵌入和特征提取网络的物品推荐模型;(5)对物品推荐模型进行迭代训练;(6)获取待评分物品的评分预测结果;(7)获取物品推荐结果。本发明专利技术构建的物品推荐模型中包含有基于多维度特征嵌入网络和特征提取网络,在对该模型进行训练以及获取物品推荐结果的过程中,能够充分挖掘用户和物品之间的交互特征,充分使用用户属性特征和物品属性特征,有效提高了物品推荐的准确性。有效提高了物品推荐的准确性。有效提高了物品推荐的准确性。

【技术实现步骤摘要】
基于多维度特征嵌入和特征提取网络的物品推荐方法


[0001]本专利技术属于计算机
,涉及一种物品推荐方法,具体涉及一种基于多维度特征嵌入和特征提取网络的物品推荐方法。可应用于电商商品推荐、图书推荐、电影推荐、音乐推荐等


技术介绍

[0002]随着互联网的快速发展,用户和物品的数据规模越来越大,带来了严重的信息过载问题,推荐系统是缓解信息过载问题的有效技术手段。物品推荐方法是推荐系统的一种具体实施方法。物品推荐方法可以对用户没有评价过的电商商品、图书、电影和音乐等物品进行精准的评分预测,并给用户推荐其感兴趣的物品。物品推荐方法首先对客观数据和主观数据进行分析和建模,然后使用提取到的特征来预测用户对没有评价过的物品的评分,最后将预测评分较高的部分物品组成推荐列表推荐给用户,其中用户的性别、身高、体重、年龄、职业、籍贯和物品的名称、类型、颜色、大小、生产厂商、生产日期等客观数据主要用于提取属性特征,用户历史行为数据等主观数据主要用于提取用户和物品之间的交互特征。如何提高推荐准确性是物品推荐方法的重点和难点。衡量推荐准确性的指标主要有两个:命中率(HR)和归一化折损累计增益(NDCG)。HR表示用户的测试物品出现在推荐列表中的用户数量占所有用户的比例,值越大,说明推荐准确性越好。NDCG表示测试物品在推荐列表中的排序位置,排序越靠前,其值越接近于1,排序越靠后,其值越接近于0,值越大,说明推荐准确性越好。影响推荐准确性的主要因素是用户和物品的属性特征、交互特征能否得到充分提取。
[0003]随着深度学习在各个领域的广泛应用,物品推荐技术也在不断地融入深度学习的技术来提推荐准确性,基于深度学习的物品推荐方法可以自适应地提取特征,在样本数量充足的情况下可以取得较好的推荐结果,得到了研究人员的广泛应用。例如,湖北工业大学在其申请的专利文献“一种基于对抗矩阵分解的协调过滤卷积神经网络推荐系统及方法”(申请号:202110744530.7,申请公布号:CN 113486257A)中,公开了一种基于对抗矩阵分解的协调过滤卷积神经网络推荐方法,简称ConvNCF

AMF。该方法的实施步骤是:步骤1,利用两个嵌入方程分别输出两个维度大小为64的用户和物品的特征嵌入向量,并将用户、物品的特征嵌入向量送入外积层;步骤2,将用户、物品的特征嵌入向量进行外积得到用户

物品交互图;步骤3,基于用户

物品交互图输出表示高维度的信息张量,并将输出的张量输入预测层;步骤4,将预测层的对抗矩阵分解与卷积协调过滤网络一同训练得到物品的预测评分;步骤5,根据预测评分为用户生成推荐列表。该方法提高了物品推荐的准确性,但是其存在的不足之处在于,该方法将所有用户和物品的特征嵌入向量预先定义了一个固定且统一的维度,维度过于单一,导致特征嵌入向量所包含的信息不够全面,使得后续网络无法充分提取用户和物品之间的交互特征,进而影响推荐准确性的进一步提升。
[0004]又如,He等人在其发表的论文“Neural collaborative filtering”(Proceedings of the 26th international conference on world wide web.2017:173

182)中,提出了
一种基于神经协同过滤的物品推荐方法,简称NCF方法。该方法将用户和物品的编号信息作为模型的输入,通过嵌入层得到用户和物品的特征嵌入,通过广义矩阵分解(GMF)与多层感知机(MLP)网络对用户和物品之间的交互信息进行特征提取,通过评分预测层对提取的特征进行拼接并得到用户对物品的预测评分,最后根据预测评分为用户生成推荐列表。该方法相对于传统的基于矩阵分解的物品推荐方法在推荐准确性上有了显著的提升,但是其在对该模型进行训练以及获取物品推荐结果的过程中,仅利用用户编号和物品编号作为模型的输入,没有考虑用户的个人属性信息与物品的属性信息,导致属性特征提取不充分,进而影响推荐准确性的进一步提升。

技术实现思路

[0005]本专利技术的目的在于针对上述现有技术的不足,提出一种基于多维度特征嵌入和特征提取网络的物品推荐方法,用于解决现有技术中存在的物品推荐准确性较低的技术问题。
[0006]为实现上述目的,本专利技术采取的技术方案包括如下步骤:
[0007](1)提取用户属性数据和物品属性数据:
[0008](1a)从用户属性数据集中提取M个用户S
U
={U1,...,U
m
,...,U
M
}的属性数据S
H
={H1,...,H
m
,...,H
M
},每个属性数据H
m
包括K1个属性特征,其中,M≥900,U
m
表示第m个用户,H
m
表示U
m
的属性数据,表示H
m
的第k1个属性特征,K1表示H
m
的属性特征总数,K1≥3;
[0009](1b)从物品属性数据集中提取N个物品S
V
={V1,...,V
n
,...,V
N
}的属性数据S
I
={I1,...,I
n
,...,I
N
},每个属性数据I
n
包括K2个属性特征,其中,N≥1000,V
n
表示第n个物品,I
n
表示V
n
的属性数据,表示I
n
的第k2个属性特征,K2表示I
n
属性特征的总数,K2≥3;
[0010](2)提取用户对物品的隐式评分数据:
[0011]从用户对物品的历史评分数据集中提取M个用户中的每个用户U
m
对N个物品中的部分物品的共L条隐式评分数据同时记录每条隐式评分数据对应的用户编号Uid
l
和物品编号Iid
l
,得到用户编号集合S
UID
={Uid1,...,Uid
l
,...,Uid
L
}和物品编号集合S
IID
={Iid1,...,Iid
l
,...,Iid
L
},其中,L≥100000,表示通过用户U
m
对物品V
s
评分确定的第l条隐式评分数据,S表示部分物品的个数,S<N,Uid
l
表示对应的用户的编号,Iid
l
表示对应的物品的编号;
[0012](3)生成训练样本集与测试样本集:
[0013]选取隐式评分数据集合S
Y
中每个用户最近一次评价的隐式评分数据,以及所选取的每条隐式评分数据对应的用户的编号和属性特征、物品的编号和属性特征作为测试样本,组成包括M个测试本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于多维度特征嵌入和特征提取网络的物品推荐方法,其特征在于,包括如下步骤:(1)提取用户属性数据和物品属性数据:(1a)从用户属性数据集中提取M个用户S
U
={U1,...,U
m
,...,U
M
}的属性数据S
H
={H1,...,H
m
,...,H
M
},每个属性数据H
m
包括K1个属性特征,其中,M≥900,U
m
表示第m个用户,H
m
表示U
m
的属性数据,的属性数据,表示H
m
的第k1个属性特征,K1表示H
m
的属性特征总数,K1≥3;(1b)从物品属性数据集中提取N个物品S
V
={V1,...,V
n
,...,V
N
}的属性数据S
I
={I1,...,I
n
,...,I
N
},每个属性数据I
n
包括K2个属性特征,其中,N≥1000,V
n
表示第n个物品,I
n
表示V
n
的属性数据,的属性数据,表示I
n
的第k2个属性特征,K2表示I
n
属性特征的总数,K2≥3;(2)提取用户对物品的隐式评分数据:从用户对物品的历史评分数据集中提取M个用户中的每个用户U
m
对N个物品中的部分物品的共L条隐式评分数据同时记录每条隐式评分数据对应的用户编号Uid
l
和物品编号Iid
l
,得到用户编号集合S
UID
={Uid1,...,Uid
l
,...,Uid
L
}和物品编号集合S
IID
={Iid1,...,Iid
l
,...,Iid
L
},其中,L≥100000,表示通过用户U
m
对物品V
s
评分确定的第l条隐式评分数据,S表示部分物品的个数,S<N,Uid
l
表示对应的用户的编号,Iid
l
表示对应的物品的编号;(3)生成训练样本集与测试样本集:选取隐式评分数据集合S
Y
中每个用户最近一次评价的隐式评分数据,以及所选取的每条隐式评分数据对应的用户的编号和属性特征、物品的编号和属性特征作为测试样本,组成包括M个测试样本的测试样本集,并将S
Y
中剩余的P条隐式评分数据,以及剩余的每个隐式评分数据对应的用户的编号和属性特征、物品的编号和属性特征作为训练样本,组成包括P个训练样本的训练样本集,其中,P+M=L;(4)构建基于多维度特征嵌入和特征提取网络的物品推荐模型J:构建包括多维度特征嵌入网络、特征提取网络和物品评分预测网络的物品推荐模型,其中:多维度特征嵌入网络包括并行排布的用户多维度特征嵌入网络和物品多维度特征嵌入网络;用户多维度特征嵌入网络包括三个并行连接的用户特征嵌入提取分支,每个特征嵌入提取分支包括用户编号信息输入层、特征嵌入层、全连接层和两个激活函数层;物品多维度特征嵌入网络包括三个并行连接的物品特征嵌入提取分支,每个物品特征嵌入提取分支包括物品编号信息输入层、特征嵌入层、全连接层和两个激活函数层;特征提取网络包括并行排布的属性信息特征提取网络、低阶交互特征提取网络和高阶交互特征提取网络;属性信息特征提取网络包括顺次连接的属性信息输入层、特征嵌入层和激活函数层;低阶交互特征提取网络包括元素积操作层、两个全连接层和两个激活函数层;高阶交互特征提取网络包括外积操作层、多个三维卷积层、全连接层和多个激活函数层;
物品评分预测网络包括拼接层、两个全连接层、输出层和两个激活函数层;多维度特征嵌入网络的输出端与特征提取网络中的低阶交互特征提取网络和高阶交互特征提取网络的输入端连接,特征提取网络的输出端与物品评分预测网络的输入端连接,得到物品推荐模型J;(5)对物品推荐模型J进行迭代训练:(5a)初始化迭代次数为t,最大迭代次数为T,T≥200,当前物品推荐模型为J
t
,并令t=1,J
t
=J;(5b)将从训练样本集随机且有放回选取的G个训练样本作为物品推荐模型J
t
的输入:(5b1)多维度特征嵌入网络中的用户多维度特征嵌入网络对每个训练样本中用户的三个特征嵌入进行提取,同时多维度特征嵌入网络中的物品多维度特征嵌入网络对每个训练样本中物品的三个特征嵌入进行提取;(5b2)特征提取网络中的低阶交互特征提取网络对用户的每个特征嵌入与物品的每个特征嵌入进行元素积操作,并对元素积操作得到的九个低阶交互特征向量进行融合,得到低阶交互特征嵌入,同时高阶交互特征提取网络对用户的每个特征嵌入与物品的每个特征嵌入进行两两外积操作,并对外积操作得到的九个二维外积矩阵进行堆叠,得到三维矩阵C,然后对C进行三维卷积得到高阶交互特征嵌入;(5b3)属性信息特征提取网络提取每个训练样本用户的属性特征和物品的属性特征,组成...

【专利技术属性】
技术研发人员:慕彩红刘逸雷东昌王蓉芳冯婕刘波
申请(专利权)人:西安电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1