【技术实现步骤摘要】
一种基于混合神经网络的项目推荐模型的构建方法及装置、项目推荐方法
本专利技术涉及数据挖掘
,具体涉及一种基于混合神经网络的项目推荐模型的构建方法及装置、项目推荐方法。
技术介绍
网络信息技术的发展,在满足人们对信息需求的同时,也引起了信息过载的问题。面对海量的信息,用户很难或者需要消耗较大的成本找到自己感兴趣的信息。因此,如何从海量信息中快速高效地选择自己感兴趣的信息,已经成为信息时代的一大难题。推荐系统作为解决信息过载问题的主要方法应运而生,它通过分析用户的历史活动信息,挖掘用户的偏好,为用户提供个性化的信息、产品或服务,满足用户个性化的需求,从而有效减轻信息过载问题。在推荐系统的研究中,协同过滤算法是目前应用最广泛的推荐技术。协同过滤算法通过分析用户的历史反馈信息,预测用户未来的偏好。然而,协同过滤算法存在严重数据稀疏、冷启动等问题。本申请专利技术人在实施本专利技术的过程中,发现现有技术的方法,至少存在如下技术问题:近年来,一些研究者利用评论信息来降低数据的稀疏性、冷启动等问题。早期的利用评论信息的推荐系统工作大多集中在使用主题模型挖掘评论信息的主题,常用的主题模型是狄利克雷分配模型(LatentDirichletAllocation,LDA)。例如,相关研究利用主题模型对评论文本中隐含的主题进行建模,将评分信息与文本信息相结合为评分信息推荐的定量评分提供了可解释性,然后利用扩展的矩阵分解实现用户-项目的交互。通过主题模型引入文本信息在一定程度上提高了推荐的性能。但是,该模型通常利用词袋模型处理评论信息,忽视了评论信息的语义上下文信息。特别的,当 ...
【技术保护点】
1.一种基于混合神经网络的项目推荐模型的构建方法,其特征在于,包括:步骤S1:根据预先构建的用户‑项目的评分矩阵对评论信息进行过滤,并对过滤后的评论信息进行预处理,其中,用户‑项目的评分矩阵中的每一行用以表示用户‑项目评分信息中的用户特征,评分矩阵中的每一列用以表示用户‑项目评分信息中的项目特征;步骤S2:利用卷积神经网络学习预处理后的评论信息中与项目相关的上下文特征,利用卷积神经网络学习用户‑项目评分信息中的用户特征与项目特征;步骤S3:将用户‑项目评分信息中的项目特征与评论信息中与项目相关的上下文特征进行融合和交互,获得融合后的项目特征;步骤S4:将步骤S2中学习后的用户特征与融合后的项目特征整合至多任务学习框架中,联合训练得到基于混合神经网络的项目推荐模型。
【技术特征摘要】
1.一种基于混合神经网络的项目推荐模型的构建方法,其特征在于,包括:步骤S1:根据预先构建的用户-项目的评分矩阵对评论信息进行过滤,并对过滤后的评论信息进行预处理,其中,用户-项目的评分矩阵中的每一行用以表示用户-项目评分信息中的用户特征,评分矩阵中的每一列用以表示用户-项目评分信息中的项目特征;步骤S2:利用卷积神经网络学习预处理后的评论信息中与项目相关的上下文特征,利用卷积神经网络学习用户-项目评分信息中的用户特征与项目特征;步骤S3:将用户-项目评分信息中的项目特征与评论信息中与项目相关的上下文特征进行融合和交互,获得融合后的项目特征;步骤S4:将步骤S2中学习后的用户特征与融合后的项目特征整合至多任务学习框架中,联合训练得到基于混合神经网络的项目推荐模型。2.如权利要求1所述的方法,其特征在于,用户-项目评分矩阵包括项目ID,步骤S1具体包括:根据用户-项目评分矩阵中的项目ID,将评论信息中包含该项目ID的评论信息进行过滤;对过滤后的评论信息的最大长度设为预设长度,并去除停用词。3.如权利要求1所述的方法,其特征在于,步骤S2具体包括:步骤S2.1:对于预处理后的评论信息,基于词向量模型Glove将评论信息映射为词向量矩阵作为神经网络输入的初始化参数,具体表示为:D=[…wi-1wiwi+1…]其中,在中p表示每个单词wi的嵌入维度,l表示项目评论信息Cj的长度,j∈[1,M],M表示项目评论信息的数量;然后利用卷积神经网络的卷积、池化操作学习与项目相关的上下文特征;步骤S2.2:对于用户-项目评分信息,利用神经网络对用户特征和项目特征分别进行初始化,将用户-项目评分信息中的用户特征和项目特征转换为稠密的用户特征向量和项目特征向量,在嵌入层,通过潜在因子矩阵将用户特征、项目特征和与项目相关的上下文特征映射为潜在因子向量,具体表示为:其中,和为潜在因子矩阵,表示用户特征,表示项目特征,si表示与项目相关的上下文特征。4.如权利要求3所述的方法,其特征在于,利用卷积神经网络学习与项目相关的上下文特征的过程具体包括:sj=cnn(W,Cj)其中,W表示防止过拟合的权重和偏置变量,Cj表示项目j的原始项目评论信息,sj表示项目j的评论信息的潜在特征向量,基于卷积神经网络学习项目信息的上下文特征的目标函数表示为:其中,vj表示项目上下文特征的初始值,cnn(W,Cj)表示通过卷积神经网络学习的项目上下文特征,Θcnn表示模型的训练参数。5.如权利要求1所述的方法,其特征在于,步骤S3具体包括:采用元素级乘法融合上下文特征向量ei和项目特征向量qi,实现上下文特征和项目特征的双向交互:qi=f(W(qi⊙ei))其中,表示权重矩阵,f...
【专利技术属性】
技术研发人员:李晶,刘东华,杜博,常军,高榕,吴玉佳,
申请(专利权)人:武汉大学,
类型:发明
国别省市:湖北,42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。