一种融合自动编码器和知识图谱语义信息的推荐方法技术

技术编号：21571577 阅读：33 留言：0更新日期：2019-07-10 15:25

本发明专利技术提出了一种融合自动编码器和知识图谱语义信息的推荐方法，包括以下步骤：获取项目数据集，并对其进行预处理；所述项目数据集包括用户、主题、评分和项目名称；训练自动编码器，并利用训练后的自动编码器对预处理后的项目数据集进行训练，构建初始用户特征表示；利用word2vec模型训练后的数据获得用户的缺失主题的权重，计算用户特征的强化表示；从用户中任选一用户作为目标用户，基于用户特征的强化表示采用KNN获得与目标用户的相似用户进行推荐。本发明专利技术为神经网络中的隐藏层提供了解释性意义，在准确率、召回率、F值推荐性能指标方面有着良好的表现。

A Recommendation Method Fusing Semantic Information of Automatic Encoder and Knowledge Map

全部详细技术资料下载

【技术实现步骤摘要】
一种融合自动编码器和知识图谱语义信息的推荐方法
本专利技术涉及数据分析领域，具体涉及一种融合自动编码器和知识图谱语义信息的推荐方法。
技术介绍
移动互联网的迅速发展为人们的生活带来便利的同时，还带来了信息过载问题。在信息过载的今天，人们做出有效的选择变得十分困难。推荐系统旨在解决信息过载的问题，为用户找到一组满足他们个性化兴趣的物品。推荐系统发展至今，人们已经提出了许多高效的算法和模型来解决推荐问题。传统推荐算法主要分为：协同过滤算法(CollaborativeFiltering)、基于内容的推荐(Content-based)、混合推荐。协同过滤算法考虑了用户的历史交互，并根据用户潜在的共同偏好进行推荐，取得了巨大的成功。然而，基于协同过滤的方法通常受到用户—项目交互的稀疏性和冷启动问题的影响。为了解决这些局限性，研究人员建议将辅助信息合并到协同过滤算法中，比如社交网络、用户/项目属性、图像和上下文。与协同过滤算法不同，基于内容的推荐算法利用特征表示性元数据来查找与用户历史评价的项目中类似项目，并相应地推荐它们。研究表明，将两种策略结合在一个混合推荐算法中，推荐质量可以得到改善。基于内容的算法需要获取项目的相关信息，以便对其相应的特性建模。在这个方向上，近年来知识图谱被广泛应用于表征、计算其相似性和相关性，以及为基于内容的推荐和混合推荐提供数据。知识图谱以关联开放数据(LOD)数据集的形式供大众免费获取使用，为知识感知的推荐系统在许多应用领域的发展铺平了道路。
技术实现思路
本专利技术提出了一种融合自动编码器和知识图谱语义信息的推荐方法，包括以下步骤：获取项目...

【技术保护点】
1.一种融合自动编码器和知识图谱语义信息的推荐方法，其特征在于，包括以下步骤：获取项目数据集，并对其进行预处理；所述项目数据集包括用户、主题、评分和项目名称；训练自动编码器，并利用训练后的自动编码器对预处理后的项目数据集进行训练，构建初始用户特征表示；利用word2vec模型训练后的数据获得用户的缺失主题的权重，计算用户特征的强化表示；从用户中任选一用户作为目标用户，基于用户特征的强化表示采用KNN算法获得与目标用户的相似用户进行推荐。

【技术特征摘要】
1.一种融合自动编码器和知识图谱语义信息的推荐方法，其特征在于，包括以下步骤：获取项目数据集，并对其进行预处理；所述项目数据集包括用户、主题、评分和项目名称；训练自动编码器，并利用训练后的自动编码器对预处理后的项目数据集进行训练，构建初始用户特征表示；利用word2vec模型训练后的数据获得用户的缺失主题的权重，计算用户特征的强化表示；从用户中任选一用户作为目标用户，基于用户特征的强化表示采用KNN算法获得与目标用户的相似用户进行推荐。2.根据权利要求1所述的融合自动编码器和知识图谱语义信息的推荐方法，其特征在于，所述预处理包括过滤无用数据，使用查询语句从知识库中获取项目的相关联主题。3.根据权利要求2所述的融合自动编码器和知识图谱语义信息的推荐方法，其特征在于，所述训练自动编码器包括以下步骤：使用矩阵M来训练自动编码器，其中的行和列分别代表项目名称i和特征f；其中aij∈M，计算自动编码器的隐藏层h和输出层o，具体计算公式为：h＝g(X×(W·M))o＝g(h×(R·MT))其中，g为Sigmoid函数，X是评分矩阵，W是输入层与隐藏层之间的权值矩阵，R是隐藏层与输出层之间的权值矩阵。4.根据权利要求3所述的融合自动编码器和知识图谱语义信息的推荐方法，其特征在于，所述将预处理后的项目数据集通过训练后的自动编码器训练后得到输出评分矩阵Y，具体训练步骤包括：所述用户用u表示；对W和R按照均方误差损失计算梯度E：其中xl为评分矩阵X中第l个评分，yl为输出评分矩阵Y中的第l个评分，l表示评分的个数，E是最小平方差损失函数；计算每个用户u的输入相关权重W′和输出相关权重R′，其计算公式如下：其中，r表示学习率；将同一用户评价的项目的相关联的主题作为特征f，计算同一用户对特征f的输入相关权重W′的累加值ω(f)，其公式如下：其中|In(f)|是进入特征f的隐藏节点的边集合，W′t(f)为与进入特征f相应隐藏节点的边的输入相关权重；所述构建初始用户特征表示，具体为：Q(u)＝{<f，ωu(f)>}其中，Q(u)表示初始用户特征表示，ωu(f)表示用户u对特征f的输入相关权重W′的累加值ω(f)。5.根据权利要求4所述的融合自动编码器和知识图谱语义信息的推荐方法，其特征在于，所述利用word2vec模型训练后的数据获得用户的缺失主题的权重，计算用户特征的强化表示包括以下步骤：计算标准...

【专利技术属性】
技术研发人员：陈涛，刘学军，孙鑫，
申请(专利权)人：南京工业大学，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人