【技术实现步骤摘要】
基于堆栈降噪编码器改进的协同过滤方法
本专利技术涉及推荐系统
,具体涉及一种基于堆栈降噪编码器改进的协同过滤方法。
技术介绍
近年来,随着云计算、大数据、物联网等技术的迅猛发展,互联网空间中各类应用的层出不穷引发了数据规模的爆炸式增长。大数据中蕴含着丰富的价值与巨大的潜力,将给人类社会带来变革性的发展,但同时也带来了严重“信息过载”问题,如何快速有效地从纷繁复杂的数据中获取有价值的信息成为了当前大数据发展的关键难题.推荐系统作为解决“信息过载”问题的有效方法,已经成为学术界和工业界的关注热点并得到了广泛应用,形成了众多相关研究成果。在推荐系统中最重要的就是推荐算法,最经典的推荐算法就是协同过滤。但是传统的协同过滤存在数据稀疏性和新用户,新物品的冷启动等问题,这就会使推荐质量不高,用户体验差。深度学习是机器学习的一个新领域,它能够将复杂的低层特征形成抽象的、精简的高层表示,其强大的学习方式和数据处理能力解决了很多识别方面的难题。在推荐系统领域中,可以利用深度学习对用户或者项目内容进行特征提取,再应用于协同过滤中。 ...
【技术保护点】
1.一种基于堆栈降噪编码器改进的协同过滤方法,其特征在于:包括以下步骤:/n步骤1:从实例数据集中提取用户的属性信息、项目的属性信息以及用户对项目的评分数据,通过用户的评分数据,建立评分矩阵,即用户评分矩阵;/n所述用户的属性信息包括用户的性别,年龄和职业;/n所述项目的属性信息包括项目的类型;/n步骤2:将所述评分矩阵分为用户评分矩阵和项目得分矩阵,将用户评分矩阵和用户属性信息矩阵拼接后得到用户信息矩阵,将项目得分矩阵和项目属性信息矩阵拼接后得到项目信息矩阵;/n所述用户信息矩阵,是对用户的年龄做离散化处理后,得到包括用户年龄,性别,职业的用户属性信息矩阵,再和用户的评分 ...
【技术特征摘要】
1.一种基于堆栈降噪编码器改进的协同过滤方法,其特征在于:包括以下步骤:
步骤1:从实例数据集中提取用户的属性信息、项目的属性信息以及用户对项目的评分数据,通过用户的评分数据,建立评分矩阵,即用户评分矩阵;
所述用户的属性信息包括用户的性别,年龄和职业;
所述项目的属性信息包括项目的类型;
步骤2:将所述评分矩阵分为用户评分矩阵和项目得分矩阵,将用户评分矩阵和用户属性信息矩阵拼接后得到用户信息矩阵,将项目得分矩阵和项目属性信息矩阵拼接后得到项目信息矩阵;
所述用户信息矩阵,是对用户的年龄做离散化处理后,得到包括用户年龄,性别,职业的用户属性信息矩阵,再和用户的评分矩阵拼接,得到用户的信息矩阵;
所述项目信息矩阵,具体统计每个项目的包含的类型,项目具有该属性则记为1,项目没有该属性则记为0,得到项目属性矩阵,再和项目的得分矩阵拼接,得到项目的信息矩阵;
步骤3:将得到的用户信息矩阵和项目信息矩阵分别输入到两个堆栈降噪自动编码器中,进行特征提取后分别得到用户和项目的隐表示,即用户和项目的低维度特征向量;
所述用户的低维度特征向量,是把用户的信息矩阵输入到堆栈降噪自动编码器中,对其逐层训练,调整参数,利用得到的参数计算第二个隐藏层的输出,即用户的低维度特征向量;
所述项目的低维度特征向量,是把项目的信息矩阵输入到堆栈降噪自动编码器中,对其逐层训练,调整参数,利用得到的参数计算第二个隐藏层的输出,即项目的低维度特征向量;
步骤4:利用用户和项目的低维度特征向量分别计算用户之间的相似度和项目之间的相似度,根据得到的相似度分别对用户相似度和项目相似度做评分预测;
步骤5:使用加权因子的变化控制用户和项目两种评分预测的比重来得到综合的评分预测,根据综合评分预测对项目进行降序排序,将排序后的项目集合中的前n个项目,即top-n推荐给用户。
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。