一种基于自编码器的电影推荐方法技术

技术编号：35098465 阅读：36 留言：0更新日期：2022-10-01 17:03

本发明专利技术公开了一种基于自编码器的电影推荐方法，包括步骤S1：从互联网上公开的数据集中获取用户信息、电影信息和用户对电影的评分数据；步骤S2：对用户与电影的信息进行分类筛选，从评论中提取关键词，将信息划分为深层信息与浅层信息并保证每条数据占用适量的内存；步骤S3：对用户与电影的特征进行编码，将特征向量转化为特征值嵌入到评分矩阵中作为自编码器的输入数据；步骤S4：预设参数并对自编码器进行训练，通过得出的结果计算RMSE评价和MAE评价，利用结果反馈对参数进行调整并再次训练；在数据集中加入随机噪音，设置不同噪音率并基于RMSE评价的基础上进行比对，选择并确定最优噪音率；步骤S5：输出数据并依据预测评分进行top

全部详细技术资料下载

【技术实现步骤摘要】
一种基于自编码器的电影推荐方法

[0001]本专利技术涉及自编码器、推荐系统领域，特别涉及一种基于自编码器的电影推荐方法。

技术介绍

[0002]随着互联网的迅猛发展，大数据引起了越来越多的关注，面对海量的数据，如何更高效、更准确的将信息推荐给目标人群是必须要解决的一个难题，推荐系统在这种情况下应运而生。个性化的推荐系统从众多的数据与用户中提取特征，并对数据与用户进行分类，依据用户的行为日志分析用户的需求，将对应的内容推荐给用户。推荐系统能够为各种客户端提供更灵活、更方便的服务，实现“所得即所想”的概念。
[0003]基于协同过滤的推荐算法是传统推荐系统中应用较为广泛的算法之一。通过计算用户之间、推荐信息之间的特征与相似度进行推荐。自编码器技术是一种常用的深度学习神经网络模型。利用自编码器，可以将推荐系统中更复杂的高位数据纳入考虑，有效缓解传统协同过滤中存在的数据稀疏性、用户与推荐信息冷启动的问题。

技术实现思路

[0004]为了克服现有技术中的不足，本专利技术提供一种基于自编码器的电影推荐方法，能够解决评分矩阵稀疏性的问题。
[0005]为了达到上述专利技术目的，解决其技术问题所采用的技术方案如下：
[0006]一种基于自编码器的电影推荐方法，包括有以下步骤：
[0007]步骤S1：从互联网上公开的数据集中获取用户的信息、电影的信息以及用户对电影的评分数据；
[0008]步骤S2：对用户与电影的信息进行分类筛选，从评论中提取关键词，并将信息划分为深层信息与浅层

【技术保护点】

【技术特征摘要】
1.一种基于自编码器的电影推荐方法，其特征在于，包括有以下步骤：步骤S1：从互联网上公开的数据集中获取用户的信息、电影的信息以及用户对电影的评分数据；步骤S2：对用户与电影的信息进行分类筛选，从评论中提取关键词，并将信息划分为深层信息与浅层信息，并保证每条数据占用适量的内存；步骤S3：对用户与电影的特征进行编码，将特征向量转化为特征值嵌入到评分矩阵中作为自编码器的输入数据；步骤S4：预设参数并对自编码器进行训练，通过得出的结果计算RMSE评价以及MAE评价，利用结果反馈对参数进行调整并再次训练，以提升模型的准确度；参数包括学习率、隐藏层层数、隐藏层结构；在数据集中加入随机噪音，设置不同噪音率并基于RMSE评价的基础上进行比对，选择并确定最优噪音率以提升模型的鲁棒性；步骤S5：输出数据，并依据预测评分进行top
‑
n电影推荐。2.根据权利要求1所述的一种基于自编码器的电影推荐方法，其特征在于，步骤S3包括以下内容：将用户与电影的信息分别划分为浅层信息与深层信息，并分别输入不同的自编码器进行处理；用户的浅层信息包括用户ID、用户性别、用户年龄段和用户职业，其中，用户的年龄按年龄段划分区间类别，用户职业按照不同的职业类型划分，年龄与职业的字段均以编码形式存储；电影的浅层信息包括电影ID、电影名称、电影类型，其中，电影类型按照不同的电影大类别划分，电影类型以编码的形式进行存储；深层信息则包括用户对电影评论的关键字的提取，依据评论中用户的评论倾向分析用户对电影的实际满意程度，并打分。3.根据权利要求2所述的一种基于自编码器的电影推荐方法，其特征在于，定义包括用户性别、用户年龄段和用户职业的用户文本类型数据为定义包括电影名称、电影类型的项目文本类型数据为则浅层信息可表示...

【专利技术属性】
技术研发人员：于万钧，杨卉，
申请(专利权)人：上海应用技术大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人