一种基于混合去噪自编码器的推荐方法和系统技术方案

技术编号:34838118 阅读:17 留言:0更新日期:2022-09-08 07:33
一种基于混合去噪自编码器的推荐方法和系统,通过将用户

【技术实现步骤摘要】
一种基于混合去噪自编码器的推荐方法和系统


[0001]本专利技术涉及推荐系统
,具体涉及一种基于混合去噪自编码器的推荐方法和系统。

技术介绍

[0002]推荐系统在电商平台、音乐平台和视频软件等各种人机交互系统中发挥着辅助用户决策和促进系统服务发展的关键性作用。一个性能出色的推荐算法不但可以为用户提供令其更加满意的用户体验,而且还能为商家企业等服务提供商带来巨大的经济收益。因此,提高推荐准确性变得尤为重要。传统推荐系统大都根据用户对各个项目进行评分得到的用户

项目评分数据来进行推荐,然而并不是每个用户都会给每个项目打分,因此用户

项目评分数据存在着严重的数据稀疏问题,如何解决此类问题已经成为当下推荐系统领域研究的工作重点。

技术实现思路

[0003]本专利技术提供一种基于混合去噪自编码器的推荐方法和系统,用于补全用户

项目评分数据中的缺失值以缓解数据稀疏问题。
[0004]根据第一方面,一种实施例中提供一种基于混合去噪自编码器的推荐方法,包括:
[0005]获取用户

项目评分数据;
[0006]将所述用户

项目评分数据输入预先训练好的生成对抗网络中以补全所述用户

项目评分数据中的缺失值;
[0007]对于每个用户,将其对各项目的评分值按从大到小的顺序排序以生成推荐列表;
[0008]输出所述推荐列表;
[0009]其中所述生成对抗网络包括生成器和判别器,所述生成器为一自编码器,所述生成对抗网络通过以下方式训练得到:
[0010]获取具有完备评分值的原始用户

项目评分数据;
[0011]在所述原始用户

项目评分数据中加入噪声以得到加噪用户

项目评分数据;
[0012]将所述原始用户

项目评分数据作为真实样本、将所述加噪用户

项目评分数据作为噪声样本,根据预设的目标函数进行训练,得到所述生成对抗网络。
[0013]一种实施例中,所述将所述原始用户

项目评分数据作为真实样本、将所述加噪用户

项目评分数据作为噪声样本,根据预设的目标函数进行训练,得到所述生成对抗网络,包括:
[0014]生成器训练步骤,固定所述判别器的参数,将所述加噪用户

项目评分数据输入所述生成器中以得到去噪用户

项目评分数据X
N
,将所述去噪用户

项目评分数据X
N
输入所述判别器中,根据预设的第一目标函数,通过反向传播算法更新所述生成器的参数,其中N表示所述自编码器的层数;
[0015]判别器训练步骤,固定所述生成器的参数,将所述加噪用户

项目评分数据输入所
述生成器中以得到去噪用户

项目评分数据X
N
,将所述去噪用户

项目评分数据X
N
和所述加噪用户

项目评分数据输入所述判别器中,根据预设的第二目标函数,通过反向传播算法更新所述判别器的参数;
[0016]交替执行所述生成器训练步骤和所述判别器训练步骤,直到所述第一目标函数和所述第二目标函数收敛。
[0017]一种实施例中,所述第一目标函数为:
[0018][0019]其中
[0020][0021]l
max
=X
N

X1,
[0022]D(X
N
)表示将所述去噪用户

项目评分数据X
N
输入所述判别器中得到的结果,E[
·
]表示期望值,X
N
~P
noisy
(X
N
)表示X
N
符合带噪信号分布,α和β为预设的系数,X1表示所述加噪用户

项目评分数据;
[0023]所述第二目标函数为:
[0024][0025]其中,X1~P
noisy
(X1)表示X1符合带噪信号分布,G(X1)表示将X1输入所述生成器得到的结果,D(X1,X
N
)表示将X1和X
N
输入所述判别器得到的结果,D(G(X1),X
N
)表示将G(X1)和X
N
输入所述判别器得到的结果。
[0026]一种实施例中,当所述第一目标函数和所述第二目标函数的值小于预设的收敛阈值时则判定所述第一目标函数和所述第二目标函数收敛。
[0027]一种实施例中,α和β的值分别为0.8和0.1。
[0028]一种实施例中,所述噪声为加性高斯噪声。
[0029]一种实施例中,所述自编码器的层数大于3。
[0030]根据第二方面,一种实施例中提供一种基于混合去噪自编码器的推荐系统,包括:
[0031]数据获取模块,用于获取用户

项目评分数据;
[0032]生成对抗网络,包括生成器和判别器,所述生成器为一自编码器,所述生成对抗网络与所述数据获取模块连接,用于从所述数据获取模块处获取所述用户

项目评分数据,通过计算补全所述用户

项目评分数据中的缺失值;
[0033]训练模块,用于进行训练以得到所述生成对抗网络;
[0034]推荐列表生成模块,与所述生成对抗网络连接,用于获取补全后的所述用户

项目评分数据,然后对于每个用户,将其对各项目的评分值按从大到小的顺序排序以生成推荐列表;
[0035]输出模块,与所述推荐列表生成模块连接,用于输出所述推荐列表;
[0036]其中所述训练模块包括:
[0037]训练数据获取单元,用于获取具有完备评分值的原始用户

项目评分数据;
[0038]加噪单元,分别与所述训练数据获取单元、所述生成对抗网络连接,用于在所述原始用户

项目评分数据中加入噪声以得到加噪用户

项目评分数据,并将所述加噪用户


目评分数据输入所述生成对抗网络中以进行训练;
[0039]优化器,用于将所述原始用户

项目评分数据作为真实样本、将所述加噪用户

项目评分数据作为噪声样本,根据预设的目标函数进行训练,得到所述生成对抗网络。
[0040]一种实施例中,所述优化器通过以下方式进行训练以得到所述生成对抗网络:
[0041]交替执行以下生成器训练步骤和判别器训练步骤,直到预设的第一目标函数和第二目标函数收敛:
[0042]生成器训练步骤本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于混合去噪自编码器的推荐方法,其特征在于,包括:获取用户

项目评分数据;将所述用户

项目评分数据输入预先训练好的生成对抗网络中以补全所述用户

项目评分数据中的缺失值;对于每个用户,将其对各项目的评分值按从大到小的顺序排序以生成推荐列表;输出所述推荐列表;其中所述生成对抗网络包括生成器和判别器,所述生成器为一自编码器,所述生成对抗网络通过以下方式训练得到:获取具有完备评分值的原始用户

项目评分数据;在所述原始用户

项目评分数据中加入噪声以得到加噪用户

项目评分数据;将所述原始用户

项目评分数据作为真实样本、将所述加噪用户

项目评分数据作为噪声样本,根据预设的目标函数进行训练,得到所述生成对抗网络。2.如权利要求1所述的推荐方法,其特征在于,所述将所述原始用户

项目评分数据作为真实样本、将所述加噪用户

项目评分数据作为噪声样本,根据预设的目标函数进行训练,得到所述生成对抗网络,包括:生成器训练步骤,固定所述判别器的参数,将所述加噪用户

项目评分数据输入所述生成器中以得到去噪用户

项目评分数据X
N
,将所述去噪用户

项目评分数据X
N
输入所述判别器中,根据预设的第一目标函数,通过反向传播算法更新所述生成器的参数,其中N表示所述自编码器的层数;判别器训练步骤,固定所述生成器的参数,将所述加噪用户

项目评分数据输入所述生成器中以得到去噪用户

项目评分数据X
N
,将所述去噪用户

项目评分数据X
N
和所述加噪用户

项目评分数据输入所述判别器中,根据预设的第二目标函数,通过反向传播算法更新所述判别器的参数;交替执行所述生成器训练步骤和所述判别器训练步骤,直到所述第一目标函数和所述第二目标函数收敛。3.如权利要求2所述的推荐方法,其特征在于,所述第一目标函数为:其中l
max
=X
N

X1,D(X
N
)表示将所述去噪用户

项目评分数据X
N
输入所述判别器中得到的结果,E[
·
]表示期望值,X
N
~P
noisy
(X
N
)表示X
N
符合带噪信号分布,α和β为预设的系数,X1表示所述加噪用户

项目评分数据;所述第二目标函数为:其中,X1~P
noisy
(X1)表示X1符合带噪信号分布,G(X1)表示将X1输入所述生成器得到的结
果,D(X1,X
N
)表示将X1和X
N
输入所述判别器得到的结果,D(G(X1),X
...

【专利技术属性】
技术研发人员:袁炜轩薛鹏周洋纲
申请(专利权)人:上海迥灵信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1