一种基于深度学习的个性化文本推荐方法技术

技术编号：24331239 阅读：57 留言：0更新日期：2020-05-29 19:40

本发明专利技术涉及一种基于深度学习的个性化文本推荐方法，包括以下步骤：S1：用户浏览新闻的历史行为数据和文本数据预处理；S2：特征提取器建模，具体包括：S21：隐藏层设计；S22：输出层设计；S3：个性化推荐模型建模，具体包括：S31：一维卷积网络层设计；S32：分类输出层与损失函数设计。本发明专利技术有效的解决了操作数据稀疏性的问题，并且通过使用负采样技术增强了模型训练效率；引入浏览时长作为全局变量，通过最终的目的来优化编码效果；通过利用项目嵌入的编码方式，进而有效的解决了项目冷启动的问题；减少了深层结构，增加并行的层次结构，卷积层内权重共享，参数相对较少。

A personalized text recommendation method based on deep learning

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度学习的个性化文本推荐方法
本专利技术属于文本推荐
，涉及一种基于深度学习的个性化文本推荐方法。
技术介绍
推荐系统是人与信息的连接器，用以有的用户特征以及用户过往的交互去预测用户与信息内容未来可能的交互行为。推荐系统根据不同的用户的历史行为、用户的兴趣偏好或者用户的人口统计学特征来选择推荐算法，或建立推荐模型，使用推荐算法或模型来产生用户可能感兴趣的项目列表，并最终推送给用户。近些年，随着深度学习的研究不断发展，基于深度学习的推荐算法模型大量提出。基于深度学习的推荐模型具有许多优点：与线性模型不同，深度神经网络能够使用诸如relu、softmax、tanh等非线性激活函数对数据进行建模；深度神经网络能够从输入数据中有效地学习潜在的表示因子和高阶的特征交互，减轻了特征工程的工作，也可以有效的对稀疏数据进行重新编码和扩充；另外，深度神经网络在一些序列的模型任务中成果显著。在word2vec模型中，给定无标签序列数据的情况下，其可以为语料库中的数据个体产生一个能表达其序列含义的向量。该模型的核心思...

【技术保护点】
1.一种基于深度学习的个性化文本推荐方法，其特征在于：包括以下步骤：/nS1：用户浏览新闻的历史行为数据和文本数据预处理；/nS2：特征提取器建模，具体包括：/nS21：隐藏层设计；/nS22：输出层设计；/nS3：个性化推荐模型建模，具体包括：/nS31：一维卷积网络层设计；/nS32：分类输出层与损失函数设计。/n

【技术特征摘要】
1.一种基于深度学习的个性化文本推荐方法，其特征在于：包括以下步骤：
S1：用户浏览新闻的历史行为数据和文本数据预处理；
S2：特征提取器建模，具体包括：
S21：隐藏层设计；
S22：输出层设计；
S3：个性化推荐模型建模，具体包括：
S31：一维卷积网络层设计；
S32：分类输出层与损失函数设计。

2.根据权利要求1所述的基于深度学习的个性化文本推荐方法，其特征在于：步骤S1中，具体包括以下步骤：
S11：将数据集中的点击信息数据进行预处理操作，包括缺失值处理和异常值处理；
S12：按照每个用户分组形成用户浏览数据集、正采样和负采样数据集，所述正采样数据集：即该用户点击操作过的数据；所述负采样数据集：即用户从所有未点击过的数据中随机挑选出的数据；
S13：按照时间戳进行排序，数据只关注用户与新闻交互的隐形反馈，即只关心用户是否浏览了某篇新闻；在正采样数据集中对于每个用户都有其相应的用户浏览序列；
S14：对新闻浏览序列进行编码表示，被浏览位置使用独热码表示，使用与新闻数量相同维度的向量进行表示；对于每个点击位置，只激活新闻被点击相应位置的数据，即该位标1，其余位置为0；
S15：将点击序列信息编码后的向量，作为每个用户浏览序列中一个条目的数据。

3.根据权利要求1所述的基于深度学习的个性化文本推荐方法，其特征在于：在步骤S21中，将用户浏览数据集的one-hot编码输入后，在隐藏层中使用一个权重矩阵来对用户浏览序列信息编码向量降维，用于将高维稀疏向量映射到低维密集向量；权重矩阵的形式为m×n，其中m为稀疏向量的维度，n为密集向量的维度，且m大于n；隐藏层看作是重新对原始数据进行降维编码，而编码规则是通过在网络中训练权重而自动生成的。

4.根据权利要求1所述的基于深度学习的个性化文本推荐方法，其特征在于...

【专利技术属性】
技术研发人员：程克非，郭小勇，
申请(专利权)人：重庆邮电大学，
类型：发明
国别省市：重庆;50

全部详细技术资料下载我是这个专利的主人