基于评论和物品描述的深度学习推荐方法及系统技术方案

技术编号:29703471 阅读:11 留言:0更新日期:2021-08-17 14:31
本发明专利技术属于推荐算法技术领域,特别涉及一种基于评论和物品描述的深度学习推荐方法及系统,获取用于深度学习训练的数据样本,该数据样本包含用户集合、物品集、物品评论文本及物品描述数据;构建用于通过深度学习来获取用户对物品预测打分数据的推荐网络模型,通过输入与用户有关的所有物品描述数据、每个物品所收到的评论文本、及物品描述数据,并结合每个物品对用户关联程度进行模型训练;通过数据样本对推荐网络模型进行训练优化;利用优化后的推荐网络模型来获取目标区域内用户对物品的预测打分。本发明专利技术将物品描述数据和物品评论文本相结合,获取更为准确的用户预测打分结果,提升推荐精确度。

【技术实现步骤摘要】
基于评论和物品描述的深度学习推荐方法及系统
本专利技术属于推荐算法
,特别涉及一种基于评论和物品描述的深度学习推荐方法及系统。
技术介绍
近些年,深度学习在自然语言处理、计算机视觉等领域的成功,使得推荐领域开始注意到这个强大的工具,学者们开始探索利用深度学习方法来改善目前推荐系统一些难以被克服的弱点,如数据稀疏、冷启动、可解释性差等问题。如叠式降噪自编码器(SDAE)从稀疏的用户-项目矩阵中提取有用的低维特征并用于计算用户相似度,最后实现精确地Top-n推荐;协同深度学习(CDL)使用SDAE作为其特征学习组件,同时从内容中提取有效的深度特征表示以及从项目(和用户)之间捕获相似性和隐式关系,紧密耦合了内容和评级信息,有效缓解了低鲁棒性和数据稀疏问题;特别是CNN和RNN的出现更是在很多NLP任务中取得了巨大成功。注意力机制的关键就是去学习一个权重来标识重要程度,被提出来后被广泛的应用于自然语言处理,在机器翻译、阅读理解、语音识别等领域都取得了最先进的结果。自然语言处理(NaturalLanguageProcessing,NLP)的发展对评论文本在推荐领域的应用有很大的促进作用。现有中,往往通过采集用户评论及购买历史来实现推荐算法,每一个用户都会购买很多商品,并对许多商品进行评论,对于一个新的物品,还没有或者很少被购买和评价,若只利用评论文本或购买历史,没有重视物品本身描述文档,往往会影响实际运用中的推荐效果。
技术实现思路
为此,本专利技术提供一种基于评论和物品描述的深度学习推荐方法及系统,将物品描述和物品评论相结合,获取更为准确的用户预测打分结果,提升推荐精度。按照本专利技术所提供的设计方案,提供一种基于评论和物品描述的深度学习推荐方法,包含如下内容:获取用于深度学习训练的数据样本,该数据样本包含用户集合、物品集合、每个用户对物品的评论文本及物品描述数据;构建用于通过深度学习来获取用户对物品预测打分数据的推荐网络模型,通过输入与用户有关的所有物品描述数据、每个物品所收到的评论数据及物品描述数据,并结合关联程度进行模型训练;利用数据样本对推荐网络模型进行训练优化;通过优化后的推荐网络模型来获取目标区域内用户对物品的预测打分。作为本专利技术基于评论和物品描述的深度学习推荐方法,进一步地,推荐网络模型采用由编码模块和LSTM网络组成的DSMR模型结构,其中,编码模块包含利用词向量对用户相关的物品描述数据及每个物品评论数据进行嵌入向量表示的编码模块及用于利用词向量对物品评论数据进行隐表示的再编码模块,利用LSTM网络学习编码模块输出的词嵌入向量和再编码模块输出的隐表示向量中用户兴趣随时间的变化,最后利用两向量点积操作来获取用户对物品打分数据。作为本专利技术基于评论和物品描述的深度学习推荐方法,进一步地,推荐网络模型包含并行执行的用户模块和物品模块,及将用户模块和物品模块两者输出进行点积运算的预测模块,其中,用户模块用于通过与用户相关的物品描述数据及每个物品所收到的评论数据生成用户相关物品描述嵌入向量,物品模块用于通过物品评论数据及物品描述数据获取物品相关评论隐表示。作为本专利技术基于评论和物品描述的深度学习推荐方法,进一步地,物品描述数据通过词向量预训练后得到物品描述词向量表示,将各词向量相加;将物品各条评论经过词向量预训练后得到各条评论隐表示,将各隐表示相加,合并词向量相加结果和隐表示相加结果后得到表示物品特征的物品嵌入向量;将用户嵌入向量映射到物品嵌入向量空间中并通过点积运算获取用户与物品特征的关联程度,对关联程度进行归一化并利用LSTM网络学习用户随时间产生兴趣迁移,获取用户模型输出向量。作为本专利技术基于评论和物品描述的深度学习推荐方法,进一步地,用户与物品特征的关联程度计算公式表示为其中,Uu表示用户嵌入向量,表示物品嵌入向量,n表示用户评论过所有物品个数,u为总的用户数量;用户模型输出向量表示为:作为本专利技术基于评论和物品描述的深度学习推荐方法,进一步地,物品所收到的所有评论数据经词向量预训练后得到评论隐表示,将各隐表示相加;将物品描述数据经词向量预训练后得到物品描述词向量表示,将各词向量相加;合并隐表示相加结果和词向量相加结果后并利用点积运算获取物品评论与物品描述关联程度,对关联程度进行归一化并利用LSTM网络学习物品评论随时间产生兴趣迁移,获取物品模型输出向量。作为本专利技术基于评论和物品描述的深度学习推荐方法,进一步地,物品模型的输出向量表示为:其中,Rs表示物品收到的所有评论,m为评论个数,αs表示物品评论与物品描述关联程度。作为本专利技术基于评论和物品描述的深度学习推荐方法,进一步地,推荐网络模型输出的预测评分表示为其中,表示为物品模型的输出向量,表示为用户模型输出向量。作为本专利技术基于评论和物品描述的深度学习推荐方法,进一步地,推荐网络模型训练中,利用训练集M样本数据中用户对物品的预测评分和真实评分来最小化目标函数,其中,目标函数表示为表示为用户u对物品i的预测评分,rui表示对应的真实评分。进一步地,本专利技术还提供一种基于评论和物品描述的深度学习推荐系统,包含:数据处理模块、模型构建模块和训练预测模块,其中。数据处理模块,用于获取用于深度学习训练的数据样本,该数据样本包含用户集合、物品集合、每个用户对物品的评论文本及物品描述数据;模型构建模块,用于构建用于通过深度学习来获取用户对物品预测打分数据的推荐网络模型,通过输入与用户有关的所有物品描述数据、每个物品所收到的评论数据及物品描述数据,并结合关联程度进行模型训练;训练预测模块,用于利用数据样本对推荐网络模型进行训练优化;通过优化后的推荐网络模型来获取目标区域内用户对物品的预测打分。本专利技术的有益效果:本专利技术将用户对物品的评论数据和物品描述数据相结合,可以更加全面的辅助推荐模型训练学习,不同于传统的从左到右或从右到左来进行预训练的语言模型,采用双向语言模型BERT利用Transformer的Encoder一次性读取整体数据,同一个单词在不同的句子中可能会有不同的语义,能够基于单词的两侧进行学习,从而较为准确的把握单词在句子中所表达的含义,泛化能力强,能够获取较为准确的用户预测打分结果,提升推荐精度,具有较好的应用前景。附图说明:图1为实施例中基于评论和物品描述的深度学习推荐方法流程示意;图2为实施例中DSMR推荐网络模型结构示意;图3为实施例中模型编码模块结构示意。具体实施方式:为使本专利技术的目的、技术方案和优点更加清楚、明白,下面结合附图和技术方案对本专利技术作进一步详细的说明。本专利技术实施例,提供一种基于评论和物品描述的深度学习推荐方法,参见图1所示,包含如下内容:S101、获取用于深度学习训练的数据样本,该数据样本包含用户集合、物品集合、每个用户对物品的评论文本及物品描述数据;S102、构建用于通过深度学习来获取用户对物品预测打分数据的推荐网络模型,通过输入与用户有关的所本文档来自技高网...

【技术保护点】
1.一种基于评论和物品描述的深度学习推荐方法,其特征在于,包含如下内容:/n获取用于深度学习训练的数据样本,该数据样本包含用户集合、物品集合、每个用户对物品的评论文本及物品描述数据;/n构建用于通过深度学习来获取用户对物品预测打分数据的推荐网络模型,通过输入与用户有关的所有物品描述数据、每个物品所收到的评论数据及物品描述数据,并结合关联程度进行模型训练;/n利用数据样本对推荐网络模型进行训练优化;通过优化后的推荐网络模型来获取目标区域内用户对物品的预测打分。/n

【技术特征摘要】
1.一种基于评论和物品描述的深度学习推荐方法,其特征在于,包含如下内容:
获取用于深度学习训练的数据样本,该数据样本包含用户集合、物品集合、每个用户对物品的评论文本及物品描述数据;
构建用于通过深度学习来获取用户对物品预测打分数据的推荐网络模型,通过输入与用户有关的所有物品描述数据、每个物品所收到的评论数据及物品描述数据,并结合关联程度进行模型训练;
利用数据样本对推荐网络模型进行训练优化;通过优化后的推荐网络模型来获取目标区域内用户对物品的预测打分。


2.根据权利要求1所述的基于评论和物品描述的深度学习推荐方法,其特征在于,推荐网络模型采用由编码模块和LSTM网络组成的DSMR模型结构,其中,编码模块包含利用词向量对用户相关的物品描述数据及每个物品评论数据进行嵌入向量表示的编码模块及用于利用词向量对物品评论数据进行隐表示的再编码模块,利用LSTM网络学习编码模块输出的词嵌入向量和再编码模块输出的隐表示向量中用户兴趣随时间的变化,最后利用两向量点积操作来获取用户对物品打分数据。


3.根据权利要求1所述的基于评论和物品描述的深度学习推荐方法,其特征在于,推荐网络模型包含并行执行的用户模块和物品模块,及将用户模块和物品模块两者输出进行点积运算的预测模块,其中,用户模块用于通过与用户相关的物品描述数据及每个物品所收到的评论数据生成用户相关物品描述嵌入向量,物品模块用于通过物品评论数据及物品描述数据获取物品相关评论隐表示。


4.根据权利要求3所述的基于评论和物品描述的深度学习推荐方法,其特征在于,物品描述数据通过词向量预训练后得到物品描述词向量表示,将各词向量相加;将物品各条评论经过词向量预训练后得到各条评论隐表示,将各隐表示相加,合并词向量相加结果和隐表示相加结果后得到表示物品特征的物品嵌入向量;将用户嵌入向量映射到物品嵌入向量空间中并通过点积运算获取用户与物品特征的关联程度,对关联程度进行归一化并利用LSTM网络学习用户随时间产生兴趣迁移,获取用户模型输出向量。


5.根据权利要求4所述的基于评论和物品描述的深度学习...

【专利技术属性】
技术研发人员:刘晓楠王美玲尹美娟乔猛荆丽娜宋慧超江舵安家乐何明柳欢欢谢浩山赵晨言
申请(专利权)人:中国人民解放军战略支援部队信息工程大学
类型:发明
国别省市:河南;41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1