一种基于深度学习的商品推荐方法及系统技术方案

技术编号:15983607 阅读:36 留言:0更新日期:2017-08-12 05:54
本发明专利技术提供一种基于深度学习的商品推荐方法,包括以下步骤:S1:通过爬虫抓取商品的评论数据;S2:对评论数据进行数据预处理;S3:对数据进行特征提取;S4:对商品评论进行细粒度分析;S5:对商品评论进行量化打分;S6:结合协同过滤进行商品推荐。同时,本发明专利技术还提供了一种基于深度学习的商品推荐系统。相比于现有技术,本发明专利技术结合深度学习的方法对文本进行细化处理,并将其通过模糊隶属函数进行量化,可将用户的评论转化为对商品各项属性的打分情况,再结合协同过滤方法进行推荐,可达到较好的推荐效果。

【技术实现步骤摘要】
一种基于深度学习的商品推荐方法及系统
本专利技术涉及一种推荐方法,特别是一种基于深度学习的商品推荐方法及系统。
技术介绍
伴随着互联网的发展,电子商务作为新兴产业应运而生,电子商务把商品从实体店搬运到网络的虚拟环境中,使得用户足不出户就可以购物。虚拟购物的优势在于降低了卖家的成本,提高了买家的购物体验。但对于网络购物的用户来说,网络上纷繁多样的商品给挑选带来了麻烦。解决这一问题的方法就是使用推荐系统为用户做出个性化的物品推荐,也就是说可以通过分析用户以往购物的浏览、点击、购买,评论等行为以及用户自身的属性得出用户的潜在兴趣,从而将用户感兴趣的商品推荐给用户。个性化推荐的意义在于可以提高用户挑选商品的效率,对于电子商务网站而言,精准的个性化推荐可以提高用户行为的转化率,从而提高网站的收益。Amazon是电子商务领域运用推荐系统的代表,Amazon的前科学家GregLinden在他的博客中提到,2006年,推荐系统对Amazon的贡献额在35%左右。目前推荐系统在互联网上已经得到了广泛的应用,Netflix曾开出100万美元的奖金,奖励给能将其电影推荐精度提高10%的个人或者团队,除此以外,推荐系统应用的例子还有Google的新闻推荐、Delicious的网页推荐、Facebook的朋友推荐等。推荐系统可以分成三类:基于内容推荐、协同过滤推荐和基于内容和协同过滤的混合推荐。基于内容推荐是基于用户和物品的内容信息做出推荐,不需要用户对物品的评价,即用户行为,因此该方法没有冷启动和数据稀疏性问题。基于内容推荐的主要缺点是要求抽取的特征既要保证准确性又要有实际意义,通常情况下这是很难做到的。协同过滤推荐的基本原理是给目标用户推荐和其相似的用户喜好的物品或者给目标用户推荐和其以往有过行为的物品相似的物品。协同过滤的优点是能够共享他人的经验,从而能够避免基于内容推荐存在的内容分析不完全和不精确的问题,并且能够基于一些复杂的、难以表述的概念(如个人品味)进行过滤。但由于协同过滤方法依赖用户行为数据,因此存在冷启动和数据稀疏性问题。基于内容和协同过滤的混合推荐结合了上述两类推荐方法的优点,将内容和用户行为互相作为信息补充,从而降低了抽取所得特征的准确性对基于内容推荐的影响以及用户行为数据稀疏性对协同过滤推荐的影响。然而,大部分的推荐系统依赖于用户对项目的历史评分记录来预测新的商品的打分,但是针对一些商品,如酒店餐馆等的情况,用户只有对商品的点评记录,没有打分的情况则没有好的办法进行处理。
技术实现思路
本专利技术的目的在于克服现有技术的缺点与不足,提供了一种基于深度学习的商品推荐方法及系统。本专利技术通过以下的方案实现:一种基于深度学习的商品推荐方法,包括以下步骤:S1:通过爬虫抓取商品的评论数据;S2:对评论数据进行数据预处理;S3:对数据进行特征提取;S4:对商品评论进行细粒度分析;S5:对商品评论进行量化打分;S6:结合协同过滤进行商品推荐。作为本专利技术的进一步改进,所述步骤S2中,具体包括以下步骤:S21:对评论数据进行分词;S22:进行停用词过滤;S23:对词性进行标注。作为本专利技术的进一步改进,所述步骤S3具体为:通过词频分析工具统计商品评论语料中所有名词出现的频率。作为本专利技术的进一步改进,所述步骤S4中具体包括以下步骤:S41:对商品评论文本单词进行向量化;S42:通过深度递归网络的细粒度情感分析模型进行情感分析。作为本专利技术的进一步改进,所述步骤S5中具体为:构造矩阵将对应词语模糊量化和构造情感词语所对应的模糊集合,将商品评论转化为评分矩阵R[u][i],标志用户u对物品i的评分。本专利技术还提供了一种基于深度学习的商品推荐系统,其包括:数据抓取模块,用于通过爬虫抓取商品的评论数据;预处理模块,用于对评论数据进行数据预处理;特征提取模块,用于对数据进行特征提取;细粒度分析模块,用于对商品评论进行细粒度分析;量化打分模块,用于对商品评论进行量化打分;推荐模块,用于结合协同过滤进行商品推荐。作为本专利技术的进一步改进,所述预处理模块包括:分词子模块,用于对评论数据进行分词。停用词过滤子模块,用于进行停用词过滤。词性标注子模块,用于对词性进行标注。作为本专利技术的进一步改进,所述特征提取模块通过词频分析工具统计商品评论语料中所有名词出现的频率。作为本专利技术的进一步改进,所述细粒度分析模块包括:向量化子模块,用于对商品评论文本单词进行向量化;情感分析模块,用于通过深度递归网络的细粒度情感分析模型进行情感分析。作为本专利技术的进一步改进,所述量化打分模块通过构造矩阵将对应词语模糊量化和构造情感词语所对应的模糊集合,将商品评论转化为评分矩阵R[u][i],标志用户u对物品i的评分。相比于现有技术,本专利技术结合深度学习的方法对文本进行细化处理,并将其通过模糊隶属函数进行量化,可将用户的评论转化为对商品各项属性的打分情况,再结合协同过滤方法进行推荐,可达到较好的推荐效果。为了更好地理解和实施,下面结合附图详细说明本专利技术。附图说明图1是本专利技术的基于深度学习的商品推荐方法的步骤流程图。图2是本专利技术的商品评论文本的细粒度分析过程示意图。图3是递归自编码的神经网络结构图。图4是两类不同的样本数据示意图。图5是专利技术的基于深度学习的商品推荐系统的模块框图。图6是分词后的示意图。图7是宾馆餐饮特征和指示词的示意图。具体实施方式以下结合实施例及附图对本专利技术作进一步详细的描述,但本专利技术的实施方式不限于此。为了解决现有技术的缺陷,本专利技术提供了一种基于深度学习的商品推荐方法和系统。以下具体介绍本专利技术的技术方案:请参阅图1,其为本专利技术的基于深度学习的商品推荐方法的步骤流程图。本专利技术提供了一种基于深度学习的商品推荐方法,包括以下步骤:S1:通过爬虫抓取商品的评论数据。S2:对评论数据进行数据预处理。具体的,所述步骤S2中具体包括以下步骤:S21:对评论数据进行分词。S22:进行停用词过滤。S23:对词性进行标注。例如:针对宾馆,酒店,饭馆等的评论及打分通过爬虫抓取后进行预处理。具体可以采用中科院ICTCLAS开源项目软件对评论语料进行分词、停用词过滤词性标注。通过词性标注,可以判断评论语料的词性,帮助我们提取出产品特征和识别用户观点。S3:对数据进行特征提取,具体为:通过词频分析工具统计商品评论语料中所有名词出现的频率。例如,可以使用词频分析工具软件统计评论语料中所有名词出现的频率,抽取排名在100位之前的名词,人工判别其是否与商品如宾馆餐饮等有关。保留诸如“菜系”“地域”这些与宾馆餐饮有关的特征。在此基础上将这些特征分类,由此得到宾馆餐饮特征和指示词。S4:对商品评论进行细粒度分析。其中,在所述步骤S4中具体包括以下两个步骤:S41:对商品评论文本单词进行向量化;S42:通过深度递归网络的细粒度情感分析模型进行情感分析。请参阅图2,其为本专利技术的商品评论文本的细粒度分析过程示意图。在进行细粒度分析过程中,包括评论文本单词向量化和情感分析,具体的分析过程如下:(a)评论文本单词向量化面对非结构性评论文本,先将词汇进行向量化。建立词向量空间通过无监督语义Word2Vec模型进行训练。word2vec是以神经概率语言模型为基础。(b)基于深度递归网络的细粒度情感分析模型由上下文本文档来自技高网
...
一种基于深度学习的商品推荐方法及系统

【技术保护点】
一种基于深度学习的商品推荐方法,其特征在于:包括以下步骤:S1:通过爬虫抓取商品的评论数据;S2:对评论数据进行数据预处理;S3:对数据进行特征提取;S4:对商品评论进行细粒度分析;S5:对商品评论进行量化打分;S6:结合协同过滤进行商品推荐。

【技术特征摘要】
1.一种基于深度学习的商品推荐方法,其特征在于:包括以下步骤:S1:通过爬虫抓取商品的评论数据;S2:对评论数据进行数据预处理;S3:对数据进行特征提取;S4:对商品评论进行细粒度分析;S5:对商品评论进行量化打分;S6:结合协同过滤进行商品推荐。2.根据权利要求1所述基于深度学习的商品推荐方法,其特征在于:所述步骤S2中,具体包括以下步骤:S21:对评论数据进行分词;S22:进行停用词过滤;S23:对词性进行标注。3.根据权利要求1所述基于深度学习的商品推荐方法,其特征在于:所述步骤S3具体为:通过词频分析工具统计商品评论语料中所有名词出现的频率。4.根据权利要求1所述基于深度学习的商品推荐方法,其特征在于:所述步骤S4中具体包括以下步骤:S41:对商品评论文本单词进行向量化;S42:通过深度递归网络的细粒度情感分析模型进行情感分析。5.根据权利要求1所述基于深度学习的商品推荐方法,其特征在于:所述步骤S5中具体为:构造矩阵将对应词语模糊量化和构造情感词语所对应的模糊集合,将商品评论转化为评分矩阵R[u][i],标志用户u对物品i的评分。6.一种基于深度学习的商品推荐系统,其特征在...

【专利技术属性】
技术研发人员:刘道洋
申请(专利权)人:广州华企联信息科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1