基于用户评论的深度情感分析和多源推荐视图融合的混合推荐方法技术

技术编号:19024280 阅读:59 留言:0更新日期:2018-09-26 19:17
本发明专利技术提出了一种基于用户评论的深度情感分析和多源推荐视图融合的混合推荐方法,包括如下步骤:S1,通过挖掘用户评论的情感倾向,实现基于用户综合评分的协同过滤推荐模型;S2,利用词向量和卷积神经网络实现对物品内容信息进行相似度计算;S3,利用协同训练的策略实现对多源推荐视图的融合,构建混合推荐模型。为利用用户评论等短文本信息挖掘情感倾向,解决用户评分的真实性问题提供解决方案;为解决对物品内容短文本描述的理解,多个视图的推荐模型的融合提供理论基础和技术手段。

【技术实现步骤摘要】
基于用户评论的深度情感分析和多源推荐视图融合的混合推荐方法
本专利技术涉及计算机领域,尤其涉及一种基于用户评论的深度情感分析和多源推荐视图融合的混合推荐方法。
技术介绍
在电子商务、社交网络以及共享经济高速发展的今天,发现用户的需求、了解用户的行为、并为用户筛选出最相关的信息和物品是互联网服务的一个核心环节。个性化推荐作为一种帮助用户快速搜寻有用信息的工具,越来越受到人们的青睐。传统的推荐算法通过根据用户对物品的评分进行协同过滤推荐。然而这种推荐方式受用户评分真实性的制约,依据用户评分产生推荐结果并不能准确地体现用户的偏好。通过比较用户评分和评论文本的情感倾向,指出用户评分并不能真实反映用户评论的情感倾向。现有技术对用户评分进行统计分析,发现用户对物品的评分比较随意、且评分等级分布极度不均衡;基于用户评论的个性化推荐被很多研究工作提及,但受文本挖掘和情感分析等技术的困扰,研究并不深入。物品内容的描述文本通常较短,无足够的信息量供机器进行统计推断。传统的自然言语处理技术(如词袋模型)将文本表示成一个W维的独热向量,但这种独热表示假设所有对象都是相互独立的,容易受到数据稀疏问题的影响。另一方面,由于评分(rating)相对于物品(item)的稀疏性,因此,基于模型的推荐通常缺乏足够的有标签数据。这就亟需本领域技术人员解决相应的技术问题。
技术实现思路
本专利技术旨在至少解决现有技术中存在的技术问题,特别创新地提出了一种基于用户评论的深度情感分析和多源推荐视图融合的混合推荐方法。为了实现本专利技术的上述目的,本专利技术提供了一种基于用户评论的深度情感分析和多源推荐视图融合的混合推荐方法,包括如下步骤:S1,通过挖掘用户评论的情感倾向,实现基于用户综合评分的推荐模型;S2,利用词向量和卷积神经网络实现对物品内容信息进行相似度计算;S3,利用协同训练策略实现对多源推荐视图的融合,构建混合推荐模型。所述的基于用户评论的深度情感分析和多源推荐视图融合的混合推荐方法,优选的,所述S1包括:S1-1,用户评论信息的呈现形式通常是关键词和短文本,利用Word2Vec对用户评论短文本进行分布式表征;S1-2,利用用户评论文本的词向量信息组建段落向量,从而实现基于段落向量的情感计算;S1-3,通过基于词向量(Word2Vec)和长短期记忆网络(LSTM)的情感计算,对用户评论的文本信息进行情感分析建模。所述的基于用户评论的深度情感分析和多源推荐视图融合的混合推荐方法,优选的,所述S1-1包括:A,从外部收集大规模的用户评论文本,利用word2vec中的Skip-Gram模型或CBOW模型训练词向量模型,将每个词表示成K维向量实数值;B,对于用户评论的短文本,在分词的基础上利用TF-IDF(词频-逆文档频率)算法抽取Top-N(前N个高频词)个词表示文本的情感,然后从词向量模型中查找得到每一个关键词的K维向量表示。所述的基于用户评论的深度情感分析和多源推荐视图融合的混合推荐方法,优选的,所述S1-2包括:在段落向量训练过程中,段落编码向量和词向量累加或者连接起来,作为输出层softmax的输入,利用梯度下降法训练新文档,直至收敛,从而得到文档的低维向量表示。在获得评论文本的段落向量(ParagraphVector)后,将利用SK-Learn中的SGDClassifier构建分类器模型,实现对情感评分等级的预测;在此基础上,结合用户对物品的原始评分Scoreo,将二者进行加权求和,就可得到用户对该物品的情感倾向的综合评分Scorec=αScorer+(1-α)Scoreo,其中α是权重因子。所述的基于用户评论的深度情感分析和多源推荐视图融合的混合推荐方法,优选的,所述S1-3包括:在用户评论的文本信息处理中,通常用的方法是循环神经网络(RNN);鉴于RNN在处理序过长序列时会导致优化时出现梯度消散的问题,本专利技术研究基于长短期记忆网络(LSTM)对用户评论的文本信息进行建模;本专利技术拟采用Word2Vec和LSTM对用户评论文本构建情感分类模型,实现对评论文本的评分等级的预测。所述的基于用户评论的深度情感分析和多源推荐视图融合的混合推荐方法,优选的,所述S2包括:S2-1,假设两个给定物品的短文本描述为第一短文本ParagraphA和第二短文本ParagraphB,其段落长度分别为m和n;S2-2,将ParagraphA和ParagraphB切割成3-Gram表达形式,于是短文本ParagraphA和ParagraphB就分别被切为;SetA={w1w2w3,w2w3w4,...,wm-2wm-1wm},SetB={w1w2w3,w2w3w4,...,wn-2wn-1wn};S2-3,将SetA和SetB中的每一个字w用词向量vec进行表示,然后加权平均作为该语言片段的向量,则SetA和SetB就能够表示为语言片段向量Set2VecA={vec1,vec2,...,vecm}和Set2VecB={vec1,vec2,...,vecn};S2-4,将Set2VecA的元素和Set2VecB的元素分别作为矩阵的行和列,组成一个m×n的矩阵,其中矩阵的每一个单元格用横纵坐标对应向量的相似度来填充,得到用户评论文本的相似度矩阵;在获得大量的基于词向量的用户评论相似度矩阵后,就能够利用卷积神经网络构建基于物品内容的相似度计算模型;将来自于相似物品集的物品文本描述构建的矩阵作为训练数据集的正例,将来自非相似物品集的物品文本描述构建的矩阵作为训练数据集的负例,组成整个神经网络模型的训练数据集。所述的基于用户评论的深度情感分析和多源推荐视图融合的混合推荐方法,优选的,所述S3包括:S3-1,在构建基于协同训练的混合推荐模型时,利用基于置信度估计与聚类分析的数据选择算法对数据进行过滤,然后利用贡献度计算方法选择对分类器结果贡献度大的样本加入迭代训练;S3-2,用平均绝对误差(MAE)对用户评分模型的性能进行评估,假定测试集中的用户u和物品i,rui是用户u对物品i的实际评分,而是预测评分,则MAE是定义为:综上所述,由于采用了上述技术方案,本专利技术的有益效果是:本专利技术的实施,为利用用户评论等短文本信息挖掘情感倾向,解决用户评分的真实性问题提供解决方案;为解决对物品内容短文本描述的理解,多个视图的推荐模型的融合提供理论基础和技术手段。本专利技术的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。附图说明本专利技术的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:图1是本专利技术总体设计流程图;图2是本专利技术用户评论的词向量分布式表征;图3是本专利技术基于Word2Vec和LSTM的情感分析模型;图4是基于词向量的用户评论相似度矩阵构建流程;图5是本专利技术基于协同训练的混合推荐预测模型。具体实施方式下面通过参考附图描述的实施例是示例性的,仅用于解释本专利技术,而不能理解为对本专利技术的限制。通过挖掘用户评论的情感倾向,实现基于用户综合评分的协同过滤推荐模型;利用词向量和神经网络实现对物品的内容信息建模;然后利用协同训练的策略实现对两种推荐模型的融合,构建混合推荐模型。总体设计路线如图1所示:基于用户评论情感分本文档来自技高网...

【技术保护点】
1.一种基于用户评论的深度情感分析和多源推荐视图融合的混合推荐方法,其特征在于,包括如下步骤:S1,通过挖掘用户评论的情感倾向,实现基于用户综合评分的推荐模型;S2,利用词向量和卷积神经网络实现对物品内容信息进行相似度计算;S3,利用协同训练策略实现对多源推荐视图的融合,构建混合推荐模型。

【技术特征摘要】
1.一种基于用户评论的深度情感分析和多源推荐视图融合的混合推荐方法,其特征在于,包括如下步骤:S1,通过挖掘用户评论的情感倾向,实现基于用户综合评分的推荐模型;S2,利用词向量和卷积神经网络实现对物品内容信息进行相似度计算;S3,利用协同训练策略实现对多源推荐视图的融合,构建混合推荐模型。2.根据权利要求1所述的基于用户评论的深度情感分析和多源推荐视图融合的混合推荐方法,其特征在于,所述S1包括:S1-1,用户评论信息的呈现形式通常是关键词和短文本,利用Word2Vec对用户评论短文本进行分布式表征;S1-2,利用用户评论文本的词向量信息组建段落向量,从而实现基于段落向量的情感计算;S1-3,通过基于词向量(Word2Vec)和长短期记忆网络(LSTM)的情感计算,对用户评论的文本信息进行情感分析建模。3.根据权利要求2所述的基于用户评论的深度情感分析和多源推荐视图融合的混合推荐方法,其特征在于,所述S1-1包括:A,从外部收集大规模的用户评论文本,利用word2vec中的Skip-Gram模型或CBOW模型训练词向量模型,将每个词表示成K维向量实数值;B,对于用户评论的短文本,在分词的基础上利用TF-IDF(词频-逆文档频率)算法抽取Top-N(前N个高频词)个词表示文本的情感,然后从词向量模型中查找得到每一个关键词的K维向量表示。4.根据权利要求2所述的基于用户评论的深度情感分析和多源推荐视图融合的混合推荐方法,其特征在于,所述S1-2包括:在段落向量训练过程中,段落编码向量和词向量累加或者连接起来,作为输出层softmax的输入,利用梯度下降法训练新文档,直至收敛,从而得到文档的低维向量表示。在获得评论文本的段落向量(ParagraphVector)后,将利用SK-Learn中的SGDClassifier构建分类器模型,实现对情感评分等级的预测;在此基础上,结合用户对物品的原始评分Scoreo,将二者进行加权求和,就可得到用户对该物品的情感倾向的综合评分Scorec=αScorer+(1-α)Scoreo,其中α是权重因子。5.根据权利要求2所述的基于用户评论的深度情感分析和多源推荐视图融合的混合推荐方法,其特征在于,所述S1-3包括:在用户评论的文本信息处理中,通常用的方法是循环神经网络(...

【专利技术属性】
技术研发人员:张宜浩朱小飞徐传运董世都
申请(专利权)人:重庆理工大学
类型:发明
国别省市:重庆,50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1