一种基于文本分析的推荐系统的推荐方法技术方案

技术编号：17780830 阅读：23 留言：0更新日期：2018-04-22 09:56

本发明专利技术公开了一种基于文本分析的推荐系统的推荐方法，属于数据科学领域。它包括以下步骤：1)对用户评论进行拆分，得到若干句子；2)对步骤S1所得句子进行拆分，得到若干词汇，再对词汇进行词性标注；3)对步骤S2词性标注后的词汇进行情感分析，计算每句的情感得分；4)提取步骤S1的句子中的人物对象和描述对象，根据人物对象、描述对象和情感得分构建键值对；5)将步骤S4所得键值对作为新的特征向量整合入基于协同过滤的推荐系统中，得出推荐结果并将推荐结果推荐给用户。本发明专利技术的优点是：通过对文本的分析、处理，结合推荐系统方法，可以有效地提高推荐系统模型的效率和价值。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于文本分析的推荐系统的推荐方法
本专利技术属于数据科学领域，具体涉及一种基于文本分析的推荐系统的推荐方法，尤其涉及自然语言处理和推荐系统。
技术介绍
随着信息技术和互联网的发展，人们逐渐从信息匮乏的时代走入了信息过载的时代，如何从大量信息中找到自己感兴趣的信息是一件非常困难的事情。推荐系统随之应运而生，旨在能够在用户没有明确目的的时候帮助他们发现感兴趣的新内容，从而实现个性化的定制服务。自然语言处理作为人工智能的一个重要分支，目的是建立能够理解语言的系统，也是近年来迅速发展的一个领域，在文本挖掘和文本分析方面已经得到了许多令人振奋的研究成果，目前在情感分析、人机交互、信息提取等场合都得到了非常重要的应用。在现有的推荐系统实现方法中，协同过滤是向人们推荐产品的最受欢迎和成功的方法之一，目前大部分的公司的推荐算法的基础都是该算法。协同过滤主要有两种执行的方法：基于用户的协同过滤系统和基于物品的协同过滤系统。前者通过利用用户的历史行为计算用户之间的兴趣相似度，找到和目标用户兴趣相似的用户集合，然后将其他相似用户所感兴趣的物品推荐给目标用户。而后者主要通过分析用户行为记录计算物品之间的相似度，给用户推荐那些和他们之前喜欢的物品相似的物品。近几年来，国内外学者对推荐系统进行了深入的研究，取得了丰硕的成果，包括对推荐系统结构和模型的讨论，提出新的方案，对现有的方案进行分析和改进等。然而推荐系统还存在以下的问题：(1)推荐系统主要通过用户对物品的星级评价来进行协同过滤的相似度计算，而许多用户往往会在交互活动结束之后放弃评价，这就会给推荐效果造成一定的影响。(2)在...
一种基于文本分析的推荐系统的推荐方法

【技术保护点】
一种基于文本分析的推荐系统的推荐方法，其特征在于，包括以下步骤：步骤S1：对用户评论进行拆分，得到若干句子；步骤S2：对步骤S1所得句子进行拆分，得到若干词汇，再对词汇进行词性标注；步骤S3：对步骤S2词性标注后的词汇进行情感分析，计算每句的情感得分；步骤S4：提取步骤S1的句子中的人物对象和描述对象，根据人物对象、描述对象和情感得分构建键值对；步骤S5：将步骤S4所得键值对作为新的特征向量整合入基于协同过滤的推荐系统中，得出推荐结果并将推荐结果推荐给用户。

【技术特征摘要】
1.一种基于文本分析的推荐系统的推荐方法，其特征在于，包括以下步骤：步骤S1：对用户评论进行拆分，得到若干句子；步骤S2：对步骤S1所得句子进行拆分，得到若干词汇，再对词汇进行词性标注；步骤S3：对步骤S2词性标注后的词汇进行情感分析，计算每句的情感得分；步骤S4：提取步骤S1的句子中的人物对象和描述对象，根据人物对象、描述对象和情感得分构建键值对；步骤S5：将步骤S4所得键值对作为新的特征向量整合入基于协同过滤的推荐系统中，得出推荐结果并将推荐结果推荐给用户。2.根据权利要求1所述的一种基于文本分析的推荐系统的推荐方法，其特征在于，本发明采用基于统计的分词方法进行词性标注，该方法运用二阶隐马尔科夫模型将一个被标注过的大型语料库训练出一个分词模型和一个词性标注模型。3.根据权利要求1和2所述的一种基于文本分析的推荐系统的推荐方法，其特征在于，所述步骤S3中，情感分析的具体步骤为：S3.1，将步骤S2词性标注后的词汇依次在词性标注模型进行逐个查找，对查找出来的情感词赋予相应的当前权值g；S3.2，对整句话的各个情感词的当前权值进行加权求和，得到整句话的情感得分gi。4.根据权利要求3所述的一种基于文本分析的推荐系统的推荐方法，其特征在于，步骤S3.1中，赋予当前权值的具体步骤为：S3.1.1，读取查找的情感词的极性，并赋予相应的基础权值g'；S3.1.2，记录下情感词前面的程度词，根据程度词语气大小赋予不同的权值m；S3.1.3，统计情感词前的否定词个数n；S3.1.4，计算该情感词的当前权值，计算公式为：g＝(-1)n*m*g'。5.根据权利要求1所述的一种基于文本分析的推荐系统的推荐方法，其特征在于，所述步骤S4中，构建键值对的步骤如下：S4.1，若描述对象存在或描述对象不存在且根据上下文能判断出描述对象，执行步骤S4.2；若描述对象不存在且根据上下文不能判断出描述对象，放弃对本句构建键值对；S4.2，若人物对象不存在，固定权值pi，pi＝0.5，...

【专利技术属性】
技术研发人员：高建彬，陈唯，
申请(专利权)人：电子科技大学，
类型：发明
国别省市：四川,51

全部详细技术资料下载我是这个专利的主人