一种基于文本分析的推荐系统的推荐方法技术方案

技术编号:17780830 阅读:23 留言:0更新日期:2018-04-22 09:56
本发明专利技术公开了一种基于文本分析的推荐系统的推荐方法,属于数据科学领域。它包括以下步骤:1)对用户评论进行拆分,得到若干句子;2)对步骤S1所得句子进行拆分,得到若干词汇,再对词汇进行词性标注;3)对步骤S2词性标注后的词汇进行情感分析,计算每句的情感得分;4)提取步骤S1的句子中的人物对象和描述对象,根据人物对象、描述对象和情感得分构建键值对;5)将步骤S4所得键值对作为新的特征向量整合入基于协同过滤的推荐系统中,得出推荐结果并将推荐结果推荐给用户。本发明专利技术的优点是:通过对文本的分析、处理,结合推荐系统方法,可以有效地提高推荐系统模型的效率和价值。

【技术实现步骤摘要】
一种基于文本分析的推荐系统的推荐方法
本专利技术属于数据科学领域,具体涉及一种基于文本分析的推荐系统的推荐方法,尤其涉及自然语言处理和推荐系统。
技术介绍
随着信息技术和互联网的发展,人们逐渐从信息匮乏的时代走入了信息过载的时代,如何从大量信息中找到自己感兴趣的信息是一件非常困难的事情。推荐系统随之应运而生,旨在能够在用户没有明确目的的时候帮助他们发现感兴趣的新内容,从而实现个性化的定制服务。自然语言处理作为人工智能的一个重要分支,目的是建立能够理解语言的系统,也是近年来迅速发展的一个领域,在文本挖掘和文本分析方面已经得到了许多令人振奋的研究成果,目前在情感分析、人机交互、信息提取等场合都得到了非常重要的应用。在现有的推荐系统实现方法中,协同过滤是向人们推荐产品的最受欢迎和成功的方法之一,目前大部分的公司的推荐算法的基础都是该算法。协同过滤主要有两种执行的方法:基于用户的协同过滤系统和基于物品的协同过滤系统。前者通过利用用户的历史行为计算用户之间的兴趣相似度,找到和目标用户兴趣相似的用户集合,然后将其他相似用户所感兴趣的物品推荐给目标用户。而后者主要通过分析用户行为记录计算物品之间的相似度,给用户推荐那些和他们之前喜欢的物品相似的物品。近几年来,国内外学者对推荐系统进行了深入的研究,取得了丰硕的成果,包括对推荐系统结构和模型的讨论,提出新的方案,对现有的方案进行分析和改进等。然而推荐系统还存在以下的问题:(1)推荐系统主要通过用户对物品的星级评价来进行协同过滤的相似度计算,而许多用户往往会在交互活动结束之后放弃评价,这就会给推荐效果造成一定的影响。(2)在电商平台的实际交易过程中,用户对一个商品打出比较差的星级,往往并不是用户对商品本身有什么不好的感觉,有可能是对店家,快递商等有不好的购物体验。因此这会对相似度的计算造成负面的影响。
技术实现思路
本专利技术的目的在于:提供一种基于文本分析的推荐系统的推荐方法,通过分析实际应用场景中的文本信息,对文本信息进行提取、处理,并利用推荐系统方法,提高推荐系统的精确度和召回率。本专利技术采用的技术方案如下:一种基于文本分析的推荐系统的推荐方法,包括以下步骤:步骤S1:对用户评论进行拆分,得到若干句子;步骤S2:对步骤S1所得句子进行拆分,得到若干词汇,再对词汇进行词性标注;步骤S3:对步骤S2词性标注后的词汇进行情感分析,计算每句的情感得分;步骤S4:提取步骤S1的句子中的人物对象和描述对象,根据人物对象、描述对象和情感得分构建键值对;步骤S5:将步骤S4所得键值对作为新的特征向量整合入基于协同过滤的推荐系统中,得出推荐结果并将推荐结果推荐给用户。进一步的,本专利技术采用基于统计的分词方法对词性进行标注,该方法运用二阶隐马尔科夫模型将一个被标注过的大型语料库训练出一个分词模型和一个词性标注模型。进一步的,所述步骤S3中,情感分析的具体步骤为:S3.1,将步骤S2词性标注后的词汇依次在词性标注模型进行逐个查找,对查找出来的情感词赋予相应的当前权值g;S3.2,对整句话的各个情感词的当前权值进行加权求和,得到整句话的情感得分gi。进一步的,步骤S3.1中,赋予权值的具体步骤为:S3.1.1,读取查找的情感词的极性,并赋予相应的基础权值g';S3.1.2,记录下情感词前面的程度词,根据程度词语气大小赋予不同的权值m;S3.1.3,统计情感词前的否定词个数n;S3.1.4,计算该情感词的当前权值,计算公式为:g=(-1)n*m*g'。进一步的,所述步骤S4中,根据人物对象、描述对象和情感得分构建键值对的步骤如下:S4.1,若描述对象存在或描述对象不存在且根据上下文能判断出描述对象,执行步骤S4.2;若描述对象不存在且根据上下文不能判断出描述对象,放弃对本句构建键值对;S4.2,若人物对象不存在,固定权值pi,pi=0.5,执行步骤S4.3;若人物对象存在,按照人际关系的亲密程度赋予不同的权值pi,执行步骤S4.3;S4.3,构建键值对,其中,键是描述对象,值是整句话的情感得分gi和权值pi的乘积。进一步的,所述步骤S5中,推荐系统包括基于用户的协同过滤系统或基于物品的协同过滤系统。进一步的,将步骤S5所得键值对作为新的特征向量整合入基于用户的协同过滤系统的步骤为:S5.1,根据描述对象的类别对各个用户簇分别计算用户间的情感相似度;S5.2,根据步骤S5.1得出的用户间的情感相似度筛选出可以用作参考的用户簇U;S5.3,选择用户簇U中的用户u1,筛选出用户簇U中每个用户情感评价最高的K件用户u1没有接触过的商品作为候选商品,对这些候选商品进行加权确定优先级;S5.4,从候选商品中找出优先级最高的商品推荐给用户u1。进一步的,步骤S5.1中,对评价了相同商品或类似商品的用户簇,用欧氏距离计算用户间的情感相似度:其中ui表示第i个用户,fi表示第i个用户的情感得分,sim(u1,u2)分数越大表示两个用户越相似;步骤S5.2中,通过滤波函数筛选出filter(u1,u2)值大于0.5的用户作参考的用户簇U,其中α为函数的曲线平滑程度,δ为函数的开启阈值;步骤S5.3中,根据公式q(m)=∑filter(u1,ui)×t(m,ui)确认候选商品的优先级,其中ui为所有购买过或评价过商品m的用户簇U中的用户,t(m,ui)表示协同过滤系统中用户ui对商品m的评价得分。进一步的,所述步骤S5中,将键值对整合入基于协同过滤的推荐系统中,为用户进行商品、店铺和快递服务三方面的相似度计算,并将计算结果加权到基于协同过滤的推荐系统中。综上所述,由于采用了上述技术方案,本专利技术的有益效果是:1、本专利技术中,利用用户反馈的数据,通过对数据进行分析、处理,利用推荐系统方法,达到了辅佐推荐系统算法的目的,提高被加强算法的精确度和召回率,可以使用在任何有文本型数据的推荐业务场景中。2、相比于星级评价,用户评论是主观性最强的反馈数据,分析用户评论可以有效地提高整个推荐系统模型的效率和价值。附图说明图1为本专利技术推荐系统辅助优化的流程图。图2为本专利技术句子拆分及词性标注的流程图。图3为本专利技术生成键值对的流程图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本专利技术,并不用于限定本专利技术。为了解决现有技术的缺陷,本专利技术提供了一种基于文本分析的推荐系统的推荐方法,具体实现步骤如下:步骤S1:对用户评论进行拆分,得到若干句子。步骤S2:对步骤S1所得句子进行拆分,得到若干词汇,再对词汇进行词性标注。词性标注的方法采用基于字符串匹配的分词方法、基于理解的分词方法或基于统计的分词方法,本专利技术选择使用基于统计的分词方法。在系统运行之前,运用二阶隐马尔科夫模型将一个被标注过的大型语料库训练出一个分词模型和一个词性标注模型,完成对句子的拆分和标注。如图2所示,其为本专利技术句子拆分及词性标注的流程图。对给定的一个句子,它的分词方法有如下的种类:……我们从中找出概率最大的那种分词方式然后对得到的这个分好词的句子进行词性标注,具体过程类似于分词操作,即是在一个句子的各种词性组合中找出概率最大的那个。例如的一种词性标注序列为:其中y的取值可本文档来自技高网
...
一种基于文本分析的推荐系统的推荐方法

【技术保护点】
一种基于文本分析的推荐系统的推荐方法,其特征在于,包括以下步骤:步骤S1:对用户评论进行拆分,得到若干句子;步骤S2:对步骤S1所得句子进行拆分,得到若干词汇,再对词汇进行词性标注;步骤S3:对步骤S2词性标注后的词汇进行情感分析,计算每句的情感得分;步骤S4:提取步骤S1的句子中的人物对象和描述对象,根据人物对象、描述对象和情感得分构建键值对;步骤S5:将步骤S4所得键值对作为新的特征向量整合入基于协同过滤的推荐系统中,得出推荐结果并将推荐结果推荐给用户。

【技术特征摘要】
1.一种基于文本分析的推荐系统的推荐方法,其特征在于,包括以下步骤:步骤S1:对用户评论进行拆分,得到若干句子;步骤S2:对步骤S1所得句子进行拆分,得到若干词汇,再对词汇进行词性标注;步骤S3:对步骤S2词性标注后的词汇进行情感分析,计算每句的情感得分;步骤S4:提取步骤S1的句子中的人物对象和描述对象,根据人物对象、描述对象和情感得分构建键值对;步骤S5:将步骤S4所得键值对作为新的特征向量整合入基于协同过滤的推荐系统中,得出推荐结果并将推荐结果推荐给用户。2.根据权利要求1所述的一种基于文本分析的推荐系统的推荐方法,其特征在于,本发明采用基于统计的分词方法进行词性标注,该方法运用二阶隐马尔科夫模型将一个被标注过的大型语料库训练出一个分词模型和一个词性标注模型。3.根据权利要求1和2所述的一种基于文本分析的推荐系统的推荐方法,其特征在于,所述步骤S3中,情感分析的具体步骤为:S3.1,将步骤S2词性标注后的词汇依次在词性标注模型进行逐个查找,对查找出来的情感词赋予相应的当前权值g;S3.2,对整句话的各个情感词的当前权值进行加权求和,得到整句话的情感得分gi。4.根据权利要求3所述的一种基于文本分析的推荐系统的推荐方法,其特征在于,步骤S3.1中,赋予当前权值的具体步骤为:S3.1.1,读取查找的情感词的极性,并赋予相应的基础权值g';S3.1.2,记录下情感词前面的程度词,根据程度词语气大小赋予不同的权值m;S3.1.3,统计情感词前的否定词个数n;S3.1.4,计算该情感词的当前权值,计算公式为:g=(-1)n*m*g'。5.根据权利要求1所述的一种基于文本分析的推荐系统的推荐方法,其特征在于,所述步骤S4中,构建键值对的步骤如下:S4.1,若描述对象存在或描述对象不存在且根据上下文能判断出描述对象,执行步骤S4.2;若描述对象不存在且根据上下文不能判断出描述对象,放弃对本句构建键值对;S4.2,若人物对象不存在,固定权值pi,pi=0.5,...

【专利技术属性】
技术研发人员:高建彬陈唯
申请(专利权)人:电子科技大学
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1