一种基于知识图谱的个性化推荐方法技术

技术编号:19320555 阅读:30 留言:0更新日期:2018-11-03 10:59
本发明专利技术公开了一种基于知识图谱的个性化推荐方法,属于知识图谱及机器学习技术领域,包括以下步骤:步骤1.将知识图谱中的物品进行向量化得到向量集合D以及每个物品的量化值;步骤2.根据知识图谱得到的量化值计算其物品之间的物品语义相似度;步骤3.基于用户行为计算出用户历史交互数据中物品之间的物品交互相似度;步骤4.根据所述的物品语义相似度和物品交互相似度计算所有物品的物品融合相似度;步骤5.根据所述的物品融合相似度预测用户对未评价的物品的评分,并根据所述的评分为用户生成推荐列表。本发明专利技术通过将基于知识图谱的物品语义相似度与基于用户行为的物品相似度融合,从而提高了推荐系统的推荐效果。

A personalized recommendation method based on Knowledge Map

The invention discloses a personalized recommendation method based on knowledge atlas, which belongs to the field of knowledge atlas and machine learning technology. It includes the following steps: 1. Vectorization of items in knowledge atlas to get vector set D and quantified value of each item; 2. Calculating items according to quantified value obtained from knowledge atlas. Item semantic similarity between objects; Step 3. Item interaction similarity between objects in user history interactive data is calculated based on user behavior; Step 4. Item fusion similarity of all items is calculated according to the mentioned Item semantic similarity and Item interaction similarity; Step 5. Item fusion similarity prediction based on the said Item fusion similarity Users score the items that are not evaluated, and generate recommendation lists for users according to the ratings. The invention improves the recommendation effect of the recommendation system by fusing the semantic similarity of the object based on knowledge map and the similarity of the object based on user behavior.

【技术实现步骤摘要】
一种基于知识图谱的个性化推荐方法
本专利技术属于知识图谱及机器学习
,具体涉及一种基于知识图谱的个性化推荐方法。
技术介绍
随着信息科技的发展,网络信息数据呈现爆炸性的增长,人们在享受互联网信息交互带来的巨大便利时,也受到了一些问题的困扰,尤其是信息迷航和信息过载问题。信息迷航问题指用户在复杂的网络环境中收集信息时,往往会被一些无关的信息所吸引,迷失了信息查找的方向或者已经忘记了初期的学习目标。而信息过载问题指用户周围的信息已经超过了用户所能接受、处理和有效利用的范围,用户无法从大量的信息中发现自己感兴趣的信息。随着大数据时代的到来,网络信息数据呈现指数级的增长,而其中也充斥着大量的垃圾信息,这些信息是造成信息过载现象的诱因。推荐系统是一种能为用户提供有效信息服务的技术。推荐系统主要利用用户对物品的行为信息,挖掘出用户的个性化需求,通过用户的兴趣模型主动向用户提供满足其需求的信息。推荐系统因其能够挖掘用户兴趣的特点,已经成为了为用户提供个性化服务的一个重要研究领域,并得到了非常广泛的应用。目前,主流的个性化推荐算法主要分为基于内容的推荐算法和协同过滤的推荐算法。协同过滤的推荐算法包括基于物品的协同过滤和基于用户的协同过滤。此外,基于模型的推荐算法也属于协同过滤算法的范畴。其中,基于内容的过滤需要分析文件资源的描述,并分析每个用户的兴趣和偏好,从而建立起用户偏好模型。通过用户兴趣偏好模型向用户提供推荐服务,但是它是具有一定的局限性的。基于协同过滤的推荐系统主要依赖用户对物品的行为信息,来挖掘用户的兴趣。协同过滤算法由于对专家知识的依赖度低,且利用了群体智慧,因此得到了最为广泛和深入的研究,并且取得了出色的效果。但是,在商业推荐系统中用户和物品的数量往往十分庞大,并且用户能够接触到的物品数量十分有限,直接导致用户对物品的行为信息往往十分稀疏。这就导致了协同过滤算法的效果可能很差。现有的个性化推荐算法通常要么仅考虑了用户对物品的行为数据,要么仅考虑了物品的内容信息,要么在综合考虑用户对物品的行为数据和物品的内容的信息时,对物品的语义信息挖掘得不够充分,最终导致推荐的准确率低。
技术实现思路
本专利技术的目的在于:为解决基于物品的协同过滤算法没有考虑物品本身内容信息的缺陷而导致推荐准确率低的问题,提供了一种基于知识图谱的个性化推荐方法。本专利技术采用的技术方案如下:一种基于知识图谱的个性化推荐方法,包括以下步骤:步骤1.将知识图谱中的物品进行向量化得到向量集合D以及每个物品的量化值;步骤2.根据知识图谱得到的量化值计算其物品之间的物品语义相似度;步骤3.基于用户行为计算出用户历史交互数据中物品之间的物品交互相似度;步骤4.根据所述的物品语义相似度和物品交互相似度计算所有物品的物品融合相似度;步骤5.根据所述的物品融合相似度预测用户对未评价的物品的评分,并根据所述的评分为用户生成推荐列表。进一步地,步骤1中计算知识图谱中的物品的量化值的方法为:步骤1.1.将知识图谱中的头实体节点vh、与头实体节点vh有直接关系的尾实体节点vt和二者之间的关系r抽取为正例三元组(vh,r,vt);步骤1.2.基于负采样算法为知识图谱中关系r的正例三元组(vh,r,vt)生成负例三元组(vh',r,vt'),其中vh'表示负例头实体节点,vt'表示负例尾实体节点,r表示知识图谱中的关系r;步骤1.3.根据所述的正例三元组和负例三元组训练得到物品的量化值。进一步地,步骤1.2包括以下步骤:步骤1.2.1.针对知识图谱中每一个关系r对应的所有正例三元组H,统计所有正例三元组H中每种头实体节点对应的尾实体节点的数量Q1,并根据数量Q1计算所涉及到的每个头实体节点的尾平均值Ntph;统计所有正例三元组H中每种尾实体节点对应的头实体节点的数量Q2,并根据数量Q2计算所涉及到的每个尾实体节点的头平均值Nhpt;步骤1.2.2.根据尾平均值Ntph和头平均值Nhpt计算概率p;其中,概率p的计算公式为p=Ntph/(Ntph+Nhpt);步骤1.2.3.从所有正例三元组H中随机选取一个与当前所在位置不同的头实体节点或尾实体节点,并替换正例三元组中对应位置的头实体节点或尾实体节点,替换后即为负例三元组(vh',r,vt');其中,进行头实体节点替换的概率为p,进行尾实体节点替换的概率为1-p。进一步地,步骤2基于知识图谱计算物品的物品语义相似度的具体步骤为:步骤2.1.从所述的向量集合D中选取物品i的物品语义向量di;步骤2.2.从向量集合D中再另选取物品j的物品语义向量dj;步骤2.3.计算物品语义向量di和物品语义向量dj之间的物品语义相似度,并对计算出的物品语义相似度进行归一化处理;步骤2.4.重复步骤2.2-2.3,直至计算完物品i与向量集合D中其它所有物品之间的物品语义相似度;步骤2.5.重复步骤2.1-2.4,直至计算完向量集合D中所有物品之间的物品语义相似度。进一步地,步骤3计算基于用户行为的物品交互相似度的具体步骤如下:步骤3.1.根据用户历史交互数据组建交互数据集合G;步骤3.2.从交互数据集合G中选取物品i的物品交互向量gi;步骤3.3.从交互数据集合G中再选取物品j的物品交互向量gj;步骤3.4.计算物品交互向量gi和物品交互向量gj之间的物品交互相似度;步骤3.5.重复步骤3.3-3.4,直至计算完物品i与交互数据集合G中其它所有物品之间的物品交互相似度;步骤3.6.重复步骤3.2-3.5,直至计算完交互数据集合G中所有物品之间的物品交互相似度。进一步地,步骤4根据物品语义相似度和物品交互相似度计算物品融合相似度的方法为:将物品语义相似度和物品交互相似度以一定比例进行融合得到物品融合相似度;将每个物品与其它物品的物品融合相似度进行降序排序,得到每个物品对应的物品融合相似集合。进一步地,步骤5为用户生成推荐列表的具体步骤为:步骤5.1.根据物品融合相似度和物品综合评分数据预测目标用户u对未评分的商品i的评分wui,其中,物品综合评分数据表示已有的用户对物品的评分数据;步骤5.2.根据得到的评分wui进行降序排列形成推荐列表;步骤5.3.将推荐列表中的前N个物品推荐给目标用户u;步骤5.4.重复步骤5.1-5.3,直至为所有的用户生成推荐列表。进一步地,步骤5.1中评分wui计算公式为:其中,Sij表示物品i和物品j的物品融合相似度,Rij表示已有的评分数据中目标用户u对物品i的评分,N(u)表示用户u已评分的物品的集合,S(i,k)表示物品i的物品融合相似集合中前k个物品的集合。综上所述,由于采用了上述技术方案,本专利技术的有益效果是:1、本专利技术中,将知识图谱中物品的向量化表示方法和协同过滤算法结合,利用知识图谱中丰富物品语义信息,弥补基于物品的协同过滤算法没有考虑物品本身内容信息的缺陷,从多维角度刻画物品相似度,提高了个性化推荐的准确度和用户体验。2、本专利技术中,利用知识图谱中丰富的实体及实体之间的关系知识,通过一种向量化表示方法将其嵌入到一个连续的低维空间中,同时保留了图谱中的部分语义信息,使得基于内容的物品相似度更加准确。3、本专利技术中,在从知识图谱中抽取物品的三元组时,仅选取与所需推荐的物品有一度关系的三元组,在保留物品本文档来自技高网
...

【技术保护点】
1.一种基于知识图谱的个性化推荐方法,其特征在于,包括以下步骤:步骤1.将知识图谱中的物品进行向量化得到向量集合D以及每个物品的量化值;步骤2.根据知识图谱得到的量化值计算其物品之间的物品语义相似度;步骤3.基于用户行为计算出用户历史交互数据中物品之间的物品交互相似度;步骤4.根据所述的物品语义相似度和物品交互相似度计算所有物品的物品融合相似度;步骤5.根据所述的物品融合相似度预测用户对未评价的物品的评分,并根据所述的评分为用户生成推荐列表。

【技术特征摘要】
1.一种基于知识图谱的个性化推荐方法,其特征在于,包括以下步骤:步骤1.将知识图谱中的物品进行向量化得到向量集合D以及每个物品的量化值;步骤2.根据知识图谱得到的量化值计算其物品之间的物品语义相似度;步骤3.基于用户行为计算出用户历史交互数据中物品之间的物品交互相似度;步骤4.根据所述的物品语义相似度和物品交互相似度计算所有物品的物品融合相似度;步骤5.根据所述的物品融合相似度预测用户对未评价的物品的评分,并根据所述的评分为用户生成推荐列表。2.根据权利要求1所述的一种基于知识图谱的个性化推荐方法,其特征在于,步骤1中计算知识图谱中的物品的量化值的方法为:步骤1.1.将知识图谱中的头实体节点vh、与头实体节点vh有直接关系的尾实体节点vt和二者之间的关系r抽取为正例三元组(vh,r,vt);步骤1.2.基于负采样算法为知识图谱中关系r的正例三元组(vh,r,vt)生成负例三元组(vh',r,vt'),其中vh'表示负例头实体节点,vt'表示负例尾实体节点,r表示知识图谱中的关系r;步骤1.3.根据所述的正例三元组和负例三元组训练得到物品的量化值。3.根据权利要求2所述的一种基于知识图谱的个性化推荐方法,其特征在于,步骤1.2包括以下步骤:步骤1.2.1.针对知识图谱中每一个关系r对应的所有正例三元组H,统计所有正例三元组H中每种头实体节点对应的尾实体节点的数量Q1,并根据数量Q1计算所涉及到的每个头实体节点的尾平均值Ntph;统计所有正例三元组H中每种尾实体节点对应的头实体节点的数量Q2,并根据数量Q2计算所涉及到的每个尾实体节点的头平均值Nhpt;步骤1.2.2.根据尾平均值Ntph和头平均值Nhpt计算概率p;其中,概率p的计算公式为p=Ntph/(Ntph+Nhpt);步骤1.2.3.从所有正例三元组H中随机选取一个与当前所在位置不同的头实体节点或尾实体节点,并替换正例三元组中对应位置的头实体节点或尾实体节点,替换后即为负例三元组(vh',r,vt');其中,进行头实体节点替换的概率为p,进行尾实体节点替换的概率为1-p。4.根据权利要求1所述的一种基于知识图谱的个性化推荐方法,其特征在于,步骤2基于知识图谱计算物品的物品语义相似度的具体步骤为:步骤2.1.从所述的向量集合D中选取物品i的物品语义向量di;步骤...

【专利技术属性】
技术研发人员:屈鸿陈文宇王一鸣刘洋军邓悟舒杨沈晓峰
申请(专利权)人:电子科技大学
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1