特征向量计算方法及装置制造方法及图纸

技术编号:14860828 阅读:57 留言:0更新日期:2017-03-19 13:55
本发明专利技术公开了一种特征向量计算方法及装置,属于物品推荐领域。所述方法包括:使用物品i代表喜欢物品i的一类用户,构建评分矩阵中的行,使用物品j构建评分矩阵中的列,使用物品i与物品j之间的相似度代表喜欢物品i的一类用户对物品j的评分,构建评分矩阵中的矩阵元素,根据目标函数对评分矩阵进行矩阵分解,得到第一矩阵和第二矩阵;第一矩阵包括:每类用户的特征向量,第二矩阵包括:每种物品的特征向量;解决了相关技术中使用用户构建评分矩阵的行,由于用户数量庞大而使矩阵分解难以完成的问题;达到了使用物品代替一类用户构成评分矩阵的行,减少评分矩阵中的矩阵元素个数,减少了矩阵分解过程中的计算量的效果。

【技术实现步骤摘要】

本专利技术实施例涉及物品推荐领域,特别涉及一种特征向量计算方法及装置
技术介绍
歌曲推荐过程中需要使用歌曲的特征向量。特征向量是用于表示物品特征的向量。歌曲的特征向量需要预先计算得到。矩阵分解方法是用于计算歌曲的特征向量的一种准确率很高的计算方法。矩阵分解方法需要构建用户与歌曲之间的N*M评分矩阵。M=w11......w1m..................wn1......wnm]]>其中,该评分矩阵中的每一行对应一个用户,每一列对应一首歌曲。wij表示第i个用户对第j个物品的评分值。利用矩阵分解方法,能够将N*M评分矩阵分解为N*K矩阵和K*M矩阵。该N*K矩阵和K*M矩阵是使目标函数最小化时的矩阵分解结果。w11......w1m..................wn1......wmn≈u11......u1k..................un1......unk*v11......v1m..................vk1......vkm]]>其中,N*K矩阵中的第i行元素构成了第i个用户的特征向量,K*M矩阵中的第j列元素构成了第j个用户的特征向量。在实现本专利技术实施例的过程中,专利技术人发现现有技术至少存在以下问题:由于音乐播放器的用户数量可能达到亿级,上述的N*M评分矩阵也会达到亿级,导致矩阵分解过程的计算量太大,计算资源有限时难以完成该矩阵分解过程。
技术实现思路
为了解决用户数量太大使矩阵分解难以完成的问题,本专利技术实施例提供了一种特征向量计算方法及装置。所述技术方案如下:根据本公开实施例的第一方面,提供一种特征向量计算方法,该方法包括:使用物品i代表喜欢物品i的一类用户,构建评分矩阵中的行;使用物品j构建评分矩阵中的列;使用物品i与物品j之间的相似度代表喜欢物品i的一类用户对物品j的评分,构建评分矩阵中的矩阵元素;根据目标函数对评分矩阵进行矩阵分解,得到第一矩阵和第二矩阵;第一矩阵包括每类用户的特征向量,第二矩阵包括:每种物品的特征向量。可选的,使用物品i与物品j之间的相似度代表喜欢物品i的一类用户对物品j的评分,构建评分矩阵中的矩阵元素,包括:计算物品i与物品j之间的相似度;使用相似度代表喜欢物品i的一类用户对物品j的评分,作为评分矩阵中的矩阵元素Wij的取值。可选的,计算物品i与物品j之间的相似度,包括:计算物品j相对于物品i的置信度,将置信度作为物品i与物品j之间的相似度。可选的,计算物品j相对于物品i的置信度,将置信度作为物品i与物品j之间的相似度,包括:ri,j=P(j|i)=N(i∩j)N(i)]]>其中,ri,j是物品i与物品j之间的相似度,P(j|i)是物品j相对于物品i的置信度,N(i∩j)是喜欢物品i且喜欢物品j的用户的个数,N(i)是喜欢物品i的用户的个数,N(i)是正整数。可选的,根据目标函数对评分矩阵进行矩阵分解,得到第一矩阵和第二矩阵,包括:使用预定的矩阵分解方法对评分矩阵进行矩阵分解,得到使目标函数取得最小值时的第一矩阵和第二矩阵;其中,矩阵分解方法包括ALS算法、Plsa算法、LDA算法和SVD算法中的任意一种。根据本公开实施例的第二方面,提供一种特征向量计算装置,该装置包括:第一构建模块,用于使用物品i代表喜欢物品i的一类用户,构建评分矩阵中的行;第二构建模块,用于使用物品j构建评分矩阵中的列;第三构建模块,用于使用物品i与物品j之间的相似度代表喜欢物品i的一类用户对物品j的评分,构建评分矩阵中的矩阵元素;分解模块,用于根据目标函数对评分矩阵进行矩阵分解,得到第一矩阵和第二矩阵;第一矩阵包括每类用户的特征向量,第二矩阵包括:每种物品的特征向量。可选的,第三构建模块包括:计算单元,用于计算物品i与物品j之间的相似度;构建单元,用于使用相似度代表喜欢物品i的一类用户对物品j的评分,作为评分矩阵中的矩阵元素Wij的取值。可选的,计算单元,用于计算物品j相对于物品i的置信度,将置信度作为物品i与物品j之间的相似度。可选的,计算单元,用于计算:ri,j=P(j|i)=N(i∩j)N(i)]]>其中,ri,j是物品i与物品j之间的相似度,P(j|i)是物品j相对于物品i的置信度,N(i∩j)是喜欢物品i且喜欢物品j的用户的个数,N(i)是喜欢物品i的用户的个数,N(i)是正整数。可选的,分解模块,用于使用预定的矩阵分解方法对评分矩阵进行矩阵分解,得到使目标函数取得最小值时的第一矩阵和第二矩阵;其中,矩阵分解方法包括ALS算法、Plsa算法、LDA算法和SVD算法中的任意一种。本专利技术实施例提供的技术方案带来的有益效果是:通过使用物品i代表喜欢物品i的一类用户,构建评分矩阵中的行,使用物品j构建评分矩阵中的列,使用物品i与物品j之间的相似度代表喜欢物品i的一类用户对物品j的评分,构建评分矩阵中的矩阵元素,根据目标函数对评分矩阵进行矩阵分解,得到第一矩阵和第二矩阵;第一矩阵包括:每类用户的特征向量,第二矩阵包括:每种物品的特征向量;解决了相关技术中使用用户构建评分矩阵的行,由于用户数量庞大而使矩阵分解难以完成的问题;达到了使用物品代替一类用户构成评分矩阵的行,减少评分矩阵中的矩阵元素个数,减少了矩阵分解过程中的计算量的效果。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是根据一示例性实施例示出的一种特征向量计算方法的流程图;图2是根据另一示例性实施例示出的一种特征向量计算方法的流程图;图3是根据另一示例性实施例示出的一种评分矩阵的示意图;图4是根据一示例性实施例示出的一种特征向量计算装置的框图;图5是根据另一示例性实施例示出的一种特征向量计算装置的框图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术实施方式作进一步地详细描述。本公开各个实施例提供的特征向量计算方法,可以由安装有至少一个应用程序的终端来实现,该终端可以是手机、平板电脑、电子书阅读器、MP3(MovingPictureExpertsGroupAudioLayerⅢ,动态影像专家压缩标准音频层面3)播放本文档来自技高网...

【技术保护点】
一种特征向量计算方法,其特征在于,所述方法包括:使用物品i代表喜欢所述物品i的一类用户,构建评分矩阵中的行;使用物品j构建所述评分矩阵中的列;使用所述物品i与所述物品j之间的相似度代表所述喜欢所述物品i的一类用户对所述物品j的评分,构建所述评分矩阵中的矩阵元素;根据目标函数对所述评分矩阵进行矩阵分解,得到第一矩阵和第二矩阵;所述第一矩阵:包括每类用户的特征向量,所述第二矩阵包括:每种物品的特征向量。

【技术特征摘要】
1.一种特征向量计算方法,其特征在于,所述方法包括:
使用物品i代表喜欢所述物品i的一类用户,构建评分矩阵中的行;
使用物品j构建所述评分矩阵中的列;
使用所述物品i与所述物品j之间的相似度代表所述喜欢所述物品i的一类
用户对所述物品j的评分,构建所述评分矩阵中的矩阵元素;
根据目标函数对所述评分矩阵进行矩阵分解,得到第一矩阵和第二矩阵;
所述第一矩阵:包括每类用户的特征向量,所述第二矩阵包括:每种物品的特
征向量。
2.根据权利要求1所述的方法,其特征在于,所述使用所述物品i与所述
物品j之间的相似度代表所述喜欢所述物品i的一类用户对所述物品j的评分,
构建所述评分矩阵中的矩阵元素,包括:
计算所述物品i与所述物品j之间的相似度;
使用所述相似度代表所述喜欢所述物品i的一类用户对所述物品j的评分,
作为所述评分矩阵中的矩阵元素Wij的取值。
3.根据权利要求2所述的方法,其特征在于,所述计算所述物品i与所述
物品j之间的相似度,包括:
计算所述物品j相对于所述物品i的置信度,将所述置信度作为所述物品i
与所述物品j之间的相似度。
4.根据权利要求3所述的方法,其特征在于,所述计算所述物品j相对于
所述物品i的置信度,将所述置信度作为所述物品i与所述物品j之间的相似度,
包括:
ri,j=P(j|i)=N(i∩j)N(i)]]>其中,ri,j是物品i与物品j之间的相似度,P(j|i)是所述物品j相对于所
述物品i的置信度,N(i∩j)是喜欢所述物品i且喜欢所述物品j的用户的个数,
N(i)是喜欢所述物品i的用户的个数,N(i)是正整数。
5.根据权利要求1至4任一所述的方法,其特征在于,所述根据目标函数
对所述评分矩阵进行矩阵分解,得到第一矩阵和第二矩阵,包括:
使用预定的矩阵分解方法对所述评分矩阵进行矩阵分解,得到使所述目标
函数取得最小值时的所述第一矩阵和所述第二矩阵;
其中,所述矩阵分解方法包括交替最小二乘法的协同过滤ALS算法、概率
潜在...

【专利技术属性】
技术研发人员:江海金
申请(专利权)人:广州酷狗计算机科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1