The invention discloses a method for obtaining item similarity and terminal, computer readable storage medium, the method comprises the following steps: vector to calculate the item label; according to the vector calculation items label, get the item similarity matrix; matrix of item similarity is obtained, using the N Queen method for screening, screening to multiple sample data Xm according to the sample data; Xm screening, the calculated average value and variance of the sample data; according to the calculation result of the variance of the sample data, get the semantic concentration value. The invention discloses a method for obtaining item similarity and terminal, computer readable storage medium, the N queen picked out the maximal matching method, to make up for the other, the Hungarian algorithm can not dig enough; introduces semantic concentration measure, calculate the mean variance by this way, the maximal matching, the balance of item similarity results with. No longer in the biased maximum matching algorithm according to the Hungarian obtained similarity results.
【技术实现步骤摘要】
获取物品相似度的方法及终端、计算机可读存储介质
本专利技术涉及通信
,尤其涉及一种获取物品相似度的方法及终端、计算机可读存储介质。
技术介绍
推荐系统向用户推荐内容时,主要采用的是基于物品的推荐方法,具体地,计算物品相似度,根据物品相似度和用户历史行为生成对应用户的推荐列表。在实现本专利技术的过程中,专利技术人发现现有技术存在以下问题:现有技术中,计算物品相似度的方法主要如下所示:利用物品标签,将其用语义模型工具进行向量化,然后使用余弦夹角公式或是欧几里得距离等方式计算两个物品各自标签之间的语义相似度,将这些值按照矩阵展开形成相似度矩阵,此时利用匈牙利算法,求其带权最大匹配,得到的匹配值结果相加即为物品相似度。这种方式有以下问题:1)、匈牙利算法只能挑选出相似度矩阵中的最优匹配,对于其它匹配该算法没有办法挖掘。2)、该方式从相似矩阵中只提取到一个“最优匹配”,没有提供结合其它匹配进行运算的方式,计算结果有失偏颇。
技术实现思路
本专利技术的主要目的在于提出一种获取物品相似度的方法及终端、计算机可读存储介质,旨在解决现有技术存在的问题。为实现上述目的,本专利技术实 ...
【技术保护点】
一种获取物品相似度的方法,所述方法包括步骤:计算物品标签的向量;根据计算的物品标签的向量,得到物品相似度方阵,其中所述物品相似度方阵的行数和列数都为n;对得到的物品相似度方阵,使用n皇后方法进行筛选,筛选到多个样本数据Xm;根据筛选到的多个样本数据Xm,计算得到样本数据的平均值和方差;根据计算得到的样本数据的方差,得到语义集中度值,该语义集中度值即为物品相似度。
【技术特征摘要】
1.一种获取物品相似度的方法,所述方法包括步骤:计算物品标签的向量;根据计算的物品标签的向量,得到物品相似度方阵,其中所述物品相似度方阵的行数和列数都为n;对得到的物品相似度方阵,使用n皇后方法进行筛选,筛选到多个样本数据Xm;根据筛选到的多个样本数据Xm,计算得到样本数据的平均值和方差;根据计算得到的样本数据的方差,得到语义集中度值,该语义集中度值即为物品相似度。2.根据权利要求1所述的一种获取物品相似度的方法,其特征在于,所述步骤根据计算的物品标签的向量,得到物品相似度方阵包括步骤:根据计算的物品标签的向量,得到物品相似度矩阵;若所述物品相似度矩阵的行数和列数不相等,则从行或者列方向用零补全所述物品相似度矩阵为方阵;若所述物品相似度矩阵的行数和列数相等,则执行下一步骤。3.根据权利要求1所述的一种获取物品相似度的方法,其特征在于,所述步骤对得到的物品相似度方阵,使用n皇后方法进行筛选,筛选到多个样本数据Xm包括步骤:对得到的物品相似度方阵,使用n皇后方法进行筛选,筛选得到n个数据;将筛选得到n个数据进行相加,得到第一个样本数据X1;继续对得到的物品相似度方阵,使用n皇后方法进行筛选,直到所有样本数据Xm筛选出来。4.根据权利要求1所述的一种获取物品相似度的方法,其特征在于,通过以下公式得到所述语义集中度值:Y=1/S2+0.01其中,Y为语义集中度值,S2为计算得到的样本数据的方差。5.根据权利要求1所述的一种获取物品相似度的方法,其特征在于,所述步骤计算物品标签的向量包括:使用语义模型工具计算所述物品标签的向量;所述步骤根据计算的物品标签的向量,得到物品相似度方阵包括:根据所述语义模型工具计算的物品标签的向量,使用余弦夹角公式得到物品相似度方阵。6.一种终端...
【专利技术属性】
技术研发人员:张琪,郭红艳,郭凤阁,
申请(专利权)人:努比亚技术有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。