【技术实现步骤摘要】
一种相似度度量方法、装置、设备及存储介质
本专利技术实施例涉及计算机技术,尤其涉及一种相似度度量方法、装置、设备及存储介质。
技术介绍
在大数据的应用领域中,一个重要的方向是根据海量数据对用户进行个性化推荐。对于互联网直播平台而言,个性化推荐具体为给当前用户准确地推荐其感兴趣的直播间。目前,在直播间推荐的众多大数据算法解决方案中,一个简单可行的方案是给目标用户推荐与其最近观看过历史直播间类似的直播间,该方案的难点在于如何准确地计算两两直播间之间的相似度。在现有的直播间推荐方案中,基于物品的推荐算法中计算物品相似度的杰卡德系数算法(Jaccard’sCoefficient),是常用的直播间相似度度量方法之一。该算法是基于集合进行计算的,两两直播间之间的相似度等于同时观看两个直播间的用户数除以至少观看了其中一个直播间的用户数。上述算法在直播间相似度度量中的缺陷在于,其仅仅考虑了观看了两个直播间的观看用户,未考虑这些观看用户对其他直播间的观看情况,从而仅利用了直播间相似度度量信息中的部分信息,使得获得的相似度比较片面。例如,上述观看用户中的某些观看用户,只是出于偶然行为 ...
【技术保护点】
1.一种相似度度量方法,其特征在于,包括:依据与待度量相似度的物品相对应的用户数据,确定两个所述物品之间的用户集合,所述用户集合包括用户交集、用户相对补集和用户并集的绝对补集;依据所述用户集合的香农熵,以及基于极大似然比检验的预设相似度度量规则,确定两个所述物品之间的相似度。
【技术特征摘要】
1.一种相似度度量方法,其特征在于,包括:依据与待度量相似度的物品相对应的用户数据,确定两个所述物品之间的用户集合,所述用户集合包括用户交集、用户相对补集和用户并集的绝对补集;依据所述用户集合的香农熵,以及基于极大似然比检验的预设相似度度量规则,确定两个所述物品之间的相似度。2.根据权利要求1所述的方法,其特征在于,所述预设相似度度量规则为:row_entropy=entropy(N11+N12,N21+N22)column_entropy=entropy(N11+N21,N12+N22)maxtrix_entropy=entropy(N11,N12,N21,N22)其中,Sij为两个所述物品之间的相似度,entropy为香农熵,N11为物品i对应的用户集I和物品j对应的用户集J的用户交集,N12为用户集I中用户集J的用户相对补集,N21为用户集J中用户集I的用户相对补集,N22为用户集I与用户集J的用户并集的绝对补集。3.根据权利要求1所述的方法,其特征在于,在所述依据与待度量相似度的物品相对应的用户数据,确定两个所述物品之间的用户集合之前,还包括:确定热门物品,以及与所述热门物品相对应的设定类型的用户行为数据;依据所述用户行为数据及预设类型权重值,确定所述热门物品对应用户的用户偏好值;依据所述用户偏好值,确定所述热门物品对应的有效用户数据;所述依据与待度量相似度的物品相对应的用户数据,确定两个所述物品之间的用户集合包括:确定所述有效用户数据为所述热门物品对应的热门用户数据;依据所述热门用户数据和/或非热门物品对应的所述用户数据,确定两个所述物品之间的用户集合。4.根据权利要求3所述的方法,其特征在于,所述确定热门物品包括:依据第...
【专利技术属性】
技术研发人员:王璐,陈少杰,张文明,
申请(专利权)人:武汉斗鱼网络科技有限公司,
类型:发明
国别省市:湖北,42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。