【技术实现步骤摘要】
用户相似度的确定方法、装置、计算机设备和存储介质
[0001]本申请涉及大数据
,特别是涉及一种用户相似度的确定方法、装置、计算机设备、存储介质和计算机程序产品。
技术介绍
[0002]随着互联网技术的飞速发展,出现了推荐系统。该推荐系统是为用户推荐对象(项目)。该推荐系统的推荐算法的核心部分是用户相似度的计算。
[0003]相关技术中,一般通过皮尔逊相关系数(Pearson correlation coefficient)的计算方法,计算用户之间的相似度。但是,相关技术中通过皮尔逊相关系数计算用户之间的相似度时,仅考虑用户之间的用户特征,考虑的因素较为片面,导致计算出来的用户相似度不准确。
技术实现思路
[0004]基于此,有必要针对上述技术问题,提供一种能够准确计算的用户相似度的确定方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
[0005]第一方面,本申请提供了一种用户相似度的确定方法。所述方法包括:
[0006]根据第一用户对目标对象的第一评分以及第二用户对 ...
【技术保护点】
【技术特征摘要】
1.一种用户相似度的确定方法,其特征在于,所述方法包括:根据第一用户对目标对象的第一评分以及第二用户对所述目标对象的第二评分,确定所述第一用户与所述第二用户的第一用户相似度;根据所述第一用户的关联特征、第二用户的关联特征以及所述目标对象的评价特征,确定对象的时间影响因子以及对象的等级影响因子;根据所述第一用户的关联特征以及所述第二用户的关联特征,确定用户的时间影响因子;根据所述第一用户相似度、所述对象的时间影响因子、所述对象的等级影响因子以及所述用户的时间影响因子,确定所述第一用户与所述第二用户在对象推送场景下的目标用户相似度。2.根据权利要求1所述的方法,其特征在于,所述第一用户的关联特征包括所述第一用户的关联用户,所述第二用户的关联特征包括所述第二用户的关联用户,所述目标对象的评价特征包括评价时间差均值、上线时间,所述方法还包括:在预设高等级用户集中,提取关联用户集,所述关联用户集包括所述第一用户的关联用户以及所述第二用户的关联用户;根据实时时间以及所述关联用户集中的用户对所述目标对象的评价时间,得到多个时间差,并对所述多个时间差进行均值计算,得到评价时间差均值;根据所述目标对象的评价时间差均值、所述上线时间以及所述实时时间,确定所述对象的时间影响因子,所述对象的时间影响因子表示所述目标对象的时间因素对所述用户相似度的影响程度。3.根据权利要求1所述的方法,其特征在于,所述根据所述目标对象的评价时间差均值、所述上线时间以及所述实时时间,确定所述对象的时间影响因子,包括:确定所述实时时间与所述上线时间的时间差值,并对所述时间差值与所述目标对象的评价时间差均值进行求和处理,得到合并时间;对所述合并时间进行相反数处理,得到相反时间,并对所述相反时间进行对数处理,得到所述对象的时间影响因子。4.根据权利要求1所述的方法,其特征在于,所述第一用户的关联特征包括所述第一用户评价过的对象,所述第二用户的关联特征包括所述第二用户评价过的对象,所述目标对象的评价特征包括所述目标对象的评价等级;所述方法还包括:根据所述第一用户评价过的对象以及所述第二用户评价过的对象,确定第一对象以及所述第一对象的评价等级,所述第一对象是被所述第一用户以及所述第二用户均评价过的对象;将多个所述第一对象的评价等级之和与所述目标对象的评价等级的比值,作为所述对象的等级影响因子。5.根据权利要求1所述的方法,其特征在于,所述第一用户的关联特征包括所述第一用户的关联用户,所述第二用户的关联特征包括所述第二用户的关联用户;所述方法还包括:确定所述第一用户与所述第一用户的关联用户的评价兴趣度随时间变化的第一差异度以及所述第二用户与所述第二用户的关联用户的评价兴趣度随时间变化的第二差异度;
对所述第一差异度、所述第...
【专利技术属性】
技术研发人员:王慎超,王猛,王天越,吴江林,
申请(专利权)人:中国工商银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。