用户相似度的估算方法及估算系统技术方案

技术编号：13335544 阅读：96 留言：0更新日期：2016-07-12 12:40

本发明专利技术提供一种用户的相似度的估算方法及估算系统，包括：获取用户属性，并根据用户属性将不同的用户分成多个用户组；读取所述用户组中每一用户所对应的项目，以生成项目列表；将所述用户组中的用户与所述项目列表中的项目处理成二分图；通过所述二分图估算用户的组内相似度；和/或通过所述二分图估算用户的组间相似度。本发明专利技术通过二分图对用户和项目进行分析，具有算法简单、准确率高的优点，而且可以适应海量数据的环境，对系统资源占用少、且估算速度快。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于数据处理领域，尤其设及一种用户的相似度的估算方法及估算系统。
技术介绍
随着互联网的普及，信息资源呈指数膨胀，从而带来了信息过载的问题，使用户时常迷失在大量的信息空间中，无法顺利找到自己需要的信息。因此，便出现了各类的信息推荐技术，基于用户的操作习惯对用户与项目建立一定的关联，比如观看或点赞，进而生成信息推荐列表，比如，节目推荐列表、购物推荐列表、或朋友推荐列表等。运些推荐技术的原理，主要是依据用户的相似度，为目标用户选取相似度高的已知用户的项目列表，作为推荐信息。传统的用户相似度的估算方法，主要是将用户组的用户两两估算相似度值，然后将运些相似度值进行平均，即为组间相似度。但随着用户、及用户操作行为的数据量越来越大，传统估算方法的估算量也越来越大，对运算资源消耗较大，且费时费力，同时传统算法中取平均值的误差也会被海量数据所放大，影响了对用户的相似度的评估的准确性，进而影响推荐信息的有效性，降低了用户体验。
技术实现思路
有鉴于此，本专利技术的目的在于提供一种用户的相似度的估算方法及估算系统，可 W解决现有技术中估算方法复杂、误差大，进而影响估算速度和准确性的技术问题。为解决上述技术问题，本专利技术实施例提供了如下技术方案：[000引一种用户的相似度的估算方法，包括：获取用户属性，并根据用户属性将不同的用户分成多个用户组；读取所述用户组中每一用户所对应的项目，W生成项目列表；将所述用户组中的用户与所述项目列表中的项目处理成二分图；[001^ 通过所述二分图估算用户的组内相似度;和/或通过所述二分图

【技术保护点】
一种用户的相似度的估算方法，其特征在于，包括：获取用户属性，并根据用户属性将不同的用户分成多个用户组；读取所述用户组中每一用户所对应的项目，以生成项目列表；将所述用户组中的用户与所述项目列表中的项目处理成二分图；通过所述二分图估算用户的组内相似度；和/或通过所述二分图估算用户的组间相似度。

【技术特征摘要】

【专利技术属性】
技术研发人员：杨春风，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人