【技术实现步骤摘要】
本专利技术属于通信
,尤其涉及一种访问对象的数据处理方法及装置。
技术介绍
随着网络的不断推进,用户在访问网络时对网络各项功能的要求越来越高,譬如以网络购物为例,用户一般会希望网站推荐与其所需要商品的同类商品或相关商品,从而通过比较查询的方式可更方便地购买到需要的商品。目前在网络购物中,协同过滤推荐(CollaborativeFilteringrecommendation)正迅速成为一项很受欢迎的技术。与传统的基于内容过滤直接分析内容进行推荐不同,协同过滤通过分析用户兴趣,在用户群中找到指定用户的相似(兴趣)用户,综合这些相似用户对某一信息的评价,形成系统对该指定用户对此信息的喜好程度预测。但是基于该方式,在商品到商品的协同过滤中,由于没有考虑到商品本身的特性而导致商品相关度的计算结果不准确,如对于一些新推出的商品,可能由于暂时无用户购买或收藏而导致不会马上被推荐出来,其需要经过一定时间的才可能被推荐出来,也就是说没有考虑到新推出的商品的相关性,从而导致商品相关度的计算结果和相关商品的推荐不全面,不够准确。因此,需解决现有技术在协同过滤中,由于访问对象(如商品)的考虑不全面,尤其是对于一些新推出的商品,导致访问对象之间的相关度信息计算不准确的问题。
技术实现思路
本专利技术的目的在于提供一种访问对象的数据处理方法及装置,旨在解决现有技术中在协同过滤中,由于访问对象(如商品)的考虑 ...
【技术保护点】
一种访问对象的数据处理方法,其特征在于,所述方法包括:获取访问对象的标题名,将所述标题名划分为至少两个分词;获取所述至少两个分词对应的访问频率信息,并生成与所述访问对象一一对应的多元组,所述多元组中包含携带访问频率信息的所述至少两个分词;在两个访问对象对应的多元组中,提取共同包含的第一分词及所述第一分词携带的访问频率信息,并对所述第一分词进行协同过滤分析,生成所述第一分词的协同过滤分值,所述第一分词为所述至少两个分词中的至少一个;根据所述第一分词的协同过滤分值和所述第一分词携带的访问频率信息,生成所述两个访问对象相互之间的相关度;以及根据当前访问的访问对象,以及所述当前访问的访问对象对应的相关度将相应的访问对象进行推荐。
【技术特征摘要】
1.一种访问对象的数据处理方法,其特征在于,所述方法包括:
获取访问对象的标题名,将所述标题名划分为至少两个分词;
获取所述至少两个分词对应的访问频率信息,并生成与所述访问对象一一
对应的多元组,所述多元组中包含携带访问频率信息的所述至少两个分词;
在两个访问对象对应的多元组中,提取共同包含的第一分词及所述第一分
词携带的访问频率信息,并对所述第一分词进行协同过滤分析,生成所述第一
分词的协同过滤分值,所述第一分词为所述至少两个分词中的至少一个;
根据所述第一分词的协同过滤分值和所述第一分词携带的访问频率信息,
生成所述两个访问对象相互之间的相关度;以及
根据当前访问的访问对象,以及所述当前访问的访问对象对应的相关度将
相应的访问对象进行推荐。
2.根据权利要求1所述的访问对象的数据处理方法,其特征在于,所述将
所述访问对象的标题名划分为至少两个分词的步骤之后,还包括:
判断所述至少两个分词是否有效,若有效,则执行所述获取所述至少两个
分词对应的访问频率信息的步骤。
3.根据权利要求2所述的访问对象的数据处理方法,其特征在于,所述判
断所述至少两个分词是否有效的步骤,包括:
将所述至少两个分词中的每个分词与预置的分词数据库一一进行对比;
若在所述分词数据库中查询到所述分词,则判断出所述分词有效;以及
若在所述分词数据库中没有查询到所述分词,则判断出所述分词无效。
4.根据权利要求1所述的访问对象的数据处理方法,其特征在于,所述获
取所述至少两个分词对应的访问频率信息的步骤,包括:
对于所述至少两个分词中的每个分词,在预设时间段内统计包含所述分词
的页面访问次数;
在所述预设时间段内统计包含所述分词的标题的页面访问次数;以及
将所述包含所述分词的标题的页面访问次数与所述包含所述分词的页面访
问次数的比值,作为所述分词的访问频率信息。
5.根据权利要求1所述的访问对象的数据处理方法,其特征在于,所述根
据所述第一分词的协同过滤分值和所述第一分词携带的访问频率信息,生成所
述两个访问对象相互之间的相关度的步骤,包括:
对于每个所述第一分词,对所述第一分词的协同过滤分值与所述第一分词
携带的访问频率信息进行求积计算,生成分词相关值;以及
对每个所述第一分词的所述分词相关值进行求和计算,生成分词总和,以
作为所述两个访问对象相互之间的相关度。
6.根据权利要求1至5任一项所述的访问对象的数据处理方法,其特征在
于,所述根据当前访问的访问对象,以及所述当前访问的访问对象对应的相关
度将相应的访问对象进行推荐的步骤,包括:
获取客户端当前访问的访问对象;以及
根据所述当前访问的访问对象,获取与所述当前访问的访问对象相关的访
问对象并推荐至所述客户端,所述相关的访问对象按照其与当前访问对象相互
之间的相关度由大到小的顺序进行排列。
7.根据权利要求1至5任一项所述的访问对象的数据处理方法,其特征在
于,所述根据当前访问的访问对象,以及所述当前访问的访问对象对应的相关
度将相应的访问对象进行推荐的步骤,包括:
获取客户端当前访问的访问对象;以及
将与所述客户端当前访问的访问对象相关度小于预设阈值的访问对象进行
删除,将与所述客户端当前访问的访问对象相关度大于或等于所述预设阈值的
访问对象进行推荐。
8.根据权利要求1至5任一项所述的访问对象的数据处理方法,其特征在
于,所述根据当前访问的访问对象,以及所述当前访问的访问对象对应的相关
\t度将相应的访问对象进行推荐的步骤,包括:
获取客户端当前访问的访问对象;以及
向所述客户端推荐与所述...
【专利技术属性】
技术研发人员:郁其雨,谢启明,付运伟,李永安,王炫聪,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。