一种访问对象的数据处理方法及装置制造方法及图纸

技术编号:12773491 阅读:39 留言:0更新日期:2016-01-27 17:14
本发明专利技术公开了一种访问对象的数据处理方法及装置,所述方法包括:获取访问对象的标题名,将标题名划分为至少两个分词;获取至少两个分词对应的访问频率信息,并生成包含携带访问频率信息的至少两个分词的多元组;在两个访问对象的多元组中,提取共同包含的第一分词及其携带的访问频率信息,并对第一分词进行协同过滤分析生成协同过滤分值;根据第一分词的协同过滤分值和其携带的访问频率信息,生成两个访问对象相互之间的相关度;根据当前访问的访问对象及其对应的相关度将相应的访问对象进行推荐。本实施例中避免了由于访问对象的考虑不全面,尤其是对于新录入的访问对象,导致访问对象之间的相关度计算不准确的问题,提高了计算结果的准确性。

【技术实现步骤摘要】

本专利技术属于通信
,尤其涉及一种访问对象的数据处理方法及装置
技术介绍
随着网络的不断推进,用户在访问网络时对网络各项功能的要求越来越高,譬如以网络购物为例,用户一般会希望网站推荐与其所需要商品的同类商品或相关商品,从而通过比较查询的方式可更方便地购买到需要的商品。目前在网络购物中,协同过滤推荐(CollaborativeFilteringrecommendation)正迅速成为一项很受欢迎的技术。与传统的基于内容过滤直接分析内容进行推荐不同,协同过滤通过分析用户兴趣,在用户群中找到指定用户的相似(兴趣)用户,综合这些相似用户对某一信息的评价,形成系统对该指定用户对此信息的喜好程度预测。但是基于该方式,在商品到商品的协同过滤中,由于没有考虑到商品本身的特性而导致商品相关度的计算结果不准确,如对于一些新推出的商品,可能由于暂时无用户购买或收藏而导致不会马上被推荐出来,其需要经过一定时间的才可能被推荐出来,也就是说没有考虑到新推出的商品的相关性,从而导致商品相关度的计算结果和相关商品的推荐不全面,不够准确。因此,需解决现有技术在协同过滤中,由于访问对象(如商品)的考虑不全面,尤其是对于一些新推出的商品,导致访问对象之间的相关度信息计算不准确的问题。
技术实现思路
本专利技术的目的在于提供一种访问对象的数据处理方法及装置,旨在解决现有技术中在协同过滤中,由于访问对象(如商品)的考虑不全面,尤其是对于新录入的访问对象,导致访问对象之间的相关度信息计算不准确的问题。为解决上述技术问题,本专利技术实施例提供以下技术方案:一种访问对象的数据处理方法,所述方法包括:获取访问对象的标题名,将所述标题名划分为至少两个分词;获取所述至少两个分词对应的访问频率信息,并生成与所述访问对象一一对应的多元组,所述多元组中包含携带访问频率信息的所述至少两个分词;在两个访问对象对应的多元组中,提取共同包含的第一分词及所述第一分词携带的访问频率信息,并对所述第一分词进行协同过滤分析,生成所述第一分词的协同过滤分值,所述第一分词为所述至少两个分词中的至少一个;根据所述第一分词的协同过滤分值和所述第一分词携带的访问频率信息,生成所述两个访问对象相互之间的相关度;以及根据当前访问的访问对象,以及所述当前访问的访问对象对应的相关度将相应的访问对象进行推荐。为解决上述技术问题,本专利技术实施例提供以下技术方案:一种访问对象的数据处理装置,所述装置包括:分词获取模块,用于获取访问对象的标题名,将所述标题名划分为至少两个分词;多元组生成模块,用于获取所述至少两个分词对应的访问频率信息,并生成与所述访问对象一一对应的多元组,所述多元组中包含携带访问频率信息的所述至少两个分词;协同过滤分值生成模块,用于在两个访问对象对应的多元组中,提取共同包含的第一分词及所述第一分词携带的访问频率信息,并对所述第一分词进行协同过滤分析,生成所述第一分词的协同过滤分值,所述第一分词为所述至少两个分词中的至少一个;以及相关度生成模块,用于根据所述第一分词的协同过滤分值和所述第一分词携带的访问频率信息,生成所述两个访问对象相互之间的相关度;以及推荐控制模块,用于根据当前访问的访问对象,以及所述当前访问的访问对象对应的相关度将相应的访问对象进行推荐。相对于现有技术,本实施例将访问对象的标题名划分为至少两个分词,并根据所述至少两个分词访问频率信息,生成包含携带访问频率信息的至少两个分词的多元组;其次,针对两个访问对象的多元组,对共同包含的第一分词进行协同过滤分析并生成第一分词协同过滤分值;最后,根据第一分词的协同过滤分值和第一分词携带的访问频率信息,从而生成两个访问对象相互之间的相关度,将相关的访问对象进行推荐;本专利技术实施例中,由于利用了访问对象的标题名以及访问对象标题名分词的访问频率信息,对访问对象进行了全面的考虑,尤其是对新录入的访问对象,不仅可以客观地体现出了访问对象之间的相关性,而且提高访问对象之间的相关度信息计算的准确率。附图说明图1是本专利技术实施例提供的访问对象的数据处理系统的结构示意图;图2是本专利技术第一实施例提供的访问对象的数据处理方法的流程示意图;图3为本专利技术第二实施例提供的访问对象的数据处理方法的流程示意图;图4a为本专利技术实施例提供的访问对象的数据处理方法具体应用流程示意图;图4b为本专利技术实施例提供的具体应用中访问对象的示意图;图5为本专利技术实施例提供的访问对象的数据处理装置的结构示意图;图6为本专利技术实施例提供的访问对象的数据处理装置的另一结构示意图。具体实施方式请参照图式,其中相同的组件符号代表相同的组件,本专利技术的原理是以实施在一适当的运算环境中来举例说明。以下的说明是基于所例示的本专利技术具体实施例,其不应被视为限制本专利技术未在此详述的其它具体实施例。在以下的说明中,本专利技术的具体实施例将参考由一部或多部计算机所执行的步骤及符号来说明,除非另有述明。因此,这些步骤及操作将有数次提到由计算机执行,本文所指的计算机执行包括了由代表了以一结构化型式中的数据的电子信号的计算机处理单元的操作。此操作转换该数据或将其维持在该计算机的内存系统中的位置处,其可重新配置或另外以本领域测试人员所熟知的方式来改变该计算机的运作。该数据所维持的数据结构为该内存的实体位置,其具有由该数据格式所定义的特定特性。但是,本专利技术原理以上述文字来说明,其并不代表为一种限制,本领域测试人员将可了解到以下所述的多种步骤及操作亦可实施在硬件当中。本专利技术的原理使用许多其它泛用性或特定目的运算、通信环境或组态来进行操作。所熟知的适合用于本专利技术的运算系统、环境与组态的范例可包括(但不限于)手持电话、个人计算机、服务器、多处理器系统、微电脑为主的系统、主架构型计算机、及分布式运算环境,其中包括了任何的上述系统或装置。本文所使用的术语「模块」可看做为在该运算系统上执行的软件对象。本文所述的不同组件、模块、引擎及服务可看做为在该运算系统上的实施对象。而本文所述的装置及方法优选的以软件的方式进行实施,当然也可在硬件上进行实施,均在本专利技术保护范围之内。请参阅图1,图1为本专利技术实施例提供的访问对象的数据处理系统的结构示意图,所述访问对象的数据处理系统包括客户端11以及服务器12。其中所述客户端11是使用者为了利用网络服务而使用的通信终端装置,其可通过通信网路与所述服务器12连接本文档来自技高网...

【技术保护点】
一种访问对象的数据处理方法,其特征在于,所述方法包括:获取访问对象的标题名,将所述标题名划分为至少两个分词;获取所述至少两个分词对应的访问频率信息,并生成与所述访问对象一一对应的多元组,所述多元组中包含携带访问频率信息的所述至少两个分词;在两个访问对象对应的多元组中,提取共同包含的第一分词及所述第一分词携带的访问频率信息,并对所述第一分词进行协同过滤分析,生成所述第一分词的协同过滤分值,所述第一分词为所述至少两个分词中的至少一个;根据所述第一分词的协同过滤分值和所述第一分词携带的访问频率信息,生成所述两个访问对象相互之间的相关度;以及根据当前访问的访问对象,以及所述当前访问的访问对象对应的相关度将相应的访问对象进行推荐。

【技术特征摘要】
1.一种访问对象的数据处理方法,其特征在于,所述方法包括:
获取访问对象的标题名,将所述标题名划分为至少两个分词;
获取所述至少两个分词对应的访问频率信息,并生成与所述访问对象一一
对应的多元组,所述多元组中包含携带访问频率信息的所述至少两个分词;
在两个访问对象对应的多元组中,提取共同包含的第一分词及所述第一分
词携带的访问频率信息,并对所述第一分词进行协同过滤分析,生成所述第一
分词的协同过滤分值,所述第一分词为所述至少两个分词中的至少一个;
根据所述第一分词的协同过滤分值和所述第一分词携带的访问频率信息,
生成所述两个访问对象相互之间的相关度;以及
根据当前访问的访问对象,以及所述当前访问的访问对象对应的相关度将
相应的访问对象进行推荐。
2.根据权利要求1所述的访问对象的数据处理方法,其特征在于,所述将
所述访问对象的标题名划分为至少两个分词的步骤之后,还包括:
判断所述至少两个分词是否有效,若有效,则执行所述获取所述至少两个
分词对应的访问频率信息的步骤。
3.根据权利要求2所述的访问对象的数据处理方法,其特征在于,所述判
断所述至少两个分词是否有效的步骤,包括:
将所述至少两个分词中的每个分词与预置的分词数据库一一进行对比;
若在所述分词数据库中查询到所述分词,则判断出所述分词有效;以及
若在所述分词数据库中没有查询到所述分词,则判断出所述分词无效。
4.根据权利要求1所述的访问对象的数据处理方法,其特征在于,所述获
取所述至少两个分词对应的访问频率信息的步骤,包括:
对于所述至少两个分词中的每个分词,在预设时间段内统计包含所述分词
的页面访问次数;
在所述预设时间段内统计包含所述分词的标题的页面访问次数;以及
将所述包含所述分词的标题的页面访问次数与所述包含所述分词的页面访
问次数的比值,作为所述分词的访问频率信息。
5.根据权利要求1所述的访问对象的数据处理方法,其特征在于,所述根
据所述第一分词的协同过滤分值和所述第一分词携带的访问频率信息,生成所
述两个访问对象相互之间的相关度的步骤,包括:
对于每个所述第一分词,对所述第一分词的协同过滤分值与所述第一分词
携带的访问频率信息进行求积计算,生成分词相关值;以及
对每个所述第一分词的所述分词相关值进行求和计算,生成分词总和,以
作为所述两个访问对象相互之间的相关度。
6.根据权利要求1至5任一项所述的访问对象的数据处理方法,其特征在
于,所述根据当前访问的访问对象,以及所述当前访问的访问对象对应的相关
度将相应的访问对象进行推荐的步骤,包括:
获取客户端当前访问的访问对象;以及
根据所述当前访问的访问对象,获取与所述当前访问的访问对象相关的访
问对象并推荐至所述客户端,所述相关的访问对象按照其与当前访问对象相互
之间的相关度由大到小的顺序进行排列。
7.根据权利要求1至5任一项所述的访问对象的数据处理方法,其特征在
于,所述根据当前访问的访问对象,以及所述当前访问的访问对象对应的相关
度将相应的访问对象进行推荐的步骤,包括:
获取客户端当前访问的访问对象;以及
将与所述客户端当前访问的访问对象相关度小于预设阈值的访问对象进行
删除,将与所述客户端当前访问的访问对象相关度大于或等于所述预设阈值的
访问对象进行推荐。
8.根据权利要求1至5任一项所述的访问对象的数据处理方法,其特征在
于,所述根据当前访问的访问对象,以及所述当前访问的访问对象对应的相关

\t度将相应的访问对象进行推荐的步骤,包括:
获取客户端当前访问的访问对象;以及
向所述客户端推荐与所述...

【专利技术属性】
技术研发人员:郁其雨谢启明付运伟李永安王炫聪
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1