一种基于网页浏览的用户兴趣建模方法技术

技术编号:7287188 阅读:255 留言:0更新日期:2012-04-21 20:45
本发明专利技术公开了一种基于网页浏览的用户兴趣建模方法,主要包括以下步骤:将商品目录层次的最后一级目录作为用户的兴趣点;建立包含三个维度的用户兴趣模型;其中,空间兴趣维度P用于描述用户兴趣的倾向性;时间兴趣维度T用于描述用户的长期兴趣和短期兴趣;兴趣转移维度C用于描述用户在不同兴趣点之间的相关性。

【技术实现步骤摘要】
一种基于网页浏览的用户兴趣建模方法
本专利技术涉及计算机
,尤其涉及到基于网页浏览的用户兴趣建模方法。
技术介绍
近年来,随着计算机与网络技术的进步,电子商务得到了快速发展。用户通过网络能够采购到各类商品。为了帮助客户尽快找到合适的商品,同时也为了做商品推广,电子商务网站都会集成一个推荐系统自动为客户生成商品推荐。在商品推荐系统中,为了能准确地了解用户的兴趣特征从而更有针对性地做商品推荐,需要对用户的兴趣建立数学模型。目前,大多数的推荐系统都侧重于根据用户的购买历史和浏览历史来做简单的商品推荐,没有针对单个用户建立其兴趣模型。其缺点显而易见,一方面,如果用户已经购买了某种商品,这短期内用户对此类商品的需求就下降了,如果此时仍然推荐此类商品,则达不到商品推广的目的;另一方面,仅根据浏览历史做的商品推荐则仅仅将用户局限于某几个商品之中,无法深入发掘用户尚未浏览的其他商品。在缺乏完善的用户兴趣模型下做的商品推荐,在效果上不尽如人意。
技术实现思路
有鉴于此,一种能从各个方面反映用户兴趣的数学模型是十分有益的。为了解决上述问题,本专利技术提供了一种基于网页浏览的用户兴趣建模方法,其技术方案包括如下步骤:1.根据电子商务网站的商品分类目录结构,将目录层次的最后一级目录作为用户的兴趣点,一个兴趣点包含该目录下的所有商品页面;2.用户的兴趣模型包括三个维度:空间兴趣维度P、时间兴趣维度T、兴趣转移维度C,通过用户在网站的浏览记录,计算上述三个维度;3.空间兴趣维度P用于描述用户兴趣的倾向性,其表示为:P={(W0,IP0),(W1,IP1),...,(Wn,IPn)}其中,Wi代表用户访问兴趣点i的总次数,IPi描述的是用户对兴趣点i中每个商品的兴趣矢量,其表达式为:IPi=[w0,w1,...,wm]其中,wj代表用户对兴趣点中商品j的兴趣度;4.时间兴趣维度T用于描述用户的长期兴趣和短期兴趣,其表示为:T={(LT0,ST0),(LT1,ST1),...,(LTn,STn)}其中,LTi代表用户对兴趣点i访问的总在线时间,STi代表用户最近访问兴趣点的密度;5.兴趣转移维度C用于描述用户在不同兴趣点之间的相关性,其表达式为:Ix,Iy代表两个不同的兴趣点x和y,P(Ix,Iy)代表用户的会话同时包含兴趣点x和y的概率,P(Ix)代表用户的会话包含兴趣点x的概率,P(Iy)代表用户的会话包含兴趣点y的概率,C(Ix,Iy)反映了兴趣点x和y的相关性,值大于1表示正相关,值小于1表示负相关,值等于1表示不相关。其中,n+1代表兴趣点的总个数,m+1代表每个兴趣点中的商品的总个数,i为整数,且0≤i≤n,j为整数,且0≤j≤m。本专利技术还可以通过下述方法增强建模效果:用户对兴趣点中商品的兴趣度wj的计算方法如下:其中,CNT(j)代表用户对兴趣点中商品j的访问次数,PU代表该商品所属兴趣点所拥有的用户总数,IPUj代表该商品所拥有的用户总数。用户对兴趣点i访问的总在线时间的计算公式为:其中,a代表用户访问的次数,tk代表第k次访问所花费的时间。用户对兴趣点i的最近访问兴趣密度的计算公式为:其中,θ代表一个固定的时间间隔,tkθ代表从当前时间开始往前kθ的时间范围内,用户访问兴趣点i的总时间,b是一个参数,用于设定访问兴趣密度计算的时间跨度范围。上述基于网页浏览的用户兴趣建模方法开辟了一种通过分析用户上网行为得到用户兴趣特征的途径。它从3个不同侧面描述了用户兴趣特征:时间、空间、兴趣转移。相比目前推荐系统中所采用的仅仅基于用户浏览记录和购买记录的简易模型,本专利技术能够更加贴近用户的实际兴趣取向。附图说明图1示出了用户兴趣建模方法流程;具体实施方式下面结合附图与具体实施方式对本专利技术做进一步详细描述:图1示出了用户兴趣建模方法流程,主要包括:步骤S100,兴趣点提取。将商品目录层次的最后一级目录作为用户的兴趣点,一个兴趣点包含该目录下的所有商品页面;步骤S101,用户浏览状态记录。包括用户浏览页面所处的兴趣点,页面的商品名称,用户点击次数,用户停留时间,当前商品的用户数更新;步骤S102,空间兴趣维度计算。空间兴趣维度P的表达式为:P={(W0,IP0),(W1,IP1),...,(Wn,IPn)}其中,Wi代表用户访问兴趣点i的总次数,IPi描述的是用户对兴趣点i中每个商品的兴趣矢量,其表达式为:IPi=[w0,w1,...,wm]其中,wj代表用户对兴趣点中商品j的兴趣度,其计算方法是:其中,CNT(j)代表用户对兴趣点中商品j的访问次数,PU代表该商品所属兴趣点所拥有的用户总数,IPUj代表该商品所拥有的用户总数。步骤S103,时间兴趣维度计算。时间兴趣维度T表示为:T={(LT0,ST0),(LT1,ST1),...,(LTn,STn)}其中,LTi代表用户对兴趣点i访问的总在线时间,STi代表用户最近访问兴趣点的密度,用户对兴趣点i访问的总在线时间的计算公式为:其中,a代表用户访问的次数,tk代表第k次访问所花费的时间。用户对兴趣点i的最近访问兴趣密度的计算公式为:其中,θ代表一个固定的时间间隔,tkθ代表从当前时间开始往前kθ的时间范围内,用户访问兴趣点i的总时间,b是一个参数,用于设定访问兴趣密度计算的时间跨度范围。步骤S104,兴趣转移维度计算。兴趣转移维度C的表达式为:Ix,Iy代表两个不同的兴趣点x和y,P(Ix,Iy)代表用户的会话同时包含兴趣点x和y的概率,P(Ix)代表用户的会话包含兴趣点x的概率,P(Iy)代表用户的会话包含兴趣点y的概率,C(Ix,Iy)反映了兴趣点x和y的相关性,值大于1表示正相关,值小于1表示负相关,值等于1表示不相关。其中,n+1代表兴趣点的总个数,m+1代表每个兴趣点中的商品的总个数,i为整数,且0≤i≤n,j为整数,且0≤j≤m。本文档来自技高网...
一种基于网页浏览的用户兴趣建模方法

【技术保护点】

【技术特征摘要】
1.一种基于网页浏览的用户兴趣建模方法,其特征在于,包括如下步骤:1)根据电子商务网站的商品分类目录结构,将目录层次的最后一级目录作为用户的兴趣点,一个兴趣点包含该目录下的所有商品页面;2)用户的兴趣模型包括三个维度:空间兴趣维度P、时间兴趣维度T、兴趣转移维度C,通过用户在网站的浏览记录,计算上述三个维度;3)空间兴趣维度P用于描述用户兴趣的倾向性,其表示为:P={(W0,IP0),(W1,IP1),...,(Wn,IPn)}其中,Wi代表用户访问兴趣点i的总次数,IPi描述的是用户对兴趣点i中每个商品的兴趣矢量,其表达式为:IPi=[w0,w1,...,wm]其中,wj代表用户对兴趣点中商品j的兴趣度;4)时间兴趣维度T用于描述用户的长期兴趣和短期兴趣,其表示为:T={(LT0,ST0),(LT1,ST1),...,(LTn,STn)}其中,LTi代表用户对兴趣点i访问的总在线时间,STi代表用户最近访问兴趣点的密度;5)兴趣转移维度C用于描述用户在不同兴趣点之间的相关性,其表达式为:Ix,Iy代表两个不同的兴趣点x和y,P(Ix,Iy)代表用...

【专利技术属性】
技术研发人员:韩军
申请(专利权)人:纽海信息技术上海有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术