一种基于图书内容的图书推荐方法技术

技术编号:7561488 阅读:256 留言:0更新日期:2012-07-14 11:19
本发明专利技术公开了一种图书推荐方法,主要包括以下步骤:获取图书的内容信息,主要包括书名、作者、内容摘要、目录;基于上述属性信息计算图书之间的相似度;根据相似度排名结合库存、销售、促销数据推荐图书。本发明专利技术仅利用图书之间内容上的相似性计算其相关性,最后把与该书最相关的图书作为推荐结果。

【技术实现步骤摘要】

本专利技术涉及计算机
,尤其涉及到基于内容的图书推荐方法。技术背景近年来,随着计算机与网络技术的进步,电子商务得到了快速发展,尤其是网上图书零售发展十分迅速。网上图书零售不但能给电子商务企业带来可观的收益,更重要的是能吸引人气,带来客户流量,它已经成为大型电子商务企业的核心业务之一。由于网上书店可以在网站上呈现比实体书店更多的内容,为了帮助客户快速找到合适的图书,同时也为了吸引客户购买更多的图书,需要采用图书推荐系统自动为客户生成图书推荐。目前,大多数的推荐系统都是针对商品类别进行分类,然后通过协同推荐或同类商品销售排行来进行推荐。其缺点有二 第一,这些推荐系统都是针对百货商品来分类的, 没有针对图书内容做优化,仅仅只能将图书照搬百货商品的做法分门别类做推荐,导致推荐效果不佳;第二,其采用的协同推荐方法对于已经形成销售规模,具备大量销售数据的网站比较适用,但是对于刚刚上线的图书网站,由于缺少交易数据,难以形成有效的推荐。另外,目前很多的推荐系统都没有反映存货情况,向用户推荐的商品最终却缺货,显然会大大降低用户体验。
技术实现思路
有鉴于此,一种能反映图书内容,能够结合库存信息、促销信息的图书推荐方法是十分有益的。为了解决上述问题,本专利技术提供了一种基于书名、作者、内容摘要、目录等信息,并结合库存数据和促销信息的图书推荐方法,其技术方案包括在新加入一本图书时,首先获取其内容信息,并将这些内容存为特征向量。比如, 将书名存为特征向量dt,将作者存为特征向量da,将内容摘要存为特征向量ds,将目录存为特征向量d。。这些特征向量将进一步处理提取关键词和权重,并用于图书之间相关性计算的特征参数。其次,针对上述4种特征向量分别进行特征词的提取和特征词的权重计算,计算结果表示为d = (w1 W2, ... , wn)其中,Wi代表特征词i出现的次数也即特征词i的权重;然后,利用基于权重融合的余弦相似度函数来计算图书间的相关性,计算公式如下C(Bx, By) = aXsim(dt,x,dt,y)+bXsim(da,x,da,y)+cXsim(ds,x,ds,y)+dX sim(dc,x,dc,y)其中,C是图书之间的相关度,Bx By代表图书χ和y,sim(dx, dy)是余弦相似度函数,a、b、c、d是不同特征向量的权重;融合图书的四种特征向量dt、da、ds、d。得到图书间基于内容的相关系数C。接下来,根据和不同图书之间相关系数C的大小,选取相关系数最大的N本图书, 得到该图书的推荐列表L0。最后,结合库存数据和促销信息对LO重新排序得到最终的推荐列表L。本专利技术还可以通过下述方法强化推荐效果上述基于权重融合的余弦相似度函数用于计算图书之间相关性,其权重取值设定为 a = b = c = d = 25%。上述余弦相似度函数sim(dx,dy)用于计算项目dx和dy的相关程度,其计算公式为权利要求1.一种基于内容的图书推荐方法,其特征在于,包括如下步骤1)获取图书的书名、作者、内容摘要、目录,将上述内容分别存为特征向量d,其中屯代表书名,da代表作者,4代表内容摘要,d。代表目录;2)针对特征向量d进行特征词提取和权重计算,计算结果表示为d = (W1, W2,…,wn)其中,Wi代表特征词i出现的次数也即特征词i的权重;3)利用基于权重融合的余弦相似度函数来计算图书间的相关性,计算公式如下C (Bx, By) = aXsim(dt,x, dtjy) +bXsim(dajX, da,y)+cXsim(ds,x,ds, y)+dX sim(dc,x,dc,y)其中,C是图书之间的相关度,BX民代表图书乂和7,8加((1!£,(^)是余弦相似度函数,a、 b、c、d是不同特征向量的权重;4)根据图书之间的相关度计算结果,按相关度由高到低顺序选取N本图书,得到推荐图书列表LO ;5)根据图书的库存数据以及销售数据、促销信息对LO重新排序,得到最终的推荐图书列表L。2.根据权利要求1所述的方法,其特征在于,特征向量权重a、b、c、d的取值为a= b =c = d = 25%。3.根据权利要求1或2所述的方法,其特征在于,余弦相似度函数sim(dx,dy)的计算公式为4.根据权利要求1所述的方法,其特征在于,图书库存、销售、促销信息对LO重排序的方法如下首先在LO中去除库存为0的图书得到有存货的图书推荐列表Li,其次根据图书销售量大小对Ll重排序得到L2,最后将L2中促销的图书按序排在最前,得到最终的推荐列表L。全文摘要本专利技术公开了一种图书推荐方法,主要包括以下步骤获取图书的内容信息,主要包括书名、作者、内容摘要、目录;基于上述属性信息计算图书之间的相似度;根据相似度排名结合库存、销售、促销数据推荐图书。本专利技术仅利用图书之间内容上的相似性计算其相关性,最后把与该书最相关的图书作为推荐结果。文档编号G06F17/30GK102542046SQ201110447928公开日2012年7月4日 申请日期2011年12月27日 优先权日2011年12月27日专利技术者韩军 申请人:纽海信息技术(上海)有限公司本文档来自技高网...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员:韩军
申请(专利权)人:纽海信息技术上海有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术