图书推荐系统和方法技术方案

技术编号:18083888 阅读:57 留言:0更新日期:2018-05-31 12:25
本发明专利技术公开了一种图书推荐系统和方法,其中图书推荐系统包括依次以数据流联结的图形数据库模块、接口模块和输出模块;所述图形数据库模块采用Neo4j,所述Neo4j用于存储图书推荐所使用的数据源信息;所述接口模块用于将Neo4j中的数据源信息通过数据挖掘算法计算出待推荐的图书信息;所述输出模块用于输出所述待推荐的图书信息。本发明专利技术提供的图书推荐系统和方法采用Neo4j存储推荐算法的数据源,相对于关系数据库来说,可以更快、更高效地计算出推荐图书信息,并且基于Neo4j的数据挖掘算法能够有效降低算法的复杂度,降低对服务器资源的要求,能够有效提高了数据挖掘算法运行效率。

【技术实现步骤摘要】
图书推荐系统和方法
本专利技术涉及电子商务网站中图书推荐
,特别涉及一种图书推荐系统和方法。
技术介绍
常见的推荐算法有基于内容的推荐、基于关联的推荐和协同过滤推荐等。基于内容的推荐算法能为具有特殊兴趣爱好的用户进行推荐,能够推荐新的或不是很流行的项目,该推荐算法已有较稳定的技术,但由于物品的属性有限,很难有效得到更多数据,物品相似度分析仅仅依赖于物品本身特征,没有考虑人对物品的态度。基于关联规则的推荐能发现新的兴趣点,不需要领域知识,算法第一步关联规则的发现最为关键,但该步非常耗时;此外商品名称的同义性问题也是关联规则的一个难点,个性化程度低。协同过滤算法原理简单,方便快捷,被广泛应用,但是随着网站的扩大与用户数量的增加,该算法也出现了很多挑战及问题,比如稀疏问题和扩展性问题。由于各种推荐方法都有优缺点,所以在实际应用中,组合推荐经常被采用。比较流行的组合方法有:加权组合法、切换组合法、分区组合法和分层组合法。其中分区组合法采用多种推荐机制,并将不同的推荐结果分不同的区域显示给用户。亚马逊网,当当网等很多电子商务网站都是采用这种推荐方式。虽然组合方法尽其所能地为用户提供准确且丰富的推荐信息,但是并没有从根本上解决一些算法存在的问题,例如协同过滤的扩展性问题。而且组合方法用到的算法越多,计算难度就越大,对服务器的要求也就越高。当用户量达到一定程度时,不可避免地需要提高对服务器的成本投入以保证推荐信息的准确性。推荐算法的效率除了与算法本身有关,还与算法所应用的数据源有关。一般的数据挖掘都是采用基于关系数据模型的数据仓库。关系数据模型建立在严格的数学基础上,具有较高的数据独立性和安全性,使用简单,是目前应用最广泛的数据技术。但是随着数据规模与数据复杂性的增加,关系模型已经无法满足某些领域的需要,如社交网络。当数据对象关联关系固定时,关系数据库可以很好地工作;然而当数据规模庞大,数据对象间的关系复杂且动态变化时,关系数据库就会面临很多问题。
技术实现思路
本专利技术要解决的技术问题是为了克服现有技术中电子商务网站在图书推荐时推荐准确性和效率无法同时兼顾且服务器投入成本较高的缺陷,提供一种能够有效兼顾图书推荐时准确性和运行效率且能降低成本的图书推荐系统和方法。本专利技术是通过下述技术方案来解决上述技术问题:一种图书推荐系统,其特点在于,包括依次以数据流联结的图形数据库模块、接口模块和输出模块;所述图形数据库模块采用Neo4j(面向网络的图形数据库),所述Neo4j用于存储图书推荐所使用的数据源信息;所述接口模块用于将Neo4j中的数据源信息通过数据挖掘算法计算出待推荐的图书信息;所述输出模块用于输出所述待推荐的图书信息。本方案中,采用Neo4j图数据库作为图书推荐算法的数据源,创新性地引入了Neo4j图数据库而不是采用传统关系数据库进行关联推荐,由于Neo4j数据库将结构化数据,包括实体数据和关系数据存储在图上,即存储在节点和联系上,因此能够快速获取与某个节点的关联信息,而协同过滤和关联规则的推荐算法则需要获取不同实体之间的关联信息。因此推荐算法的数据源采用Neo4j相对于关系数据库而言,可以更快、更高效地计算出推荐图书信息。并且基于Neo4j的数据挖掘算法能够有效降低算法的复杂度,降低对服务器资源的要求,能够有效提高数据挖掘算法运行效率。较佳地,所述数据源信息包括图书信息、读者信息、中图分类法的类别信息、读者和图书间的访问行为信息、图书和所述类别信息之间的归类信息、所述类别信息之间的主从关系信息。本方案中,读者和图书间的访问行为信息可以是读者和图书间的阅读或者购买等行为信息。基于Neo4j的数据挖掘算法,将图书信息、读者信息、中图分类法的类别信息作为节点,将读者和图书间的访问行为信息、图书与类别之间的归属关系、类别之间的主从关系作为节点间联系存入Neo4j数据库,然后根据这些信息进行筛选、关联、排序等操作,获得待推荐的图书信息。另外,通过中图分类法进行图书分类与读者归类,使得分类更加具体,且类别之间有明确的层级关系。较佳地,所述图形数据库模块还包括关系数据库和ETL(Extract-Transform-Load,抽取-转换-加载)模块,所述ETL模块用于将所述关系数据库中的数据转换成所述Neo4j所需格式的数据。本方案中,Neo4j数据库用于存储数据挖掘算法所需的所有数据,具体包括网站运行过程中产生的业务数据直接存入该数据库,随后能够通过Cypher(一种不用编写复杂的查询代码即可实现对图数据库的操作的查询语句)语句查询该数据库获取所需信息;此外,也可以通过ETL模块定期从关系数据库抽取出以往业务积累的所需关系数据,然后对关系数据进行过滤、转换操作,最后将转换后的数据导入Neo4j数据库。较佳地,所述接口模块包括缓存模块和推荐算法模块,所述缓存模块用于缓存所述待推荐的图书信息,所述推荐算法模块用于根据Neo4j中的数据源信息计算出所述待推荐的图书信息。本方案中,接口模块设有缓存机制,如Redis(一种开源数据库)缓存,其用于将经常调用的推荐结果进行缓存处理,再次调用时直接返回缓存模块内的内容,由此能够提高推荐效率,降低服务器运行压力。缓存待推荐的图书信息时,还可以通过设定缓存时效定期清除缓存数据,从而保证推荐图书信息有较高的时效性。较佳地,所述输出模块包括显示模块,所述显示模块用于将所述待推荐的图书信息显示在目标网站。本方案中,显示模块用于将接口模块返回的待推荐的图书信息展示在网站的相应位置,还可以进一步实现在PC(personalcomputer,个人计算机)端、移动端等终端设备具有良好的展示效果。较佳地,图书的索书号与所述中图分类法中的类别编号对应。本方案中,根据图书的索书号对应到中图分类法中的类别编号,从而直接对图书进行归类,使图书能够自动归类,省去录入图书时归类的工作量,中图分类法的运用同时丰富了推荐图书的方式,提高分类效率。本专利技术还提供了一种图书推荐方法,其特点在于,使用前述的图书推荐系统,所述图书推荐方法包括以下步骤:S1、从所述Neo4j中获取阅读过某本图书的其它读者的信息和所述其它读者的阅读信息,所述某本图书为网站上被访问的图书;S2、所述接口模块根据所述其它读者的信息和所述其它读者的阅读信息计算出所述待推荐的图书信息;S3、所述图书推荐系统输出所述待推荐的图书信息。本方案中,使用前述的图书推荐系统,能够实现基于访问行为的推荐方法,其中访问行为包括阅读或购买行为等。当用户在网站内对某本图书有阅读或购买行为,该行为结束后图书推荐系统,从Neo4j数据库中获取阅读过该图书的其它读者,并通过这些读者的阅读行为记录等阅读信息计算出这些读者最近阅读的热门图书信息,将这些图书新信息作为待推荐的图书信息输出到网站的用户端。较佳地,所述接口模块包括缓存模块,所述缓存模块用于缓存所述待推荐的图书信息,步骤S1之前还包括以下步骤:S0、在所述缓存模块中查找是否有所述某本图书的所述待推荐的图书信息,如果有则进入步骤S3,否则执行步骤S1。本方案中,接口模块设有缓存机制,当接到推荐请求时,会优先从缓存模块中查找是否有待推荐的图书信息,如果缓存中不存在,就运行相应推荐算法,如果有,直接将缓存模块中的待推荐的图书信本文档来自技高网
...
图书推荐系统和方法

【技术保护点】
一种图书推荐系统,其特征在于,包括依次以数据流联结的图形数据库模块、接口模块和输出模块;所述图形数据库模块采用Neo4j,所述Neo4j用于存储图书推荐所使用的数据源信息;所述接口模块用于将Neo4j中的数据源信息通过数据挖掘算法计算出待推荐的图书信息;所述输出模块用于输出所述待推荐的图书信息。

【技术特征摘要】
1.一种图书推荐系统,其特征在于,包括依次以数据流联结的图形数据库模块、接口模块和输出模块;所述图形数据库模块采用Neo4j,所述Neo4j用于存储图书推荐所使用的数据源信息;所述接口模块用于将Neo4j中的数据源信息通过数据挖掘算法计算出待推荐的图书信息;所述输出模块用于输出所述待推荐的图书信息。2.如权利要求1所述的图书推荐系统,其特征在于,所述数据源信息包括图书信息、读者信息、中图分类法的类别信息、读者和图书间的访问行为信息、图书和所述类别信息之间的归类信息、所述类别信息之间的主从关系信息。3.如权利要求1所述的图书推荐系统,其特征在于,所述图形数据库模块还包括关系数据库和ETL模块,所述ETL模块用于将所述关系数据库中的数据转换成所述Neo4j所需格式的数据。4.如权利要求1所述的图书推荐系统,其特征在于,所述接口模块包括缓存模块和推荐算法模块,所述缓存模块用于缓存所述待推荐的图书信息,所述推荐算法模块用于根据Neo4j中的数据源信息计算出所述待推荐的图书信息。5.如权利要求1所述的图书推荐系统,其特征在于,所述输出模块包括显示模块,所述显示模块用于将所述待推荐的图书信息显示在目标网站。6.如权利要求2所述的图书推荐系统,其特征在于,图书的索书号与所述中图分类法中的类别编号对应。7.一种图书推荐方法,其特征在于,使用如权利要求1所述的图书推荐系统,所述图书推荐方法包括以下步骤:S1、从所述Neo4j中获取阅读过某本图书的其它读者的信息...

【专利技术属性】
技术研发人员:黄浩炜金杰雷向欣许卫静
申请(专利权)人:上海阿法迪智能标签系统技术有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1