一种图书推荐方法及其系统技术方案

技术编号:12583341 阅读:82 留言:0更新日期:2015-12-23 23:37
本发明专利技术公开了一种图书推荐方法,该方法包括:步骤1、在对数据进行采集和预处理后,利用从读者对图书的历史访问数据和Web日志数据分析构建读者偏好挖掘模型挖掘读者的当前潜在偏好,并构建读者对商品的偏好矩阵;步骤2、根据构建的读者对商品偏好矩阵,考虑到矩阵数据的稀疏性,利用基于双向关联规则项目评分预测的方法对缺失值进行填充,降低数据稀疏性对推荐结果的影响,然后利用协同过滤算法,根据与目标读者偏好相似的邻居读者的图书喜好给目标读者提供推荐。本发明专利技术一种图书推荐方法及其系统,能将数据库中满足消费者偏好的图书信息优先推荐给消费者,以达到提高消费者检索图书信息效率的目的,节省了消费者检索时间,提高了检索效率。

【技术实现步骤摘要】

本专利技术涉及网络通信
,具体涉及一种图书推荐方法及其系统
技术介绍
信息技术代表着当今先进生产力的发展方向,信息技术的广泛应用使信息的重 要生产要素和战略资源的作用得W发挥。海量信息环境下,如何为用户及时、准确的提供符 合其偏好的信息内容成为急剧解决的问题。搜索引擎是最早的信息过滤技术,根据消费者 提供的若干关键词搜寻与之相匹配的商品。该技术因其简洁性和高效性被广泛应用,缺点 是过度依赖用户的手工操作和主观意识,针对不同偏好的用户给出相同的检索内容,难W 智能化的挖掘个体用户潜在偏好,推荐恰当的信息。 当今网络已成为人们日常生活不可或缺的生活工具,网上购物已成为一种潮流。 网络为我们提供了一个很好的平台,您可W足不出户就可W购买所需的物品。网络环境 下,在玲玻满目的商品选择空间中,亟待需要一个推荐助手帮助用户筛选商品。现有的推荐 系统在一定程度上降低了用户的商品筛选成本,但在分析用户的历史购买行为基础山提取 用户的偏好,忽略了用户偏好动态转移的特性,另外所分析的数据源也过于单一,使得提取 的用户偏好精度不高,使得为用户最终推荐的商品难W满足用户的需要。图书馆作为读者知识的来源发挥着巨大的作用,但图书馆众多图书资料也给读者 的筛选带来了巨大困难。随着网络的发展和普及,越来越多的图书馆建立网上图书信息检 索系统,帮助读者足不出户就可查找相关图书资料。但系统中海量图书信息也增加了读者 网上筛选信息的难度,因此急需一种推荐系统帮助读者在最短的时间找到自己感兴趣的图 书。
技术实现思路
本专利技术目的在于提供一种图书推荐方法及其系统,考虑到读者偏好的动态转移特 性,通过分析读者的历史偏好数据和对图书的浏览行为挖掘出读者的潜在偏好,然后基于 协同过滤思想,从数据库中为读者筛选满足当前偏好的图书,并W图书列表的形式显示给 读者,W达到降低读者信息检索成本,提高检索效率的目的。 本专利技术是通过W下技术方案实现的: -种图书推荐方法,该方法包括: 步骤1、在对数据进行采集和预处理后,利用从读者对图书的历史访问数据和Web 日志数据分析构建读者偏好挖掘模型挖掘读者的当前潜在偏好,并构建读者对商品的偏好 矩阵; 步骤2、根据构建的读者对商品偏好矩阵,考虑到矩阵数据的稀疏性,利用基于双 向关联规则项目评分预测的方法对缺失值进行填充,降低数据稀疏性对推荐结果的影响, 然后利用协同过滤算法,根据与目标读者偏好相似的邻居读者的图书喜好给目标读者提供 推荐。 进一步,步骤1中所述的偏好挖掘模型是从读者对图书的历史访问数据和Web日 志数据分别建模,最后构建的组合偏好挖掘模型,利用该模型评估读者对图书的偏好程度, 考虑到了读者的偏好动态转移特性,基于读者对图书访问历史的挖掘模型构建为读者对商 品的总浏览时间、有效浏览时间、总浏览频率和有效浏览频率的函数,考虑到图书在空间中 的相互关联特性,基于Web日志数据的偏好挖掘模型通过查找与目标图书空间上具有相互 关联特性的其它图书集,利用读者对集合中其它图书的浏览频率和图书权重评估读者对该 图书的偏好程度。 进一步,步骤2中所述的矩阵数据的稀疏性是通过与缺失值图书空间中相互关联 的其它图书的喜好来进行评估预测,所使用的协同过滤算法具体包括:A1、根据用户对图书的偏好程度矩阵,计算该读者与其他读者之间共同偏好的图 书集合,并保存到数据库中;A2、依据图书集合,利用化arson相似性度量方法计算该读者与其他读者的相似 性,并构建读者-读者相似性矩阵;A3、通过设置寻找最近邻居集合或用户相似性阔值,得到目标读者的最近邻居集 合;A4、利用步骤B2计算得到的读者-读者偏好相似性矩阵,结合最近邻居集合,利用 预测偏好计算公式求出读者对未曾借阅或浏览的图书偏好程度,构建图书推荐列表。为了达到上述目的,本专利技术还提供了一种图书推荐系统,包括数据管理模块、读者 偏好挖掘模块、读者推荐服务模块、推荐结果处理模块、系统管理模块,所述数据管理模块、 读者偏好挖掘模块、读者推荐服务模块和推荐结果处理模块的信息、资源的管理与调配,及 系统内部算法的选择,算法运行效率及推荐精度的监控与测度由所述系统管理模块统一管 理,其中,所述数据管理模块,收集读者的历史偏好数据和图书浏览行为信息,并对原始数 据进行处理后将处理后的数据传送给所述读者偏好挖掘模块,所述读者偏好挖掘模块,分析读者的历史偏好数据、图书浏览行为信息,并按照事 先构建的偏好挖掘模型评估读者对该商品的读者偏好数据,并将该读者偏好数据传送给所 述推荐服务模块,所述读者推荐服务模块,根据挖掘的读者偏好数据,构建读者对商品的偏好矩阵, 在此矩阵上运用基于项目的协同过滤算法为读者生成可能偏好的图书推荐列表,并将图书 推荐列表传送给所述推荐结果处理模块, 所述推荐结果处理模块将图书推荐列表W多种形式展示给读者,并获取读者对推 荐结果的反馈信息,将反馈信息进行综合分析处理后,动态调整图书推荐结果。 进一步,所述数据管理模块包括数据采集子模块和数据预处理子模块, 所述数据采集子模块,收集读者对图书的历史偏好信息,并从Web服务器中采集 读者访问日志, 所述数据预处理子模块,对采集到的不完整的、含有噪声的数据进行过滤,W便于 对读者偏好提取建模,所述数据预处理子模块包括数据集成、数据清理、数据的变换与规约 过程。 进一步,所述读者推荐服务模块包括协同过滤推理子模块和图书过滤与排序子模 块,所述协同过滤推理子模块,根据所运行的协同过滤推荐算法分析读者对商品的偏 好矩阵,在此基础上分析读者相似性和图书相似性, 所述图书过滤与排序子模块,过滤掉已经推荐过和读者明确表示不喜欢的图书, 并对过滤后的图书列表按照指定的标准进行排序处理。 进一步,所述推荐结果处理模块包括推荐结果展示子模块、读者反馈跟踪子模块 和推荐结果调整子模块; 所述推荐结果展示子模块,将推荐结果展示给读者,分为两个版块:猜你喜欢、借 阅该图书的读者还借阅了什么, 所述读者反馈跟踪子模块,收集跟踪读者对推荐的图书点击和浏览情况,所述推荐结果调整子模块,根据读者对推荐图书的反馈信息,结合所述读者推荐 服务模块生成的图书推荐列表,并动态调整图书推荐结果。 有益效果;本专利技术一种图书推荐方法及其系统,能将数据库中满足消费者偏好的 图书信息优先推荐给消费者,W达到提高消费者检索图书信息效率的目的,节省了消费者 检索时间,提高了检索效率。【附图说明】 图1为本专利技术一个实施例的模块结构示意图。【具体实施方式】 下面结合附图对本专利技术的实施例作详细说明;本实施例在W本专利技术技术方案为前 提下进行实施,给出了详细的实施方式和具体的操作过程,但本专利技术的保护范围不限于下 述的实施例。 实施例:当前第1页1 2 3 本文档来自技高网...

【技术保护点】
一种图书推荐方法,其特征在于,该方法包括:步骤1、在对数据进行采集和预处理后,利用从读者对图书的历史访问数据和Web日志数据分析构建读者偏好挖掘模型挖掘读者的当前潜在偏好,并构建读者对商品的偏好矩阵;步骤2、根据构建的读者对商品偏好矩阵,考虑到矩阵数据的稀疏性,利用基于双向关联规则项目评分预测的方法对缺失值进行填充,降低数据稀疏性对推荐结果的影响,然后利用协同过滤算法,根据与目标读者偏好相似的邻居读者的图书喜好给目标读者提供推荐。

【技术特征摘要】

【专利技术属性】
技术研发人员:赵玉荣
申请(专利权)人:上海研深信息科技有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1