一种文档推荐方法及装置制造方法及图纸

技术编号:8161575 阅读:164 留言:0更新日期:2013-01-07 19:34
本发明专利技术公开了一种文档推荐方法及装置,一种文档推荐方法包括:在预置的文档集合中,以文档A为中心,根据文档内容的相似程度对文档进行聚簇;根据当前存在的文档关联信息,确定与文档A同簇文档的关联文档;利用所确定的与文档A同簇文档的关联文档,构成文档A的第一推荐结果。与现有技术相比,应用本发明专利技术所提供的技术方案,不需要人工对新发布文档进行预处理,从而有效地节省了人力成本。这样即便是新发布的文档,也可以为其生成推荐结果,有效解决了冷启动问题与数据稀疏问题。

【技术实现步骤摘要】

本专利技术涉及计算机应用
,特别是涉及一种文档推荐方法及装置
技术介绍
随着互联网技术的发展,互联网上的信息量呈爆炸式增长。为了让用户能够更方便快捷地获得这些信息,推荐技术在信息系统得到了广泛应用。其中,关联推荐技术又成为推荐技术的一个重要组成部分,关联推荐技术的基本思想是,基于信息的一个或多个特征,找到不同信息之间的相关性,并进一步建立信息之间的联系关系,当用户浏览某一信息时,推荐系统会将与该信息具有联系关系的信息也推荐给用户。 对于关联推荐技术的研究重点,除了挖掘更多可用于推荐的特征之外,还在于如何在实际应用中根据这些特征建立起信息之间的关系。目前,较为常用的方式是根据用户行为建立信息之间的关系,以文档推荐为例,可以根据用户对文档的浏览、搜索等历史行为记录,分析用户的兴趣,然后根据单个或多个用户的兴趣相似程度,建立文档之间的联系关系,最后根据所建立的关系进行文档推荐。但是,现有关联推荐方法,存在着很严重的冷启动问题与数据稀疏问题,所谓冷启动是指新发布的信息,数据稀疏则是指对于有些信息,其本身的相关用户行为记录很少(或为0),因此难以根据用户行为产生推荐结果。目前常用的解本文档来自技高网...
一种文档推荐方法及装置

【技术保护点】
一种文档推荐方法,其特征在于,包括:在预置的文档集合中,以文档A为中心,根据文档内容的相似程度对文档进行聚簇;根据当前存在的文档关联信息,确定与文档A同簇文档的关联文档;利用所确定的与文档A同簇文档的关联文档,构成文档A的第一推荐结果。

【技术特征摘要】

【专利技术属性】
技术研发人员:徐兴军
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1