推荐信息的方法和装置制造方法及图纸

技术编号:9906943 阅读:73 留言:0更新日期:2014-04-11 05:55
本发明专利技术公开了一种推荐信息的方法和装置,属于互联网领域。所述方法包括:获取指定用户在论坛中的搜索行为数据、浏览行为数据和对推荐内容的点击行为数据;分别对所述搜索行为数据、所述浏览行为数据和对推荐内容的点击行为数据进行预处理得到第一推荐结果、第二推荐结果和第三推荐结果;对所述第一推荐结果、所述第二推荐结果和所述第三推荐结果根据权重进行分配整合,得到推荐给所述指定用户的推荐内容。本发明专利技术综合考虑了搜索行为数据、浏览行为数据和对推荐内容的点击行为数据,丰富了推荐所利用的数据,提升了推荐的准确性。

【技术实现步骤摘要】
【专利摘要】本专利技术公开了一种推荐信息的方法和装置,属于互联网领域。所述方法包括:获取指定用户在论坛中的搜索行为数据、浏览行为数据和对推荐内容的点击行为数据;分别对所述搜索行为数据、所述浏览行为数据和对推荐内容的点击行为数据进行预处理得到第一推荐结果、第二推荐结果和第三推荐结果;对所述第一推荐结果、所述第二推荐结果和所述第三推荐结果根据权重进行分配整合,得到推荐给所述指定用户的推荐内容。本专利技术综合考虑了搜索行为数据、浏览行为数据和对推荐内容的点击行为数据,丰富了推荐所利用的数据,提升了推荐的准确性。【专利说明】推荐信息的方法和装置
本专利技术涉及互联网领域,特别涉及一种推荐信息的方法和装置。
技术介绍
随着网络的发展,出现了论坛社区。论坛社区中聚合了一群兴趣相似的用户,在各个版面中讨论各种最近热门的话题。在论坛中,用户最基本的目标是阅读内容获取信息。所以为了给用户提供更多的内容,在用户阅读一篇内容时,自动为用户推荐主题相关的内容,可以方便用户获取相关信息,并增加网站的黏性和点击率。现有的一种内容推荐方法是基于用户浏览行为的推荐方法,该方法假设浏览相同内容的用户具有相同的兴趣,对论坛中用户的浏览行为进行分析,建立用户/浏览内容的二维矩阵,在此矩阵上利用协同过滤等算法计算内容间的关联程度,从而得到推荐结果,将推荐结果推荐给用户。在实现本专利技术的过程中,专利技术人发现现有技术至少存在以下问题:在一个论坛中,同一个用户的兴趣可能是多方面的,用户的浏览行为可能涵盖了不同主题的内容,现有技术中简单假设浏览相同内容的用户具有相同的兴趣,会导致不同主题的内容被认为是主题相近的,这样得到的推荐结果不一定是用户感兴趣的内容,降低了推荐给用户的为内容为用户感兴趣的内容的准确性。且,当论坛的数据量相对较少,并且用户的浏览行为数据规模也相对较小时,会造成用户/浏览内容二维矩阵比较稀疏,严重影响最后的推荐效果,所以单纯的通过用户的浏览行为得到的推荐结果对于用户而言不一定准确,影响论坛社区对用户推荐结果的准确性。
技术实现思路
为了提高论坛中推荐内容的准确性,本专利技术实施例提供了一种推荐信息的方法和装置。所述技术方案如下:—方面,提供了一种推荐信息的方法,所述方法包括:获取指定用户在论坛中的搜索行为数据、浏览行为数据和对推荐内容的点击行为数据;分别对所述搜索行为数据、所述浏览行为数据和对推荐内容的点击行为数据进行预处理得到第一推荐结果、第二推荐结果和第三推荐结果;对所述第一推荐结果、所述第二推荐结果和所述第三推荐结果根据权重进行分配整合,得到推荐给所述指定用户的推荐内容。所述对所述搜索行为数据进行预处理得到第一推荐结果,包括:过滤掉所述搜索行为数据中的噪音数据,得到去噪数据,其中,所述去噪数据包括所述指定用户在所述论坛中输入的查询字符串;统计所述每个查询字符串Qi引发的点击帖子Ti的次数;根据所述每个查询字符串Qi引发的点击所述帖子Ti的次数,计算所述帖子Ti被所述每个查询字符串引发的点击概率Wi ;根据所述帖子Ti被所述每个查询字符串引发的点击概率Wi,建立引发点击所述帖子Ti查询向量,其中所述查询向量为(W1, w2,..., Wi,..., wn> ;根据所述建立的每个帖子的查询向量计算任意所述任意两个帖子间的相关度,得到第一推荐结果。所述对所述浏览行为数据进行预处理得到第二推荐结果,包括:对所述浏览行为数据进行分析,获取所述论坛中被所述指定用户浏览过的帖子;根据所述被浏览的帖子所属的版面,将所述指定用户的浏览行为划分成至少一个父主题段;计算所述每个父主题段中的帖子标题的文本相似度,获得所述每个父主题段下子主题段间的分界线;根据所述子主题段间的分界线将所述相应的父主题段进行划分,得到至少一个子主题段;根据所述每个子主题段建立所述指定用户的浏览行为矩阵,所述浏览行为矩阵中包括:子主题和所述论坛中的帖子在所述子主题中出现的次数;对所述浏览行文矩阵进行相关度计算,得到第二推荐结果。所述对所述点击行为数据进行预处理得到第三推荐结果,包括:对所述点击行为数据进行分析,获得所述论坛中每篇帖子的相关贴和所述每篇相关帖被点击的次数;根据所述每篇相关帖被点击的次数和所述相关帖被点击的时间与当前时间的关系,对所述论坛中的相关贴进行重排序,使得被点击次数多的且被点击时间与所述当前时间的差值在预设范围之内的相关帖排在队列的前端,得到第三推荐结果。所述对所述第一推荐结果、所述第二推荐结果和所述第三推荐结果根据权重进行分配整合,得到推荐给所述指定用户的推荐内容,包括:分别计算所述论坛中的每一篇帖子的相关贴在所述第一推荐结果、所述第二推荐结果和所述第三推荐结果中出现的第一平均概率、第二平均概率和第三平均概率;根据所述第一平均概率、第二平均概率和第三平均概率分别确定所述第一推荐结果的权重、所述第二推荐结果的权重和所述第三推荐结果的权重;基于所述第一推荐结果的权重、所述第二推荐结果的权重和所述第三推荐结果的权重对所述第一推荐结果、所述第二推荐结果和所述第三推荐结果进行分配整合,得到推荐给所述指定用户的推荐内容;或,根据预先设定的所述第一推荐结果的第一权重、所述第二推荐结果的第二权重和所述第三推荐结果的第三权重,对所述第一推荐结果、所述第二推荐结果和所述第三推荐结果进行分配整合,得到推荐给所述指定用户的推荐内容。另一方面,提供了一种推荐信息的装置,所述装置包括:获取模块,用于获取指定用户在论坛中的搜索行为数据、浏览行为数据和对推荐内容的点击行为数据;预处理模块,用于分别对所述搜索行为数据、所述浏览行为数据和对推荐内容的点击行为数据进行预处理得到第一推荐结果、第二推荐结果和第三推荐结果;整合模块,用于对所述第一推荐结果、所述第二推荐结果和所述第三推荐结果根据权重进行分配整合,得到推荐给所述指定用户的推荐内容。所述预处理模块,包括:过滤单元,用于过滤掉所述搜索行为数据中的噪音数据,得到去噪数据,其中,所述去噪数据包括所述指定用户在所述论坛中输入的查询字符串;统计单元,用于统计所述每个查询字符串Qi引发的点击帖子Ti的次数;第一计算单元,用于根据所述每个查询字符串Qi引发的点击所述帖子Ti的次数,计算所述帖子Ti被所述每个查询字符串引发的点击概率Wi ;第一建立单元,用于根据所述帖子Ti被所述每个查询字符串引发的点击概率Wi,建立引发点击所述帖子Ti查询向量,其中所述查询向量为〈W” W2,..., Wi,..., wn> ;第二计算单元,用于根据所述建立的每个帖子的查询向量计算任意所述任意两个帖子间的相关度,得到第一推荐结果。所述预处理模块,包括:获取单元,用于对所述浏览行为数据进行分析,获取所述论坛中被所述指定用户浏览过的帖子;第一划分单元,用于根据所述被浏览的帖子所属的版面,将所述指定用户的浏览行为划分成至少一个父主题段;第三计算单元,用于计算所述每个父主题段中的帖子标题的文本相似度,获得所述每个父主题段下子主题段间的分界线;第二划分单元,用于根据所述子主题段间的分界线将所述相应的父主题段进行划分,得到至少一个子主题段;第二建立单元,用于根据所述每个子主题段建立所述指定用户的浏览行为矩阵,所述浏览行为矩阵中包括:子主题和所述论坛中的帖子在所本文档来自技高网
...
推荐信息的方法和装置

【技术保护点】
一种推荐信息的方法,其特征在于,所述方法包括:获取指定用户在论坛中的搜索行为数据、浏览行为数据和对推荐内容的点击行为数据;分别对所述搜索行为数据、所述浏览行为数据和对推荐内容的点击行为数据进行预处理得到第一推荐结果、第二推荐结果和第三推荐结果;对所述第一推荐结果、所述第二推荐结果和所述第三推荐结果根据权重进行分配整合,得到推荐给所述指定用户的推荐内容。

【技术特征摘要】

【专利技术属性】
技术研发人员:姚从磊翟俊杰王亮温泉李亚楠
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1