【技术实现步骤摘要】
本专利技术涉及互联网信息处理技术,尤其涉及一种在互联网中相关文章的推荐处理方法和处理系统。
技术介绍
目前,随着互联网技术的发展,网络逐渐成为人们获取信息的重要来源,特别是在互联网进入Web2. O时代后,用户既是网站内容的浏览者,也是网站内容的制造者。用户参与创造的内容被称为用户生成内容(UGC,User Generated Content),在Web2. O时代,由于UGC的大量涌现,网络信息量呈几何级快速增长。为了将信息迅速、有针对性地提供给感兴趣的用户,各种网站系统、互联网社区系统等都在用户阅读给定文章时,向用户推荐相关文章,以减少用户查找文章造成的人机交互次数,方便用户找到目标文章。目前互联网系统中相关文章的推荐处理技术主要有以下三种(I)人工整理的方式,即通过编辑人员阅读大量文章,人为确定将某些相关的文章确定有针对某一文章的推荐文章。这种推荐处理方式的缺点是人工成本太高,效率低下,难以处理每天大量的UGC内容。(2)固定推荐方式,即在一个网站系统或社区系统中预先选定一批推荐文章(比如每天点击率高的、置顶的、质量好的文章等),针对给定文章(例如用户当前 ...
【技术保护点】
一种相关文章的推荐处理方法,其特征在于,包括:A、根据给定文章的内容特征检索出候选相关文章;B、根据每篇候选相关文章的用户特征,确定每篇候选相关文章的用户相关性;C、针对所述给定文章,优先推荐所述相关性高的候选相关文章。
【技术特征摘要】
1.一种相关文章的推荐处理方法,其特征在于,包括A、根据给定文章的内容特征检索出候选相关文章;B、根据每篇候选相关文章的用户特征,确定每篇候选相关文章的用户相关性;C、针对所述给定文章,优先推荐所述相关性高的候选相关文章。2.根据权利要求1所述的方法,其特征在于,所述步骤B进一步包括确定每篇候选相关文章与所述给定文章的内容相关性;所述步骤C中,进一步将每篇候选相关文章的所述内容相关性和用户相关性进行组合加权,得到综合相关性;针对所述给定文章,优先推荐所述综合相关性高的候选相关文章。3.根据权利要求1所述的方法,其特征在于,所述候选相关文章的用户相关性为用户属性相关性;或者为与给定用户的关系链相关性;或者为用户属性相关性和与给定用户的关系链相关性进行组合加权的分数。4.根据权利要求3所述的方法,其特征在于,当所述候选相关文章的用户相关性为用户属性相关性时,所述确定每篇候选相关文章的用户相关性的具体方法为预存用户属性对应的相关性评分标准,查询候选相关文章的作者属性,根据候选相关文章的作者属性和对应的相关性评分标准确定候选相关文章的用户属性相关性。5.根据权利要求3所述的方法,其特征在于,当所述候选相关文章的用户相关性为与给定用户的关系链相关性时,所述确定每篇候选相关文章的用户相关性的具体方法为预存关系链距离对应的评分标准,确定所述给定用户与候选相关文章作者的关系链距离,根据所述给定用户与候选相关文章作者的关系链距离和对应的评分标准确定候选相关文章与所述给定用户的关系链相关性。6.根据权利要求3或5所述的方法,其特征在于,所述给定用户为所述给定文章的阅读者,或者为所述给定文章的作者。7.根据权利要求2、3、4、或5所述的方法,其特征在于,当每篇候选相关文章的相关性包括多种相关性时;所述步骤C后进一步包括搜集所推荐的相关文章的点击反馈信息,根据所述点击反馈信息调整所述各相关性对应的权重因子的比重。8.根据权利要求1所述的方法,其特征在于,步骤C中,进一步包括根据应用场景对所述推荐文章的推荐结果信息进行选择展示。9.根据权利要求1所述的方法,其特征在于,该方法进一步包括建立和维护文章数据库,步骤A中,从所述文章数据库中检索候选相关文章;所述建立和维护文章数据库的具体过程包括al、建立文章数据库;a2、从互联网中筛选出待推荐的文章,将待推荐文章的特征数据存储到所述文章数据库中;a3、根据互联网中文章数据的变化,更新和排重所述文章数据库中的待推荐文章的特征数据。10.根据权利要求9所述的方法,其特征在于,步骤a2中所述筛选待推荐文章的方法包括以下至少一种方法根据文章标题可读性进行筛选;根据文章内容可读性进行筛选; 对作弊垃圾类文章进行筛选。11.根据权利要求1所述的方法,其特征在于,该方法进一步包括建立和维护用户数据库,步骤B中,进一步包括从所述用户数据库获取所述用户特征; 所述建立和维护用户数据库的具体过程包括 bl、建立用户数...
【专利技术属性】
技术研发人员:刘建,罗侃,杨志峰,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。