当前位置: 首页 > 专利查询>雅虎公司专利>正文

用于支持用户内容馈送的机制制造技术

技术编号:7978442 阅读:240 留言:0更新日期:2012-11-16 05:33
在一个实施例中,对于一个或多个内容产生者中的每一个,访问该内容产生者产生一个或多个内容项的内容产生速率;并且对于一个或多个内容消耗者中的每一个,访问该内容消耗者消耗一个或多个内容项的内容消耗速率。对于多个消耗者-产生者对中的每一对,基于内容消耗者的内容消耗速率和内容产生者的内容产生速率,在推送策略和拉取策略之间作出选择来用于将一个或多个内容项从内容产生者递送到内容消耗者,其中消耗者-产生者对包括内容消耗者之一和内容产生者之一并且该内容消耗者追随该内容产生者。

【技术实现步骤摘要】
【国外来华专利技术】
本公开概括而言涉及构造多个内容产生者和多个内容消耗者之间的多个内容馈送(content feed),更具体而言涉及分析每个内容馈送以在推送(push)策略和拉取(pull)策略之间为该内容馈送作出选择。
技术介绍
因特网用户想要保持跟进最新资讯。为此,诸如Twitter和Facebook之类的社交联网站点向用户提供由用户的朋友生成的状态更新、发布照片、电影评论等等的馈送。诸如My Yahoo和iGoogle之类的内容汇总者提供汇总来自多个RSS来源的馈送的定制网页。类似地,诸如Digg和Reddit之类的新闻汇总者提供关于像“娱乐”和“技术”之类的主题的最新报道的馈送,而诸如CNN. com之类的新闻站点则提供追随像“医疗保健争论”这样的细粒度主题的能力。近实时的内容馈送正变成许多流行的web应用的关键特征。示例包括Twitter和Facebook上的用户生成事件,以及iGoogle和My Yahoo上的关于特定主题的新闻报道。因此,能够高效地构造示出来自用户的馈送的最新内容的网页,对于这些web应用来说是越来越重要的。构造这样的馈送必须是快速的,以便网页迅速加载。然而,内容的宽扇出(fan-out)(例如一些来源具有许多追随者)和高偏差(skew)(例如扇出和速率在大范围中变化)使得难以缩放这种应用。
技术实现思路
本公开概括而言涉及构造多个内容产生者和多个内容消耗者之间的多个内容馈送,更具体而言涉及分析每个内容馈送以在推送策略和拉取策略之间为该内容馈送作出选择。在特定实施例中,对于一个或多个内容产生者中的每一个,访问该内容产生者产生一个或多个内容项的内容产生速率;并且对于一个或多个内容消耗者中的每一个,访问该内容消耗者消耗一个或多个内容项的内容消耗速率。对于多个消耗者-产生者对中的每一对,基于内容消耗者的内容消耗速率和内容产生者的内容产生速率,在推送策略和拉取策略之间作出选择来用于将一个或多个内容项从内容产生者递送到内容消耗者,其中消耗者-产生者对包括内容消耗者之一和内容产生者之一并且该内容消耗者关注该内容产生者。根据推送策略,内容项中的每一项是在该内容项由内容产生者产生时被从内容产生者递送到内容消耗者的。根据拉取策略,内容项中的每一项是在该内容项被内容消耗者消耗时被从内容产生者递送到内容消耗者的。下面在具体实施方式部分中结合接下来的附图更详细描述本公开的这些和其他特征、方面和优点。附图说明图I图示了用于为各个内容馈送确定策略的示例方法。图2图示了示例连接网络。图3图示了用于为各 个内容馈送确定策略的示例系统体系结构。图4图示了示例网络环境。图5图示了示例计算机系统。具体实施例方式现在参考如附图中图示的本公开的几个实施例来详细描述本公开。在以下描述中,阐述了许多具体细节以提供对本公开的透彻理解。然而,本领域的技术人员很清楚,没有这些具体细节中的一些或全部,也可实现本公开。在其他场合中,没有详细描述公知的过程步骤和/或结构,以免不必要地模糊本公开。此外,虽然是结合特定实施例来描述本公开的,但应当理解这里的描述并不想要将本公开限于所描述的实施例。相反,描述想要覆盖包括在如所附权利要求限定的本公开的精神和范围内的替换、修改和等同。内容馈送也称为web馈送或者简称为“馈送”,是一种用于在网络用户之间递送内容尤其是频繁更新的内容的机制。内容馈送可采取各种格式。例如,RSS(最常见的全称是“Really Simple Syndication”(真正简单整合))是广泛用于递送内容的web馈送格式族。类似地,经由内容馈送递送的内容可以是各种格式的,例如但不限于博客条目、新闻头条、事件、音频和视频。本公开设想到了任何可应用的内容馈送和内容。内容馈送概念上在各端连接内容产生者和内容消耗者。在特定实施例中,内容产生者或简称为产生者是产生可被一个或多个内容消耗者消耗的内容的实体。另一方面,内容消耗者或简称为消耗者是消耗由一个或多个内容产生者产生的内容的实体。在这个意义上,可以说消耗者“追随”(follow)由一个或多个产生者产生的内容或者是这些内容的追随者。内容可经由连接产生者和消耗者的馈送被从产生者递送到消耗者。注意,实体可以既是产生者也是消耗者,因为该实体可在某一时间产生内容供他人消耗,并且在另一时间消耗由他人产生的内容。从而,对于一实体为另一实体产生内容的馈送,该实体被称为产生者;而对于同一实体消耗来自另一实体的内容的另一馈送,该实体被称为消耗者。有时,两个实体,实体A和实体B,可以是彼此相互的产生者和消耗者。也就是说,在一些情况下,实体A可产生内容供实体B消耗;而在其他情况下,实体B可产生内容供实体A消耗。从而,可以有两个分开的馈送,两者都连接实体A和实体B。对于一个馈送,实体A是产生者并且实体B是消耗者;而对于另一馈送,实体B是产生者并且实体A是消耗者。此外,产生者可以是或不是其产生的内容的原始创建者。例如,产生者可产生原本由其他新闻记者撰写的新闻报道或者原本由其他摄影师拍摄的数字照片或者由该产生者自己记录的视频剪辑。在特定实施例中,追随应用(follows application)使得用户能够追随一个或多个兴趣(interest),其中兴趣可以例如是但不限于是另一用户或内容类别或主题。这里,追随兴趣的用户是消耗者。追随应用的目标是为追随兴趣的用户(即消耗者)产生馈送,该馈送是跨用户正追随的所有产生者的最近或最新内容的组合列表。例如,馈送可组合来自用户在社交站点上的所有朋友的最近状态更新,或者关于用户在内容汇总站点上的所有主题的最近报道。在一些情况下,用户可能偏好组合馈送,其既包括社交更新也包括主题更新。在特定实施例中,结合追随应用,产生者可为特定的可追随兴趣生成一系列按时间排序的、人类可读的内容。从而,对于用户(即消耗者),产生者可以是朋友、网站或从多个来源收集的关于特定主题的内容的汇总者。众所周知,追随应用是难以缩放的。该应用必须持续跟上高吞吐量的内容。例如,Twitter工程师著名地描述了多次重架构(re-architect) Twitter的后端以跟上随着系统变得更流行而发生的吞吐量迅速增大。同时,追随兴趣的用户期望其馈送页面迅速加载,这意味着必须严格限制延迟。这经常导致广泛的具体化(materialization)和缓存,相关联的有高资金和运营花费。例如,Digg选择了对大量数据进行去正规化(de-normalize)和具体化,以为其“绿色徽章应用”(例如追随我的朋友发掘了什么报道)减小延迟,这导致存储的数据从数十G字节到三T字节的爆增。 这种追随应用难以缩放的原因有若干个。首先,内容扇出,导致了系统中的负荷上的倍增效应。例如,每当Ashton Kutcher “发微博(tweet) ”时,他的状态更新就被传播到超过380万个追随者。即使是更温和的普通扇出也会引起缩放问题。第二,扇出具有高偏差,这使得难以选择适当的策略。例如,Facebook据报道对于像乐队和政治人物之类的宽扇出用户采用与具有窄得多的扇出的大多数用户相比不同的馈送具体化策略。为了解决例如追随应用所面对的问题中的至少一些并且改善应用性能,特定实施例选择性地具体化每个消耗者的馈送。在特定实施例中,来自高速率产生者的内容在查询时本文档来自技高网...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:亚当·艾丽·希尔博斯坦布莱恩·弗兰克·库伯拉嘎胡娜斯·拉马克里施那杰弗里·特雷西
申请(专利权)人:雅虎公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1