用于视频缓存索引的系统和方法技术方案

技术编号:8963324 阅读:129 留言:0更新日期:2013-07-25 23:11
本发明专利技术公开了用于对在内容缓存内的缓存数据结构中的内容进行索引的方法和系统。该方法和系统识别与所接收到的内容请求相关联的至少一个表征数据,并将该至少一个表征数据输入到哈希函数中,以生成用于识别与缓存数据结构中所请求内容相关联的条目的索引。该至少一个表征数据可以包括与所接收到的内容请求相关联的内容的一部分、与所接收到的内容请求相关联的统一资源定位符(URL)的一部分、与所接收到的内容请求相关联的IP地址、与所接收到的内容请求相关联的内容长度、以及从与所接收到的内容请求相关联的URL中解析的一个或多个参数。

【技术实现步骤摘要】
【国外来华专利技术】
本公开针对Web内容输送的领域,并且更具体地,针对用于更有效地对视频内容进行缓存的系统和方法。
技术介绍
在过去的十年里,能够向用户渲染视频的计算装置的数量已经大大增加了。不久前,用户需要高端个人计算机或计算机工作站来在可接受的帧速率下渲染数字视频。今天,视频图形硬件技术上的改进已经使视频渲染对于大众可用。互联网连接装置现在能够以对于许多用户可接受的质量水平来渲染视频。在此同一时期期间,宽带互联网服务已经变得广泛可用。具有宽带互联网服务的用户可以以非常低的成本下载大量数据(包括视频)到他们的互联网连接装置。一旦用户开始下载大型视频文件,用于观看数字视频的内置到程序中的流技术允许用户在相同视频的后面部分仍正在进行下载的同时,观看视频的开始部分。共同地,这些技术创新已经大大增加了用户下载视频内容的胃口。此外,在过去的几年里,用于生成数字视频的专业硬件和软件已经变得对于普通消费者更加可访问。许多廉价数码相机能够捕获数字视频的片段,而一些专业但廉价的装置甚至能够捕获可以被容易地上传到互联网的高清数字视频。这些技术和经济创新已经显著增加了用户制作可下载视频内容的能力。许多受欢迎的网站,通过为用户提供上传他们的视频并使其公开可得以供其他人观看的简单手段来迎合这种兴趣,从而为自我表达创建了非常公共的场所。这些发展已经导致了消费者对于互联网上输送的视频内容的兴趣激增。目前,网站每月向数亿用户输送数百万小时的视频内容。一些受欢迎的网站,例如YouTube (www.youtube, com),完全聚焦于向用户输送视频内容。其它受欢迎的网站,例如CNN (www.cnn.com),用特别令人感兴趣的短视频剪辑或片段来对传统新闻和非视频内容进行补充。消费者对视频内容的兴趣如此之大以至于很少有受欢迎的网站在无论如何都不提供视频内容的同时仍旧受欢迎。尽管有许多在线向用户输送大量视频内容的网站,但输送视频内容仍然是昂贵的命题。通过互联网输送大型视频内容文件,趋于将大量处理负载置于传递该内容的网络基础设施以及将该内容传送给用户的Web服务器上(相对于输送文本或静态图像内容)。这种负担在采用无线技术的网络基础设施上尤其严重,因为无线网络一般比有线网络提供更低的通信吞吐量,且无线网络一般比有线网络遭受更严重的分组丢失和更大的位置依赖吞吐量。例如,典型的网页内渲染的静止图像可以是200k字节长度,而完整长度的文本文章可以是IOk字节长度。与之相比,取决于视频的内容和分辨率以及用来编码视频的压缩技术,五分钟视频片段则可能是从几兆字节到100兆字节或更多的任何地方。由于网络带宽和网络服务器能力是有限的,且附加的网络带宽和网络服务器能力对于视频内容提供者可能是昂贵的,因此较大视频文件相比较小的文本或静态图像内容对网络和Web服务器基础设施的负担更重。这种负担的结果是,相对于可由输送文本或静态图像内容的相同网络和Web服务器基础设施进行服务的用户数量,当提供视频内容服务时,较少的用户可以获得网络和Web服务器基础设施的服务。因此,如果由于超负荷的Web服务器或超负荷的网络基础设施引起他们的网站似乎很慢,则寻求吸引广大用户群的公司或者面临增加他们内容输送能力,或者有失去用户的风险。由于客户损失对Web业务来说可能是致命的,所以大多数公司选择随着他们客户基础的增长而增加他们的内容输送能力。图1图示了能够利用互联网连接装置向用户输送视频内容的现有技术系统100。如图所示,系统100包括用户互联网连接装置102、互联网104、Web服务器106、数据库112以及大容量存储装置114。用户互联网连接装置102通过网络连接108耦接到互联网104。Web服务器106通过网络连接110耦接到互联网104。Web服务器106分别通过耦合器116和118耦接到数据库112和大容量存储装置114。一般地,系统100如下操作:用户做出在他们的互联网连接装置上观看内容的请求,该内容来自由被配置为响应该请求的硬件和软件所服务的网站,该硬件和软件在图1中被共同示为Web服务器106、数据库112和大容量存储装置114。通过经由用户互联网连接装置102发起内容请求,用户做出这样的请求,用户互联网连接装置102经由网络连接108、互联网104和网络连接110将该内容请求传送到Web服务器106。在接收内容请求时,We b服务器106确定存储在大容量存储装置114中的哪个文件与所请求的内容相对应。与此对应有关的数据,以及与每个视频已被请求多少次和哪些内容文件收到欢迎有关的其它数据,可以被存储在数据库112中。一旦Web服务器106已识别出存储在大容量存储装置114中与所请求内容相对应的文件,Web服务器106从大容量存储装置114检索该文件并经由前述一系列网络连接将文件传送到用户互联网连接装置102。在从Web服务器106接收所请求的内容时,用户互联网连接装置102可以在Web浏览器或其它视频渲染软件应用中渲染所请求的内容。虽然图1中图示的系统仅仅示出了单个用户互联网连接装置和单个Web服务器,但更复杂的系统是容易显而易见的。例如,在很短一段时间内,大量用户可能尝试通过他们各自的互联网连接装置访问特定的网站。如果并行用户的数量足够大,则那些用户所做出的请求可能超过单个Web服务器或网络基础设施的响应能力。一些中间件服务在用户互联网连接装置和网络服务器之间提供内容缓存。这些中间件服务也可以在将其传送给用户互联网连接装置之前优化该内容,使得用户互联网连接装置可以实现更快的下载时间。对于给定的网络基础设施,相比没有中间件服务的Web服务器,在仍依靠Web服务器动态生成网页和执行复杂处理的同时,采用中间件服务来优化和输送内容可以允许将Web服务器和中间件服务相组合以服务更多的用户。尽管中间件服务的好处显而易见,但提供视频内容的许多受欢迎的网站不能从传统的内容缓存中受益,因为这些网站利用“动态URL”来指代视频内容。动态URL代表对视频内容的“链接”(即,引用),其中该链接仅在特定条件下有效。一个这样的条件可以是所引用内容在特定时间段内被引用。另一个这样的条件可以是只有特定用户可以引用该内容。又一个这样的条件可以是只有在特定地理区域中的用户能够引用该内容。其它条件也是可能的。如果施加于通过特定动态URL观看特定的一段视频内容的条件没有满足,则由该动态URL所引用的视频内容对请求用户来说是通过该用户引用动态URL不可获得的。相反,视频内容提供者可以通过显示“访问被拒绝”或“未找到内容”消息,拒绝用户通过特定动态URL访问特定一段视频内容的请求。然而,相同的视频内容仍然可以通过另一个动态URL获得,如果施加于通过该其它动态URL观看特定一段视频内容的条件满足的话,该条件诸如是上面所讨论的时间或地理条件。在任何给定时间,相同的视频内容也可以通过一个以上的动态URL并行可获得。 缓存由动态URL所引用的视频内容可以导致缓存内容的中间件服务中至少两个低效情况。这两个低效情况均与至少部分地基于用于内容的(动态)URL来索引缓存内容有关。首先,动态URL的使用可以导致多个与内容缓存内相同视频内容相对应的多个缓存条目,从而降低内容缓存向用户提供其它的、唯一的内容的能力。在这种情况本文档来自技高网...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】2010.07.30 US 61/369,5131.一种用于对内容缓存内的缓存数据结构中的内容进行索引的方法,所述方法包括: 从用户互联网连接装置接收内容请求; 从Web服务器请求与所接收到的内容请求相关联的内容的部分; 针对与所接收到的内容请求相关联的内容,识别至少一个表征数据,其中,所述至少一个表征数据包括与所接收到的内容请求相关联的内容的部分;以及 通过将所述至少一个被识别的表征数据输入到哈希函数中,生成对应于与所接收到的内容请求相关联的内容的索引,其中,所生成的索引被用于在缓存数据结构中识别与内容相关联的条目。2.根据权利要求1的方法,其中识别至少一个表征数据包括从与所接收到的内容请求相关联的统一资源定位符(URL)解析域名,其中域名包括第一部分和第二部分,其中第一部分包括URL内的顶级域或国家代码,以及第二部分包括在第一部分之前的URL的部分。3.根据权利要求1的方法,其中识别至少一个表征数据包括从与所接收到的内容请求相关联的统一资源定位符(URL)解析IP地址。4.根据权利要求3的 方法,其中如果被解析的IP地址被包含在从所述至少一个表征数据排除的IP地址的集合中,则从与所接收到的内容请求相关联的URL解析IP地址将被解析的IP地址从所述至少一个表征数据排除。5.根据权利要求1的方法,其中识别至少一个表征数据包括为与所接收到的内容请求相关联的内容进行长度确定。6.根据权利要求1的方法,其中识别至少一个表征数据包括从与所接收到的内容请求相关联的URL解析一个或多个参数。7.根据权利要求1的方法,其中,在将与所接收到的内容请求相关联的内容的部分输入到哈希函数中之前,与内容的所请求的部分相关联的至少一个元数据值被设定为预定值,内容的所请求的部分与从用户互联网连接装置接收到的内容请求相关联。8.一种计算机可读存储介质,在其上存储一组指令,当所述指令被执行时,所述计算机可读存储介质提供包括以下内容的方法: 从用户互联网连接装置接收内容请求; 从Web服务器请求与所接收到的内容请求相关联的内容的部分; 针对与所接收到的内容请求相关联的内容,识别至少一个表征数据,其中,所述至少一个表征数据包括与所接收到的内容请求相关联的内容的部分;以及 通过将所述至少一个被识别的表征数据输入到哈希函数中,生成对应于与所接收到的内容请求相关联的内容的索引,其中,所生成的索引被用于在缓存数据结构中识别与内容相关联的条目。9.根据权利要求8的计算机可读介质,其中识别至少一个表征数据包括从与所接收到的内容请求相关联的统一资源定位符(URL)解析域名,其中域名包括第一部分和第二部分,其中第一部分包括URL内的顶级域或国家代码,以及第二部分包括在第一部分之前的URL的部分。10...

【专利技术属性】
技术研发人员:F库普曼斯M梅尔尼克R巴利克
申请(专利权)人:拜特移动网络公司
类型:
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1