媒体流传输期间在适配集合间的切换方法和装置制造方法及图纸

技术编号:18530518 阅读:25 留言:0更新日期:2018-07-25 15:14
媒体流传输期间在适配集合间的切换方法和装置。一种用于取回媒体数据的设备包括一个或多个处理器,所述处理器被配置为从包括第一类型的媒体数据的第一适配集合取回媒体数据,呈现来自第一适配集合的媒体数据,响应于切换到包括所述第一类型的媒体数据的第二适配集合的请求:从所述第二适配集合取回包括所述第二适配集合的切换点的媒体数据,并且在实际的播出时间已经满足或者超过针对所述切换点的播出时间之后,呈现来自所述第二适配集合的媒体数据。

【技术实现步骤摘要】
媒体流传输期间在适配集合间的切换方法和装置本申请是申请日为2014年9月9日、申请号为201480055085.1(PCT/US2014/054729)、名称为“媒体流传输期间在适配集合间的切换方法和装置”的中国专利申请的分案申请。
本公开内容涉及对经编码的多媒体数据的存储和传输。
技术介绍
可以将数字视频能力并入到范围广泛的设备中,所述设备包括数字电视、数字直接广播系统、无线广播系统、个人数字助理(PDA)、膝上型或者台式计算机、数字照相机、数字记录设备、数字媒体播放器、视频游戏设备、视频游戏控制器、蜂窝或者卫星无线电话、视频远程会议设备等。数字视频设备实现诸如那些由MPEG-2、MPEG-4、ITU-TH.263或者ITU-TH.264/MPEG-4、Part10、高级视频编码(AVC)所定义的标准以及这样的标准的扩展中所描述的视频压缩技术,以更加高效地发送和接收数字视频信息。在视频数据已经被编码后,可以将视频数据分组化,以用于传输或者存储。可以将视频数据组装成符合各种标准(例如,国际标准化组织基础媒体文件格式及其扩展,例如,MP4文件格式和高级视频编码(AVC)文件格式)中的任何标准的视频文件。可以以各种方式来传输这样的分组化视频数据,例如,通过使用网络流的计算机网络进行传输。
技术实现思路
总体上,本公开内容描述了关于在媒体数据的流传输(例如,通过网络)期间的在适配集合之间的切换。总体上,适配集合可以包括特定类型的媒体数据,例如,视频、音频、定时文本等。尽管常规上,在通过网络的媒体流传输中,已经提供了用于在适配集合内的表示之间切换的技术,但是总体上,本公开内容的技术针对在适配集合本身之间切换的技术。在一个示例中,取回媒体数据的方法包括,从包括第一类型的媒体数据的第一适配集合取回媒体数据,呈现来自第一适配集合的媒体数据,响应于切换到包括第一类型的媒体数据的第二适配集合的请求:从第二适配集合取回包括第二适配集合的切换点的媒体数据,以及在实际播出时间已经满足或超过切换点的播出时间之后呈现来自第二适配集合的媒体数据。在另一个示例中,用于取回媒体数据的设备包括一个或多个处理器,其被配置为从包括第一类型的媒体数据的第一适配集合取回媒体数据,呈现来自第一适配集合的媒体数据,响应于切换到包括第一类型的媒体数据的第二适配集合的请求:从第二适配集合取回包括第二适配集合的切换点的媒体数据,以及在实际播出时间已经满足或者超过切换点的播出时间之后呈现来自第二适配集合的媒体数据。在另一个示例中,用于取回媒体数据的设备包括:用于从包括第一类型的媒体数据的第一适配集合取回媒体数据的单元,用于呈现来自第一适配集合的媒体数据的单元,用于响应于切换到包括第一类型的媒体数据的第二适配集合的请求,从第二适配集合取回包括第二适配集合的切换点的媒体数据的单元,以及响应于请求而在实际播出时间已经满足或者超过切换点的播出时间之后呈现来自第二适配集合的媒体数据的单元。在另一个示例中,计算机可读存储介质具有存储于其上的指令,当所述指令被执行时使处理器:从包括第一类型的媒体数据的第一适配集合取回媒体数据,呈现来自第一适配集合的媒体数据,响应于切换到包括第一类型的媒体数据的第二适配集合的请求:从第二适配集合取回包括第二适配集合的切换点的媒体数据,以及在实际播出时间已经满足或者超过切换点的播出时间之后呈现来自第二适配集合的媒体数据。在以下的附图和描述中阐述了一个或多个示例的细节。根据描述和附图,并且根据权利要求书,其它的特征、目标和优点将是显而易见的。附图说明图1是示出了实现用于通过网络来流传输媒体数据的技术的示例系统的框图。图2是示出了示例多媒体内容的要素的概念图。图3是示出了示例视频文件的要素的框图,所述示例视频文件可以对应于多媒体内容的表示的片段。图4A和图4B是示出了根据本公开内容的技术的、用于在播放期间在适配集合之间进行切换的示例方法的流程图。图5是示出了根据本公开内容的技术的、用于在适配集合之间进行切换的另一个示例方法的流程图。具体实施方式总体上,本公开内容描述了涉及通过网络对多媒体数据(例如,音频和视频数据)进行流传输的技术。可以结合通过HTTP的动态自适应流传输(DASH)来使用本公开内容的技术。本公开内容描述了可以结合网络流传输来执行的各种技术,可以单独或者以任何组合来实现所述技术中的任何或者全部技术。如在下文中更加详细地描述的,执行网络流传输的各种设备可以被配置为实现本公开内容的技术。根据DASH和用于通过网络来流传输数据的类似技术,可以以各种方式并且利用各种特性来将多媒体内容(例如,电影或者也可以包括音频数据、视频数据、文本覆盖或者其它数据的其它媒体内容,其统一被称为“媒体数据”)编码。内容准备设备可以形成相同的多媒体内容的多个表示。每个表示可以对应于特性的特定集合(例如,编码和渲染特性),以提供可由具有各种编码和渲染能力的多种不同的客户端设备使用的数据。此外,具有各种比特速率的表示可以允许带宽适配。也就是说,客户端设备可以确定当前可用的带宽的量,并且基于可用的带宽的量来选择表示,以及客户端设备的编码和渲染能力。在一些示例中,内容准备设备可以指示表示的集合具有公共特性的集合。然后,内容准备设备可以指示集合中的表示形成适配集合,以使得集合中的表示可以被用于带宽适配。也就是说,适配集合中的表示可以在比特速率方面彼此不同,但是在其它方面共享大体上相同的特性(例如,编码和渲染特性)。以这种方式,客户端设备可以针对多媒体内容的各种适配集合来确定公共的特性,并且基于客户端设备的编码和渲染能力来选择适配集合。然后,客户端设备可以基于带宽可用性在所选择的适配集合中在表示之间自适应地切换。在一些情况下,可以针对特定类型的所包括的内容来构造适配集合。例如,可以形成用于视频数据的适配集合,以使得针对场景的每个照相机角度(或者照相机视角)存在至少一个适配集合。作为另一个示例,可以针对不同的语言提供用于音频数据和/或定时文本(例如,字幕文本数据)的适配集合。也就是说,可以存在针对每个期望的语言的音频适配集合和/或定时文本适配集合。这可以允许客户端设备基于用户偏好(例如,针对音频和/或视频的语言偏好)来选择合适的适配集合。作为另一个示例,客户端设备可以基于用户偏好来选择一个或多个相机角度。例如,用户可能希望观看特定的场景的替代的相机角度。作为另一个示例,用户可能希望在三维(3D)视频中观看相对更多或更少的深度,在这种情况下,用户可以选择具有相对较近或者距离较远的照相机视角的两个或更多个视图。可以将用于表示的数据分成个体的文件,通常被称为片段。文件中的每个文件都是由特定的统一资源定位符(URL)可寻址的。客户端设备可以在特定的URL处提交针对文件的GET请求以取回文件。根据本公开内容的技术,客户端设备可以通过例如根据由对应的服务器设备提供的URL模板将期望的字节范围包括在URL通道本身内来修改GET请求。视频文件(例如,媒体内容的表示的片段)可以符合根据ISO基础媒体文件格式、可缩放编码(SVC)文件格式、高级视频编码(AVC)文件格式、第三代合作伙伴计划(3GPP)文件格式和/或多视角视频编码(MVC)文件格式或者其它相似的视频文件格式中的任何项来本文档来自技高网...

【技术保护点】
1.一种取回媒体数据的方法,所述方法包括:选择从其中取回媒体数据的第一适配集合,其中,所述第一适配集合在媒体呈现的时段中,所述时段包括多个适配集合,所述多个适配集合包括所述第一适配集合和第二适配集合,其中,所述第一适配集合包括第一多个表示,所述第一多个表示共享除了比特速率的编码和渲染特性的第一公共集合,其中,所述适配集合表示针对公共类型的媒体数据的对彼此的替代物,以及通过除了比特速率的至少一个特性来区别于彼此;响应于所述选择,从包括所述公共类型的媒体数据的所述第一适配集合的第一表示取回媒体数据,其中,所述第一表示包括所述第一多个表示中的一个表示;呈现来自所述第一适配集合的所述第一表示的媒体数据;在呈现来自所述第一表示的所述媒体数据期间,接收对于切换到所述第二适配集合的请求,其中,在接收到对于切换到所述第二适配集合的所述请求时,所述切换点的播出时间大于在接收到对于切换的所述请求时的实际的播出时间;以及响应于对于切换到包括所述公共类型的媒体数据的所述第二适配集合的所述请求,其中,所述第二适配集合包括第二多个表示,所述第二多个表示共享除了比特速率的编码和渲染特性的第二公共集合,并且其中,所述第一多个表示中的每个表示通过除了比特速率的至少一个特性来区别于所述第二多个表示中的每个表示:从所述第二适配集合的第二表示取回包括所述第二适配集合的所述第二表示的切换点的媒体数据,其中,所述第二表示包括所述第二多个表示中的一个表示,并且其中,所述切换点在所述时段内,并且不在所述时段的开始处;以及在实际的播出时间已经满足或者超过所述切换点的播出时间之后,呈现来自所述第二适配集合的所述第二表示的媒体数据。...

【技术特征摘要】
2013.10.08 US 14/048,2101.一种取回媒体数据的方法,所述方法包括:选择从其中取回媒体数据的第一适配集合,其中,所述第一适配集合在媒体呈现的时段中,所述时段包括多个适配集合,所述多个适配集合包括所述第一适配集合和第二适配集合,其中,所述第一适配集合包括第一多个表示,所述第一多个表示共享除了比特速率的编码和渲染特性的第一公共集合,其中,所述适配集合表示针对公共类型的媒体数据的对彼此的替代物,以及通过除了比特速率的至少一个特性来区别于彼此;响应于所述选择,从包括所述公共类型的媒体数据的所述第一适配集合的第一表示取回媒体数据,其中,所述第一表示包括所述第一多个表示中的一个表示;呈现来自所述第一适配集合的所述第一表示的媒体数据;在呈现来自所述第一表示的所述媒体数据期间,接收对于切换到所述第二适配集合的请求,其中,在接收到对于切换到所述第二适配集合的所述请求时,所述切换点的播出时间大于在接收到对于切换的所述请求时的实际的播出时间;以及响应于对于切换到包括所述公共类型的媒体数据的所述第二适配集合的所述请求,其中,所述第二适配集合包括第二多个表示,所述第二多个表示共享除了比特速率的编码和渲染特性的第二公共集合,并且其中,所述第一多个表示中的每个表示通过除了比特速率的至少一个特性来区别于所述第二多个表示中的每个表示:从所述第二适配集合的第二表示取回包括所述第二适配集合的所述第二表示的切换点的媒体数据,其中,所述第二表示包括所述第二多个表示中的一个表示,并且其中,所述切换点在所述时段内,并且不在所述时段的开始处;以及在实际的播出时间已经满足或者超过所述切换点的播出时间之后,呈现来自所述第二适配集合的所述第二表示的媒体数据。2.根据权利要求1所述的方法,其中,所述公共类型包括音频数据和字幕数据中的至少一项,其中,所述第一多个表示包括使用第一语言的所述公共类型的媒体数据,并且其中,所述第二多个表示包括使用不同于所述第一语言的第二语言的所述公共类型的媒体数据。3.根据权利要求1所述的方法,其中,所述公共类型包括视频数据,其中,所述第一多个表示包括第一照相机角度的视频数据,并且其中,所述第二多个表示包括不同于所述第一照相机角度的第二照相机角度的视频数据。4.根据权利要求1所述的方法,所述方法还包括:从所述第一适配集合和所述第二适配集合取回数据,直到从所述第二适配集合取回的媒体数据的播出时间已经满足或者超过所述实际的播出时间为止。5.根据权利要求1所述的方法,还包括:获得针对所述第一适配集合和所述第二适配集合的清单文件;以及使用所述清单文件的数据来确定所述切换点的播出时间,其中,取回所述媒体数据包括:至少部分基于所述切换点的所述播出时间与当接收到对于切换到所述第二适配集合的所述请求时的所述实际的播出时间的比较来取回所述媒体数据。6.根据权利要求1所述的方法,还包括:获得针对所述第一适配集合和所述第二适配集合的清单文件;以及使用所述清单文件的数据来确定所述切换点在所述第二适配集合的所述第二表示中的位置。7.根据权利要求6所述的方法,其中除了比特速率的所述至少一个特性包括语言、照相机角度或分辨率中的至少一项。8.根据权利要求6所述的方法,其中所述第二表示包括选择的表示,所述方法还包括:使用所述清单文件来确定所述第二适配集合中所述第二多个表示的比特速率;基于带宽估计技术来确定估计的网络带宽;从所述第二多个表示选择所述选择的表示,以使得所述选择的表示的所述比特速率至少部分地基于所述估计的网络带宽。9.根据权利要求6所述的方法,其中,所述位置至少部分地由所述第二适配集合的所述第二表示的片段中的起始字节来限定。10.根据权利要求6所述的方法,其中,所述第二表示包括选择的表示,所述方法还包括:使用所述清单文件来确定所述第二适配集合中的所述第二多个表示的比特速率;监视改变的网络带宽;以及从所述第二多个表示中选择所述选择的表示,以使得所述选择的表示的所述比特速率至少部分地基于所述改变的网络带宽。11.根据权利要求10所述的方法,其中,所述从所述第二多个表示中选择所述选择的表示以使得所述选择的表示的所述比特速率至少部分地基于带宽适配技术。12.根据权利要求1所述的方法,其中,所述第二表示的所述切换点是不与所述第一表示的切换点对齐的。13.一种取回媒体数据的装置,所述装置包括:用于选择从其中取回媒体数据的第一适配集合的单元,其中,所述第一适配集合在媒体呈现的时段中,所述时段包括多个适配集合,所述多个适配集合包括所述第一适配集合和第二适配集合,其中,所述第一适配集合包括第一多个表示,所述第一多个表示共享除了比特速率的编码和渲染特性的第一公共集合,其中,所述适配集合表示针对公共类型的媒体数据的对彼此的替代物,以及通过除了比特速率的至少一个特性来区别于彼此;用于响应于所述选择,从包括所述公共类型的媒体数据的所述第一适配集合的第一表示取回媒体数据的单元,其中,所述第一表示包括所述第一多个表示中的一个表示;用于呈现来自所述第一适配集合的所述第一表示的媒体数据的单元;用于在呈现来自所述第一表示的所述媒体数据期间,接收对于切换到所述第二适配集合的请求的单元,其中,在接收到对于切换到所述第二适配集合的所述请求时,所述切换点的播出时间大于在接收到对于切换的所述请求时的实际的播出时间;以及用于响应于对于切换到包括所述公共类型的媒体数据的所述第二适配集合的所述请求来执行以下操作的单元,其中,所述第二适配集合包括第二多个表示,所述第二多个表示共享除了比特速率的编码和渲染特性的第二公共集合,并且其中,所述第一多个表示中的每个表示通过除了比特速率的至少一个特性来区别于所述第二多个表示中的每个表示:从所述第二适配集合的第二表示取回包括所述第二适配集合的所述第二表示的切换点的媒体数据,其中,所述第二表示包括所述第二多个表示中的一个表示,并且其中,所述切换点在所述时段内,并且不在所述时段的开始处;以及在实际的播出时间已经满足或者超过所述切换点的播出时间之后,呈现来自所述第二适配集合的所述第二表示的媒体数据。14.根据权利要求13所述的装置,其中,所述公共类型包括音频数据和字幕数据中的至少一项,其中,所述第一多个表示包括使用第一语言的所述公共类型的媒体数据,并且其中,所述第二多个表示包括使用不同于所述第一语言的第二语言的所述公共类型的媒体数据。15.根据权利要求13所述的装置,其中,所述公共类型包括视频数据,其中,所述第一多个表示包括第一照相机角度的视频数据,并且其中,所述第二多个表示包括不同于所述第一照相机角度的第二照相机角度的视频数据。16.根据权利要求13所述的装置,所述装置还包括:用于...

【专利技术属性】
技术研发人员:A·S·克里希纳L·C·明德D·普特查拉F·乌卢皮纳尔
申请(专利权)人:高通股份有限公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1