一种信息的处理方法及装置制造方法及图纸

技术编号:18417661 阅读:41 留言:0更新日期:2018-07-11 09:21
一种流媒体的信息的处理方法以及装置,其中流媒体的信息的处理方法包括:获取目标空间对象的目标空间信息,目标空间对象为目标视频数据中的两个图像的数据所关联的两个空间对象中的空间对象,两个图像的数据为两个图像的数据,目标空间信息包括同属性空间信息,同属性空间信息包括所述两个空间对象各自的空间信息之间相同的信息,两个空间对象中除目标空间对象外的其他空间对象的空间信息包括同属性空间信息;根据目标空间信息,确定要播放的视频数据。通过将一组同属性空间信息替代两个空间对象各自的空间信息中重复的部分,实现了减少空间信息的冗余,从而减少空间信息的数据量。

A method and device for information processing

A processing method and device for the information of the streaming media, in which the processing method of the information of the stream media includes: obtaining the target space information of the target space object, the target space object is the space object of the two spatial objects associated with the data of the two images of the target video data, and the data of the two images is two. The object space information includes the same attribute space information, and the same attribute space information includes the same information between the spatial information of the two spatial objects, and the spatial information of the other space objects in the two space objects except the target space object includes the spatial information of the same genus, and according to the target space information. To determine the video data to be played. By replacing the repeated parts of the spatial information of two spatial objects with the same attribute space information, the redundancy of spatial information is reduced and the amount of spatial information is reduced.

【技术实现步骤摘要】
一种信息的处理方法及装置
本专利技术涉及流媒体处理领域,尤其涉及一种信息的处理方法及装置。
技术介绍
一、MPEG-DASH技术介绍2011年11月,MPEG组织批准了DASH标准,DASH标准是基于HTTP协议传输媒体流的技术规范(以下称DASH技术规范);DASH技术规范主要由两大部分组成:媒体呈现描述(英文:MediaPresentationDescription,MPD)和媒体文件格式(英文:fileformat)。1、媒体文件格式媒体文件格式属于一种文件格式,在DASH中服务器会为同一个视频内容准备多种版本的码流,每个版本的码流在DASH标准中称为表示(英文:representation)。表示是在传输格式中的一个或者多个码流的集合和封装,一个表示中包含一个或者多个分段。不同版本的码流的码率、分辨率等编码参数可以不同,每个码流分割成多个小的文件,每个小文件被称为分段(或称分段,英文:segment)。在客户端请求媒体分段数据的过程中可以在不同的媒体表示之间切换。segment可以按照标准ISO/IEC14496-12中的格式封装(ISOBMFF(BaseMediaFileFormat)),也可以是按照ISO/IEC13818-1中的格式封装(MPEG-2TS)。2、媒体呈现描述在DASH标准中,媒体呈现描述被称为MPD,MPD可以是一个xml的文件,文件中的信息是采用分级方式描述,如图1所示,上一级的信息被下一级完全继承。在该文件中描述了一些媒体元数据,这些元数据可以使得客户端了解服务器中的媒体内容信息,并且可以使用这些信息构造请求segment的http-URL。在DASH标准中,媒体呈现(英文:mediapresentation),是呈现媒体内容的结构化数据的集合;媒体呈现描述(英文:mediapresentationdescription),一个规范化描述媒体呈现的文件,用于提供流媒体服务;时期(英文:period),一组连续的时期组成整个媒体呈现,时期具有连续和不重叠的特性;在MPD中,表示(英文:representation)是传输格式中一个或者多个码流的描述信息的集合和封装,一个表示中包含一个或者多个分段;自适应集(英文:AdaptationSet),表示同一媒体内容成分的多个可互替换的编码版本的集合,一个自适应集包含一个或者多个表示;子集(英文:subset),一组自适应集合的组合,当播放器播放其中所有自适应集合时,可以获得相应的媒体内容;分段信息,是媒体呈现描述中的HTTP统一资源定位符引用的媒体单元,分段信息描述媒体数据的分段,媒体数据的分段可以存储在一个文件中,也可以单独存储,在一种可能的方式中,MPD中会存储媒体数据的分段。本专利技术有关MPEG-DASH技术的相关技术概念可以参考ISO/IEC23009-1Informationtechnology--DynamicadaptivestreamingoverHTTP(DASH)--Part1:Mediapresentationdescriptionandsegmentformats,中的有关规定,也可以参考历史标准版本中的相关规定,如ISO/IEC23009-1:2013或ISO/IEC23009-1:2012等。二、虚拟现实(virtualreality,VR)技术介绍虚拟现实技术是一种可以创建和体验虚拟世界的计算机仿真系统,它利用计算机生成一种模拟环境,是一种多源信息融合的交互式的三维动态视景和实体行为的系统仿真,可以使用户沉浸到该环境中。VR主要包括模拟环境、感知、自然技能和传感设备等方面。模拟环境是由计算机生成的、实时动态的三维立体逼真图像。感知是指理想的VR应该具有一切人所具有的感知。除计算机图形技术所生成的视觉感知外,还有听觉、触觉、力觉、运动等感知,甚至还包括嗅觉和味觉等,也称为多感知。自然技能是指人的头部转动,眼睛、手势、或其他人体行为动作,由计算机来处理与参与者的动作相适应的数据,并对用户的输入作出实时响应,并分别反馈到用户的五官。传感设备是指三维交互设备。当VR视频(或者360度视频,或者全方位视频(英文:Omnidirectionalvideo))在头戴设备和手持设备上呈现时,只有对应于用户头部的方位部分的视频图像呈现和相关联的音频呈现。VR视频和通常的视频(英文:normalvideo)的差别在于通常的视频是整个视频内容都会被呈现给用户;VR视频是只有整个视频的一个子集被呈现给用户(英文:inVRtypicallyonlyasubsetoftheentirevideoregionrepresentedbythevideopictures)。三、空间信息介绍现有标准中,对空间信息的描述原文是“TheSRDschemeallowsMediaPresentationauthorstoexpressspatialrelationshipsbetweenSpatialObjects.ASpatialObjectisdefinedasaspatialpartofacontentcomponent(e.g.aregionofinterest,oratile)andrepresentedbyeitheranAdaptationSetoraSub-Representation.”【中文】:空间信息是空间对象(即SpatialObjects)之间的空间关系(即spatialrelationships)。空间对象被定义为一个内容成分的一部分空间,比如现有的感兴趣区域(英文:regionofinterest,ROI)和tile;空间关系可以在AdaptationSet和Sub-Representation中描述。现有标准中,MPD中可以描述空间对象的空间信息。在ISO/IEC14496-12(2012)标准文档中,文件是由许多个盒(box)和完整盒(FullBox)构成的。每个Box由头部(Header)和数据(Data)组成。FullBox是Box的扩展。Header包含了整个Box的长度size和类型type。当size==0时,代表这是文件中最后一个Box;当size==1时,意味着Box长度需要更多bits来描述。Data是Box的实际数据,可以是纯数据也可以是更多的子Boxes。在ISO/IEC14496-12(2012)的标准文档中,使用“trefbox”描述轨道(track)之间关系。比如:一个MP4文件中有三条视频(video)track,ID分别是2、3、4,以及三条audiotrack,ID分别是6、7、8。可以在track2与track6的trefbox中指定一下,将2与6两条track绑定起来播放。在目前的标准的规定中,例如ISO/IEC23000-20,媒体内容的track和元数据的track之间的联系采用的联系类型(reference_type)是‘cdsc’,比如在视频的track中解析到关联的track,且关联的类型是‘cdsc’,说明关联的track是用来描述视频的track的元数据track。但是在实际应用中,描述媒体内容的元数据有很多种类,不同的种类能够提供给用户的使用方本文档来自技高网...

【技术保护点】
1.一种流媒体的信息的处理方法,其特征在于,所述方法包括:获取目标空间对象的目标空间信息,所述目标空间对象为两个空间对象中的空间对象,所述两个空间对象与目标视频数据中包括的两个图像的数据关联,所述目标空间信息包括同属性空间信息,所述同属性空间信息包括所述两个空间对象各自的空间信息之间相同的信息,所述两个空间对象中除所述目标空间对象外的其他空间对象的空间信息包括所述同属性空间信息;根据所述目标空间信息,确定要播放的视频数据。

【技术特征摘要】
2016.12.30 CN 2016112528154;2017.01.11 CN PCT/CN201.一种流媒体的信息的处理方法,其特征在于,所述方法包括:获取目标空间对象的目标空间信息,所述目标空间对象为两个空间对象中的空间对象,所述两个空间对象与目标视频数据中包括的两个图像的数据关联,所述目标空间信息包括同属性空间信息,所述同属性空间信息包括所述两个空间对象各自的空间信息之间相同的信息,所述两个空间对象中除所述目标空间对象外的其他空间对象的空间信息包括所述同属性空间信息;根据所述目标空间信息,确定要播放的视频数据。2.根据权利要求1所述的方法,其特征在于,所述目标空间信息还包括所述目标空间对象的异属性空间信息,所述其他空间对象的空间信息还包括所述其他空间对象的异属性空间信息,所述目标空间对象的异属性空间信息与所述其他空间对象的异属性信息不同。3.根据权利要求1或2所述的方法,其特征在于,所述目标空间信息包括所述目标空间对象的中心点的位置信息或者所述目标空间对象的左上点的位置信息,所述目标空间信息还包括所述目标空间对象的宽和所述目标空间对象的高。4.根据权利要求1或2所述的方法,其特征在于,所述目标空间信息包括所述目标空间对象的左上点的位置信息,和所述目标空间对象的右下点的位置信息。5.根据权利要求1至4任一项所述的方法,其特征在于,所述目标空间信息包括所述目标空间对象的空间旋转信息。6.根据权利要求1至5任一项所述的方法,其特征在于,所述目标空间信息封装在空间信息数据或者空间信息轨迹(track)中,所述空间信息数据为所述目标视频数据的码流、所述目标视频数据的元数据或者独立于所述目标视频数据的文件,所述空间信息轨迹为独立于所述目标视频数据的轨迹。7.根据权利要求6所述的方法,其特征在于,所述空间信息数据或者所述空间信息轨迹中还包括用于指示所述同属性空间信息的类型的空间信息类型标识,所述空间信息类型标识用于指示所述目标空间信息中属于所述同属性空间信息的...

【专利技术属性】
技术研发人员:邸佩云谢清鹏
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1