统一地提取媒体对象的系统技术方案

技术编号:2872955 阅读:145 留言:0更新日期:2012-04-11 18:40
一种从媒体对象(诸如多媒体对象或者流媒体对象)中提取信息(诸如元数据)的系统和方法利用单一的设备(44)从具有不同格式的多个媒体对象中提取信息。检查所述媒体对象以便确定其格式(40)。然后,将所述媒体对象提供给多格式提取器(44),其中信息是根据对应的格式从所述媒体对象中提取的。所述提取的信息被编译(46)成单一的数据格式,从而使通用数据结构的格式与多种媒体对象的格式相兼容。(*该技术在2021年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利
总体上涉及到有关计算机的信息搜索和检索,具体而言,涉及到从媒体对象中提取元数据。作为理解本专利技术的背景,因特网(也称为万维网或者Web)在其普及方面作出的贡献使得用户可以利用的多媒体和流媒体文件供过于求。然而,查找淹没于web上的数以万计的文件之中的具体多媒体或流媒体文件却常常是一件极其困难的任务。可从web上获得的信息内容的容量和种类可能在以相当可观的速度持续增加。这样的增长结合web的高度分散性使得在定位特定信息内容方面会产生相当大的困难。流媒体是指这样的音频、视频、多媒体、文本以及交互式数据文件,它们通过因特网或者其它网络环境传送到用户的计算机,并在整个文件都传送完毕之前就开始在用户的计算机上播放。流媒体的一个优点在于在整个文件都被下载之前,流媒体文件就开始播放,从而免去用户长久等待,这种长久等待通常是与下载整个文件相关联的。以数字方式记录的音乐、电影、预告片、新闻报道、无线广播以及事件实况都有助于增加web上的流内容。此外,不怎么昂贵的高带宽连接(诸如电缆、DSL以及T1)使因特网用户能更加快速、更加可靠地访问新闻机构、好莱坞电影制片商、独立生产商、记录标记、甚至家庭用户的流媒体内容。用户通常使用搜索引擎搜索因特网上的具体信息。搜索引擎包括一组在网络(例如局域网(LAN)、因特网、以及万维网)中的网络站点上可被访问的程序。被称为“机器人”或“蜘蛛”的程序在搜索文档(例如网页)时预先遍历网络,然后其他用户可以激活一个超链接来查看在所述文档中包含的信息。当搜索媒体文件(诸如多媒体以及流媒体)时,利用提取器来提取属于媒体文件的信息。媒体文件,也称为媒体对象,是以多种格式(诸如WINDOW MEDIA PLAYER以及REAL AUDIO)存在的。通常,使用专用提取器(只与专用媒体格式相兼容)。例如,与WINDOW MEDIAPLAYER格式相兼容的提取器就与采用REAL AUDIO格式的媒体对象不兼容。再者,在各种媒体对象中所包含的元数据的结构随着格式的不同而不同。在常规的搜索系统中,每种媒体格式均需要不同的提取器来从该媒体对象中提取相关信息。然后,为了形成搜索索引,所提取的输出被独立地处理。独立地处理所提取的每个输出需要相当多的系统资源。因此,需要一种不受前述缺陷和劣势所限制的搜索系统。本专利技术是一种用于从媒体对象中提取信息的系统,所述系统包括媒体对象分类器、提取器分配代理器、多格式提取器以及编译器。媒体对象分类器确定媒体对象的格式。提取器分配代理器选择与所确定的格式兼容的格式兼容提取器。多格式提取器包括多个提取器,每一个提取器都是格式兼容提取器。格式兼容提取器从媒体对象中提取信息。编译器根据通用数据结构编译所提取的信息,其中通用数据结构的格式与多种媒体对象格式相兼容。 附图说明对于本专利技术,通过结合附图阅读以下详细的描述能够得到最好的理解。附图的各种技术特征可以是不按照比例的。包括在附图中的是以下的图图1是互联的计算机系统网络的系统的形式化概要说明;图2是用于执行本专利技术的通用提取过程的流程图;图3是本专利技术的通用提取器的功能框图。因特网是世界范围的计算机网络系统,它是其中一台计算机的用户能够从任何其他计算机中获得信息以及与其他计算机的用户进行通信的网络的网络。因特网最广泛应用的部分是万维网(常缩写为“WWW”或者称为“Web”)。Web的突出特征是使用超文本,它是一种交叉引用的方法。在大多数的网站中,某些单词或者短语是以不同于周围文本颜色的文本出现的。这种文本常常还有下划线。有时,是“可点击”的按钮、图像或者部分图像。使用Web可以访问数以万计的信息页。网上“冲浪”是通过Web浏览器(诸如NETSCAPE NAVI GATOR以及MICROSOFT INTERNET EXPLORER)实现的。特定网站的外观可以有少量变化,这取决于所使用的特定浏览器。最近版本的浏览器带有“插件(plugins)”,它们提供动画、虚拟现实、声音和音乐。在此所使用的术语“媒体文件”以及“媒体对象”包括音频、视频、文本、多媒体数据文件以及流媒体文件。多媒体文件包括文本、图像、视频以及音频数据的任意组合。流媒体包括音频、视频、多媒体、文本以及交互式数据文件,它们是通过因特网或者其它通信网络环境传送到用户的计算机的,并且在整个文件都传送完毕之前就开始在用户的计算机/设备上播放。流媒体的一个优点在于在整个文件都被下载之前,流媒体文件就开始播放,从而免去了用户长久等待,这种长久等待通常是与下载整个文件相关联的。以数字方式记录的音乐、电影、预告片、新闻报道、无线广播以及事件实况都有助于增加Web上的流内容。此外,通过使用高带宽连接(诸如电缆、DSL、T1线以及无线网络(例如基于2.5G或者3G的蜂窝网络))而在通信网络成本上的降低会使因特网用户能更加快速、更加可靠地访问新闻机构、好莱坞电影制片商、独立生产商、记录标记、甚至家居用户他们自己的流媒体内容。流媒体的例子包括歌曲、政治演讲、新闻广播、电影预告片、实况广播、无线广播、财政新闻发布会、现场音乐厅、网络摄像机(web-cam)的连续镜头以及其他特殊事件。流媒体的编码采用各种格式,包括REALAUDIO、REALVIDEO、REALMEDIA、APPLE QUICKTIME、MICROSOFT WINDOWSMEDIA FORMAT、QUICKTIME、MPEG-2 LAYER IIIAUDIO以及MP3。通常,媒体文件指定有扩展名(后缀),用于指示与具体格式的兼容性。例如,以扩展名.ram,.rm,.rpm之一结尾的媒体文件(例如音频和视频文件)与REALMEDIA格式相兼容。在下表中列出了文件扩展名以及与它们相兼容的格式的一些例子。更详尽的媒体类型、扩展名以及兼容格式的列表可以在http//www.bowers.cc/extensions2.htm中查找到。表1 作为描述性数据的元数据字面意思是“关于数据的数据”。元数据是这样的数据,它包括描述其他数据(例如媒体文件)的内容或者属性的信息。例如,标题为“用于资源发现的都柏林核心元数据”(http//www.ietf.org/rfc/rfc2413.txt)的文档将元数据分为三组,它们概略地指示在其中所包含的信息的类别或者范围。这三个组是(1)主要与资源内容有关系的元素,(2)按知识产权观看时主要与资源有关系的元素,以及(3)主要与资源的实例化有关系的元素。落在这些组的元数据的例子表示在下表中。表2 元数据的来源包括网页内容、统一资源指示符(URI)、媒体文件以及用于传送媒体文件的传输流。网页内容包括HTML、XML、元标记以及在网页上的任何其它文本。如在此更加详细的解释,元数据还可以从网页的URI、媒体文件以及其它元数据中获得。在媒体文件之中的元数据可能包括媒体文件中所包含的信息,例如多媒体或者流文件的诸如头标和尾标。元数据还可以从例如媒体/元数据的传输流诸如TCP/IP(例如包)、ATM、帧中继、基于蜂窝的传输模式(例如基于蜂窝的电话模式)、MPEG传输、HDTV广播以及基于无线的传输中获得。元数据还可以在流中并行地传输或者作为用于传输媒体文件的本文档来自技高网...

【技术保护点】
一种用于从媒体对象中提取信息的方法,所述方法包括如下步骤:确定媒体对象的格式;选择与所述确定的格式相兼容的格式兼容提取器;通过所述格式兼容提取器从所述媒体对象中提取信息;以及根据通用数据结构编译所述提取的信息,其中所述通用数 据结构的格式与多种媒体对象格式相兼容。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:JL科拉BS米勒SCC李
申请(专利权)人:汤姆森许可公司
类型:发明
国别省市:FR[法国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1