发布、搜索、检索和捆绑数字对象的元数据的系统和方法技术方案

技术编号:2915924 阅读:199 留言:0更新日期:2012-04-11 18:40
本发明专利技术阐述发布、搜索、检索及捆绑一个对数字对象的元数据的系统和方法。一个基于内容的识别码可用来唯一识别一个数字对象并将所述数字对象和元数据相关联。基于内容的识别码可以是一个唯一的代码,也可以是一个位串或是一些其他唯一识别标志,可以如一不变地从数字对象里重新计算,同时又可用作这个数字对象的永久标识符。本文说明了如何通过将元数据与基于内容的识别码捆绑起来为一个数字对象进行元数据发布的系统和方法。根据本发明专利技术的一些方面,元数据可以用联合传播的方法来发布,包括RSS FEED。本发明专利技术还描述了联合传播的扩展,包括了一个对数字媒体对象的元数据与更广义的基于内容的识别码一起进行发布的标签。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及数字对象的元数据处理技术,特别是使用从数字视频对象中计算出的基于内 容的识别码,对数字视频对象发布、搜索、检索和捆绑元数据的方法和系统。
技术介绍
计算机及互联网技术的兴起迅速地产生了大量的数字对象,包括能在计算机里储存的, 和/或通过广播和流的方式传到电视和计算机上的数字文档和比特流。"元数据"或称"数据的数据"的术语是指描述另一组数据的数据。数字对象,尤其是 例如图片和视频的数字媒体对象通常都可与元数据关联。通常说来,数字对象的元数据可包 括描述数字对象内容的数据以及描述数字对象属性的数据。就数字媒体对象来说,元数据对 于提供丰富详实信息、用户界面友好的软件与服务经常是必不可少的。元数据可以嵌入到数字对象里,也可单独由数字对象提供。在两种场合中,元数据与数 字对象的捆绑一般都是人为的,这种捆绑容易破裂,这是因为元数据不是媒体数据不可分割 的一部分。举个例子, 一个MP3音乐文件可能包含了一个嵌入的ID3元数据标签用来标明曲 名、演唱者、编码音乐的版权持有者,但这个标签可以在不影响MP3整体性的情况下被删除, 而且它的回放效果不受有无标签的影响。更一般地说,元数据往往是脱离它描述的数字对象的。例如,同一部电影会有不同人写的影评。这些影评可能会被发布到不同的网站上。人们可以使用关键字搜索引擎来找到这些 不同的影评,而要让计算机自动而又准确地找到这些信息要难得多。同样地,在把例如ID3 标签的嵌入式元数据从它关联的数字对象或媒体数据上剥离后,需要依靠人的智力把相关元 数据与媒体数据进行匹配和绑定。因此,需要能方便自动发布、搜索、检索和捆绑一个数字 对象的元数据的系统和方法。
技术实现思路
本专利技术的实施方案可提供发布、搜索、检索和捆绑一个数字对象的元数据的系统和方法。 本专利技术的一些实施方案使用基于内容的识别码来唯一识别一个数字对象并且把元数据与数字 对象相关联。基于内容的识别码可以是一个唯一的代码、 一个位串或其他可以从数字对象自 身中计算出来的某个独特标识符。基于内容的识别码可如一不变地从数字对象中重新计算获 得,因此可以作为数字对象的一个永久标识符。贯穿全系统参照基于内容的识别码,从本发 明的层面可方便地对相关的数字对象进行发布、搜索、检索和捆绑元数据。在一些实施方案中,元数据的发布包括用一个数字对象的基于内容的识别码与元数据一 起打包放入一个RSS feed (简易供稿)中。本专利技术的一些实施方案使用了简易供稿发布的一 种扩展,包括一种标签,以发布带更广义的基于内容的识别码的数字媒体对象的元数据。在一些实施方案中,可以在本地计算机硬盘驱动器、局域网或互联网上执行对特定数字 对象相关的元数据的搜索。搜索可在本地计算设备上自动启动并执行,例如计算机、数字录 象机或一些网络计算设备。搜索也可在互联网搜索引擎上启动和执行。在一些实施方案中, 基于选定的基于内容的识别码的元数据搜索能找到所有与选定基于内容的识别码相匹配的元 数据。当与基于内容的识别码关联的元数据被发现与所选定的基于内容的识别码严格匹配时, 元数据可以被检索到并基于数字对象的识别码与相关数字对象绑定。在一些实施方案中,所 有视频对象和与它们相关的元数据或链接可以保存在一个单一的表格中来记录他们之间的捆 绑关系,其中不同的对象通过基于内容的识别码来辨别。在一些实施方案中,捆绑关系可以 保存在关联数据库里。附图说明图1是根据本专利技术的一些方面描述的实施例程序的流程图。图2是根据本专利技术的一些方面描述的万维网络搜索实施例的流程图。图3是一个用户通过搜索引擎查找包括"空军一号"内容的相应返回页面的例子。图4是根据本专利技术的一些方面描述一个系统的示意图。具体实施方式本专利技术实施方案将与带参考编号的图纸一起描述,使业内人士能实践本专利技术。很明显, 以下的图纸和实例并非要将本专利技术的范围限制在单一方案上,其它实施方案可以通过交换某 些或全部说明描述的元件而实现。在方便之处,所有图中相同或相似的部件都用相同的参考 编号注解说明。本实施方案的一些元件可以使用已知组件而部分或全部实施,仅仅对于理解 本专利技术必需的己知组件的那些部分才会被描述到,这些己知组件的其它部分将不再详述,以 避免模糊概念。在本专利说明中,显示一个单一组件的实施方案不应被视为限制,而本专利技术 旨在包括其它实施方案,包括多数相同组件,反之亦然,除非在此另有详述。此外,申请人 不想在本专利说明和权利要求中将任何术语定义为不常见的、特殊的意思,除非另有详述。 而且,本专利技术通过例举的方式含括已有的和将有的同类组件。本专利技术的实施方案提供了自动发布、搜索、检索和捆绑一个数字对象的元数据的系统和 方法。在以下的说明中,术语"数字对象"可替换性地代表一个数字文件或比特流。例如, 存放在硬盘中的计算机文件与广播或流式视频媒体都可被认为是数字对象。本专利技术的一些实施方案使用基于内容的识别码以唯一识别一个数字对象并将元数据与数 字对象关联起来。基于内容的识别码又叫"数字指纹"或"指纹",可以是一个唯一的代码、 一个位串或是其他能够从数字对象本身中计算出来的唯一标识符。 一个数字对象的基于内容 的识别码,例如一个计算机文件,可以是它的二进制哈希值。在一些实施方案中,可以使用 由RFC1321定义的MD5哈希值。本专利技术的一些实施方案能够使用在美国非临时专列申请序 列号—/_文件中描述的数字指纹辨别技术,它于2007年2月27日提出申请,标题是"DVD 光盘指纹提取和识别的系统和方法"。使用基于内容的识别码将数字对象与元数据相关联在本专利技术的一些实施方案中有非常明显的f势,尤其是当元数据从数字对象中分离出来时。 一些优势是由于基于内容的识别码可以始终从数字对象中计算和再计算出来,因此可以用作这个数字对象的永久识别码。由于基于内容的识别码可以从数字对象中如一不变地计算出来,因此可以用作该数字对象的永久识别码。通过在整个系统中参照这个基于内容的识别码,本专利技术可以方便发布、搜索、检索和捆绑相关数字对象的元数据。 元数据的发布在一些实施方案中,元数据的发布包括对一个数字对象的基于内容的识别码与元数据一 起打包到一个RSS feed (简易供稿)中。RSS就是在互联网上采用XML文件格式的内容聚 合的例子。尽管RSS是从新闻头条聚合传播服务开始的,目前的RSS feed能够承载广泛的内 容类型,包括新闻头条、论坛和博客、软件公告以及元数据。在最近几年里RSS在博客和播 客服务中变得特别流行,它的一个称为媒体RSS或MRSS的扩展方案已被用来进行多媒体内 容的聚合传播服务。MRSS规范具体定义一个〈媒体哈希(media:hash)〉标签,它可被视为基于内容的识别 码。然而,对于数字媒体对象而言,二进制哈希值并不是一个好的识别码,因为它对数字对 象中的每一个位的变化都相当敏感。本专利技术的一些实施方案使用MRSS上的一个扩展,它包 括一个新的〈媒介识别码(media:ID)〉标签,以使用MRSS发布带更广义的基于内容的识别 码的数字媒体对象的元数据。在一个RSS feed的例子里,元数据的发布中包含了新的ID识别标签, 一部影评包含在 元数据中,这个数字对象的标签为ID=fcl 198178c3594bfdda3ca2996eb65cb本文档来自技高网
...

【技术保护点】
将元数据捆绑到一个数字对象的方法,包含:通过从数字对象上撷取的数据中计算出基于内容的识别码;基于内容的识别码可唯一地识别对应的数字对象;识别以计算出的基于内容的识别码作为一个标签的元数据;并将识别出的元数据与数字对象捆绑起来。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:陆坚王扬斌
申请(专利权)人:阜博有限公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1