基于样例元素的元数据搜索数字内容的方法、系统和计算机程序技术方案

技术编号:5457251 阅读:229 留言:0更新日期:2012-04-11 18:40
提出了一种在数据处理系统中搜索数字内容(例如,图像)的解决方案。每个数字内容都与描述它的元数据关联;所述元数据包括一组(一个或多个)字段,每个字段适于接受一组(一个或多个)值。相应的方法(A1-A9)始于提供(A9)一组样例数字内容(例如,来自上一搜索)的步骤。选择(例如,通过将相应的图形表示拖向选择窗口小部件)(A1-A3)所述样例数字内容的一个或多个字段的一个或多个值(或所述值的一部分)。然后可以检索(A4-A9)一组数字内容,其对应于选定字段的选定值的选定部分(例如,通过将它们组合为一个查询)。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及信息
更具体地说,本专利技术涉及数字内容的搜索。
技术介绍
近几年,对数字内容(例如,数字图像)的使用逐渐增多。这主要是因为相应的采 集设备(例如,独立式照相机或内置于移动电话、扫描仪等设备内的照相机)的广泛普及; 而且,随着越来越多的大容量存储设备、功能强大的数据处理系统以及大带宽网络(其促 进数字图像的存储、处理和交换)的出现,这种趋势正在加剧。但是,管理数字图像的过程中出现了一些困难。为此,开发了内容管理应用来 帮助用户完成此任务。商用内容管理应用的一个实例是IBM公司的“联网交互内容访问 (NICA)”。内容管理应用最关键的功能之一是其搜索能力(这允许访问感兴趣的特定数字 图像以对其执行任何所需的操作)。一般而言,搜索基于与每个数字图像关联并对数字图像进行描述的元数据的内 容。为此,多数公知的内容管理应用提供了基于文本的界面,其中用户可以输入所需的过滤 条件(采取关键字的形式,可能与逻辑运算符结合使用);然后使用此过滤条件生成查询, 执行查询将检索所有元数据与过滤条件匹配的数字图像。然而,此技术很难实际应用(因 为用户通常不了解搜索哪些元数据才能获取特定的结果)。在此方面,EP-A-1457898提出使用对象的全局唯一标识符(ID)来建议在搜索中 使用的单词。具体而言,用户捕获对象的ID-例如,通过条码读取器;可针对其他对象重复 相同的操作,这种情况下,可通过对相应图标的拖放操作来组合这些对象。在任何情况下, 都将候选单词列表提供给用户(根据与所输入的ID对应的对象的元数据),以便允许选择 这些单词来定义所需的搜索。作为进一步改进,还提出了“实例搜索(search by example)”技术(例如在上述 “OTCA”中)。在此情况下,用户选择样例数字图像,然后使用此样例数字图像搜索所有与之 类似的数字图像。该解决方案局限性很大,因为它仅允许检索同一类型的数字图像(考虑 了样例数字图像的全部内容)。US-A-2006/0206459披露了一种促进标准文件搜索的图形技术。为此,在控制区内 显示可用文件的所有类型的元数据(属性)。用户然后可选择特定的属性;响应于此操作, 根据选定属性的值将文件进行分组,并使用组图标(每个组图标用于选定属性的相应值) 替代文件。当用户选择组图标(具有选定属性的特定值)时,将使用由具有选定值的选定 属性定义的过滤条件自动生成查询。可递归地重复相同的过程以在逻辑“与”中添加其他 过滤条件。还可以针对同一选定属性选择多个图标组,以便在逻辑“或”中组合相应的过滤 条件。此外,用户可以删除图标组以针对相应的过滤条件创建“非(NOT)”子句。但是,US-A-2006/0206459中披露的技术只能应用于具有简单元数据结构的标准4文件(其中每个属性具有一个短型值,例如,日期值或类型值)。相反地,当属性具有多个值 (例如,关键字)或非常长的值(例如,描述性文本)时,此技术将完全失效。实际上,在这 种情况下,任何选定属性的值都可能全部不同;因此,上述根据选定属性(用于选择其特定 值)进行的文件分组无法提供有意义的结果,因为组图标的数目基本与文件的数目相同。 在任何情况下,上述文档中的搜索过程都非常复杂。具体而言,定义所需的查询需要漫长的 递归细化。而且,选择任何值都需要执行一个双步骤过程(先根据相应的属性对文件进行 分组,然后选择所需的组图标)。必须针对每个要选择的值重复此双步骤过程(当要根据多 个值过滤文件时,定义查询将变得非常耗时)。还提出了其他搜索技术。例如,“Progressive Content-Based Retrievalfrom Satellite Image Archives (卫星图像档案的基于内容的累进检索,Lawrence D.Bergman、 Vittorio Castelli和Chung-Sheng Li,IBMT. J. Watson研究中心联网数据系统部门,D-Lib Magazine,1997年10月,ISSN 1082-9873) ”描述了一种用于构建基于内容的查询的方法, 此方法允许搜索包括所需视觉特征的图像(例如,卫星或医学图像)。具体而言,此文档提 出了对于行数据(例如,像素值)、特性(例如,亮度、形状描述符和灰度纹理)以及语义(例 如,土地覆盖或感官类型)使用不同级别的抽象。可以使用拖放界面构建每个查询。查询 通常包括元数据搜索(用作减少待分析的图像数的修剪机制),后跟图像内容搜索(以计算 最终结果)。US-A-5579471中提出了另一“图像内容查询”过程。在这种情况下,用户可指定特 定区域处的特征(例如,颜色、主题等);为此,用户可将表示每个所需特征的缩略图拖放到 与所需区域对应的位置。
技术实现思路
总体而言,本专利技术旨在促进数字内容的搜索。具体地说,本专利技术的不同方面提供了一种由独立权利要求阐述的解决方案。本发 明的有利的实施例在从属权利要求中进行描述。更具体地说,本专利技术的一个方面提出一种在数据处理系统中搜索数字内容(例 如,图像)的方法。每个数字内容都与描述它的元数据关联;所述元数据包括一组(一个或 多个)字段,每个字段适于接受一组(一个或多个)值。所述方法始于提供一组样例数字 内容(例如,来自上一搜索)的步骤。选择(例如,通过将相应的图形表示拖向选择窗口小 部件)样例数字内容的一个或多个字段的一个或多个值(或所述值的一部分)。然后可以 检索一组数字内容,其对应于选定字段的选定值的选定部分(例如,通过将它们组合为一 个查询)。为此,在本专利技术的一个实施例中提供了相应的图形界面(其中,将图形表示与适 合被选择的每个字段的每个值关联)。作为进一步的改进,将另一图形表示与每个可选择字段关联(以便同时选择所述 字段的所有值)。此外,还可以将其他图形表示与每个样例图像关联(以便同时选择所述图像的所 有可选择字段的值)。还可以直接选择所述值的各部分。5在所提出的解决方案的实施例中,在逻辑“或”中(在相应查询的过滤条件中)组 合同一选定字段的选定值。相反地,在逻辑“与”中组合不同字段的选定值。 有利地,将所检索的数字内容设置为用于下一搜索的样例数字内容。通常,所述字段中的一个或多个字段可以具有多个值。本专利技术的其他方面提出了一种用于执行上述方法的计算机程序(例如,用于内容 管理应用的搜索工具)。本专利技术的另一方面提出了一种相应的系统。 附图说明当结合附图阅读时,通过参考以下仅作为非限定性说明给出的详细描述,可以最 佳地理解专利技术本身及其进一步的特性和优点,这些附图是图1是其中可应用根据本专利技术的实施例的解决方案的数据处理系统的图形表示,图2A-2E示出根据本专利技术的实施例的解决方案的应用的不同实例,以及图3是表示可用于实现根据本专利技术的实施例的解决方案的不同软件组件的作用 的协作图。具体实施例方式具体参考图1,示出了计算机100 (例如,PC)。计算机100包括中央单元105,中央 单元105容纳控制其操作的电子电路;通常,这些电子电路包含微处理器、工作存储器、用 于输入/输出单元的驱动器、网络适配器等。计算机100还具备硬盘和用于读取CD-ROM和 /或DVD-ROM 115的驱动器110。监视器120用于在屏幕125上显示图像。计本文档来自技高网
...

【技术保护点】
一种在数据处理系统中搜索数字内容的方法(A1-A9),其中每个数字内容都与描述所述数字内容的元数据关联,所述元数据包括一组字段,每个字段适于接受一组值,其中所述方法包括以下步骤:提供(A9)一组样例数字内容,选择(A1-A3)所述样例数字内容的至少一个字段的至少一个值的至少一部分,以及检索(A4-A9)与至少一个选定字段的至少一个选定值的选定部分对应的一组数字内容。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:R加尔迪亚V卡鲁洛
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1