描述供利用的商务和技术信息的方法技术

技术编号:2871361 阅读:114 留言:0更新日期:2012-04-11 18:40
一种数据处理方法,包括以下步骤:    将至少一个描述符维数与集合的数据项相关联,其中所述描述符维数代表在至少第一主题和第二主题之间的一个标度;以及    对所述描述符维数赋予一个维数值;    其中所述维数值可表征所述数据项与所述描述符维数的所述第一和第二主题间的定量关系。(*该技术在2023年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及数据处理领域,并且更具体地,涉及描述信息以用于检索和利用的方法。
技术介绍
通常的搜索引擎允许用户定位数据项集合中与具体搜索标准相匹配的数据项。通常,搜索引擎将用户指定的查询与描述符的索引进行匹配。描述符,有时称为元数据,提供数据的定义或描述。描述符可与数据项相关联,并且从而可用来为与描述符相关联的数据项提供可搜索的描述。比如,描述符可与各种数据项相关联,如硬件配置文件、数据条目、多媒体文件、文档、绘图、图表、电子表格、软件对象、记录、Web站点、Web网页或任何其他电子文档和/或可以是搜索集合的一部分的软件成分。数据项可以与大量描述符相关联。与此类似,每个描述符可以与大量数据项相关联。描述符一般是说明单个字词或短语。然而,单个字词或短语经常不传递数据项本质或提供数据项的完全描述。将数据项与一个以上的描述符相关联可能不会传递数据项与每个单个的描述符相关联的程度。结果,对数据集合搜索与具体特征集相匹配的数据项可以是挑战性的。用户指定的查询通常使用选择的关键词作为搜索词语。搜索词语可加权而更强调具体的搜索词语。某些搜索方法根据搜索词语在用户查询中的位置赋予重要性而隐含地对搜索词语加权。例如,在用户查询中指定的第一个词语可被赋予最高的重要性,而查询中最后词语可被赋予最低的重要性。其他的搜索方法允许用户直接指定搜索词语的权重。然而,研究表明,用户并不特别善于确定查询词语的相对重要性。一个原因是用户常常不了解在给定的文档集合中存在的描述符的种类,或至少不了解可用描述符的范围。另外,在多数用户寻找关于不熟悉的主题的信息时,用户多半不熟悉在咨询所搜索的主题时最适合的和/或最常用的术语。因此,用户可能会对不相关的词语给予很大的权重,而却对高度相关的词语给予很小的权重。
技术实现思路
此处公开的本专利技术可提供一种用来描述、搜索和管理数据集合的解决方案。可使用几组描述符来描述数据项的潜在应用、数据项的特征和内容以及数据项的使用和运用历史。各种描述符组中的每一个都可以用来对数据项集合进行搜索和索引。不过,历史描述符,也可用来管理数据项。本专利技术的一个方面可包含一种数据处理方法。此方法可包含将一个或多个描述符维数与集合的数据项相关联。描述符维数中的每一个都代表在至少第一主题和第二主题之间的一个标度。这些主题可将数据项的潜在应用互相关联。根据一实施例,第一和第二主题可彼此相反。对描述符维数可赋予一个维数值。此维数值可表征数据项与描述符维数的第一和第二主题间的定量关系。特别是,描述符维数和维数值可通过使用一组问题向用户查询而确定,其中的问题与关联数据项的描述符维数及维数值相关联。此方法还可包含对一个或多个数据项赋予一个特征描述符。此特征描述符可说明数据项的功能或数据项内容,如声频段、视频段等等。对历史描述符也可赋予一个或多个数据项。历史描述符可说明使用历史、共享历史、复制历史和/或修改历史。历史描述符还可指定数据项的拥有者。因此,此处公开的描述符可由搜索引擎使用于响应用户查询而选择数据项。本专利技术的另一个方面可包含一种搜索数据项集合的方法。此方法可包含通过使用一组问题向用户查询。问题可与同数据项相关联的描述符维数和维数值相关联。描述符维数可代表在至少第一主题和第二主题之间的一个标度;并且此维数值可表征数据项与描述符维数的第一和第二主题间的定量关系。可根据用户对问题的响应生成查询。此查询可指定一个或多个描述符维数和相关联的维数值用于对数据项集合进行搜索。数据项集合可接受就符合查询的特定数据项的搜索。值得注意的是此生成步骤可包含对于要在查询中使用的数据项确定一个或多个历史描述符和/或特征描述符。因此,搜索步骤可包含利用至少一个历史描述符和/或特征描述符对数据项集合进行搜索。附图说明附图中示出当前的优选实施例,不过应该理解的是本专利技术并不严格限于示出的配置和工具。图1A为一表格,列举了根据本专利技术用来描述数据集合中的数据项的描述符维数。图1B为一表格,列举了根据本专利技术用来描述数据集合中的数据项的特征描述符。图1C为一表格,列举了根据本专利技术用来描述数据集合中的数据项的历史描述符。图1D为一表格,列举了根据本专利技术用来描述数据集合中的数据项的附加的历史描述符。图2为示出根据本专利技术的联系数据项和描述符的方法的流程图。图3为根据本专利技术的联系数据项和描述符的示例性图形用户界面。图4为示出根据本专利技术的搜索数据集合的方法的流程图。具体实施例方式此处公开的本专利技术可提供一种用来描述、搜索和管理数据集合中的数据项的解决方案。可使用几组描述符来描述数据项的潜在应用、数据项的特征和内容以及数据项的使用和运用历史。各种描述符组中的每一个都可以用来对数据项集合进行搜索和索引。历史描述符,可用来管理数据项。此处使用的术语“数据项”可包含硬件配置文件、数据条目、多媒体文件、文档、绘图、图表、电子表格、软件对象、记录、Web站点、Web网页,或任何其他电子文档、编程模型、数据模型、软件成分,或可以是可搜索集合的一部分的信息项。可为集合中的数据项提供的一组描述符是具有维数值的维数,如图1A的表格100中所示。描述符维数和维数值可用来详细表示潜在的使用或使用数据项的条件。描述符维数表示两个不同主题、题目、使用和/或分类之间的标度。根据本专利技术的一实施例,标度的两端可互相相反。例如,像宣传或预约材料这样的数据项的潜在的使用可规定为“全局对局部”。即数据项可指定为由局部客户和/或全局客户使用。可提供维数值120来定量描述数据项与描述符维数的主题的关系。特别是,维数值可定量描述标度中的位置,表示数据项与标度各端的关系的相对百分比或度量。就前一个例子来看,维数值可表示宣传材料是否更相关,或更可能,应用于全局语境、局部语境或可同等应用于全局和局部应用两者。维数值可基于顺序数字系统、顺序字母系统或任何其他可描述各项顺序的符号系统。例如,如果对描述符维数使用从1到5的维数值,则任何对特定描述符维数具有维数值3的数据项都可同等应用于由描述符维数代表的每个主体或与其相关。维数值1或5可意味着数据项主要是应用于一个或另一个主题。例如,与描述符维数“全局对局部”相关联的维数值1可表示数据项在本质上完全是全局性的。应用于描述符维数“全局对局部”的维数值5可表示数据项在本质上完全是局部性的。通过比较,维数值2可表示数据项在本质上主要是全局性的。应该理解,描述符维数可代表2个以上的主题。特别是,描述符维数可表示3个、4个或更多的不同主题。比如,与描述符维数相关联的值可指定为位置顺序编号的网格上的位置。描述符维数可视地表示为具有4个不同主题的正方形,其中每个主题由正方形的一个边表示。正方形的面积可分割为9个或更多的顺序编号的块,使单个值可表示指定的数据项与4个主题中的每个主题的关系。此外,本专利技术不限于以任何特定格式代表多维描述符。比如,与一多维描述符相关联的值可表示为矢量。参考图1B的表格130,可提供特征描述符。此特征描述符可用来描述或表示数据项的内容。这样,特征描述符可提供对数据项的功能或数据项实际内容的描述。比如,特征描述符可描述作为内部使用而优选的数据项、作为数据库系统的对象的数据项、声频段数据项或具有任何其他可配置特征的数据项。就是说,一个系统管理员可确定数据项可与其相关联的给定域本文档来自技高网
...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员:P·阿索贝伊尔D·K·巴曼S·E·贝洛A·B·邦福德郑定T·E·多尼根J·O·F·朗R·B·希勒
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1