在网站和类似信息源中导航制造技术

技术编号:2853111 阅读:163 留言:0更新日期:2012-04-11 18:40
一种允许对诸如因特网或内联网网站等电子文档组进行导航的交互/电子指南(10),所述指南用于自动地呈现多个主题标识符(14)已识别的主题在网站内的重要性的指示(16),每一个主题(14,16)是用户可选的。对给定主题(14,16)的选择提供对关于该主题的信息的访问。优选地,该指南(10)还提供了可能通过内容相关的多个网站有关的信息、以及对这样的多个网站之间的内容的相似性程度的指示。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及一种定位和导航到万维网上诸如网站或类似信息源之类的信息组内所包含的信息的改进系统和方法。本专利技术还涉及一种产生容易地对这样的信息进行导航的交互指南的系统和方法。
技术介绍
高级主管和研究员经常难以在公司组织结构内详细地获得与什么事务正在进行有关的精确信息。然而,公司网站越来越包含大量的信息,例如关于公司的产品、人员和组织结构的信息。如果很快地进行对该信息的轻松访问,则可以提供有价值的资源。然而,当前,由于当前网站位置和浏览技术的低效,和识别大量可用信息中的重要主题的困难,难以定位相关网站和找到信息。当前可以使用各种搜索和浏览技术来在网站中进行定位和导航。这些技术中的第一种技术是传统的搜索引擎。这可以识别包含了在搜索引擎框中输入的特定词或短语的网页。该技术依赖于搜索者知道在网站上使用的准确的词或短语以识别特定主题。尽管该搜索方法对于产品名称之类的硬信息(hard information)可能非常有效,但是当搜索更为抽象的概念且在可以使用不同的词和短语来描述相同或相关信息的情况下,其不太有效。例如,如果所有的所需信息都处于包含词“教师”的网页上,则在搜索引擎或网站上对词“教师”的搜索可能是有效的。然而,如果在另一网页上存在不包括词“教师”的相关信息,例如“教育”、“学校”、“孩子”和“教室”,则通过仅针对关键词“教师”的搜索引擎搜索将无法对此进行定位。当查找特定类型的业务时(例如,当定位潜在的联合体和买进对象、市场和营销前景或商业伙伴时)该方法的另外的缺点在于其定位的各网页可能仅反映给定公司的活动的很小部分。在给定的公司网站上可能存在好几万网页,因此通常单个的网页无法从整体上反映公司的活动,这使得根据其活动范围来识别公司的过程变得非常困难。为了帮助用户在网站内进行导航,传统的解决方案是提出网站地图或链接网页。这典型地提供了主要主题或子主题的较长列表,具有去往在网站中包含这样的主题的各个网页的链接。网站地图通常手动地产生并处于相对较高的级别。因此,其通常缺少大量的细节且组织和结构上相当扁平。这意味着获得信息可能会非常困难,因为其通常不能够“向下钻”过一个信息级别,而每一次当用户想要浏览与不同的主题有关的信息时,需要用户返回到网站地图。用于在网站内导航的另一传统技术是手动浏览。典型地,万维网包含通过每一个网页之间的多个可能路径而相互链接的数百万个网页。选择在特定网页内所包含的链接允许用户导航到包含由链接文本或图形所识别的信息的下一链接网页。然而,当手动浏览时可能难以确保包含相关信息的网页未被错过,并且网页在先前并未访问过。此外,由于充分描述能够通过链接而得到的大量主题的空间限制,在典型网站上所使用的文本链接通常包含不充分的词。手动浏览的另一缺点在于用户经常会略读每一个网页,不可避免地导致了在网页上可视地突显的题头文本和其他项的更为敏感地重点关注。如果所需的关键词并未包含在重点关注的文本中,这可能会在通过略读网页来识别关键词信息时,歪曲用户的有效性。
技术实现思路
本专利技术的目的是提出一种对万维网上的信息组或其他类似信息源进行定位的系统和方法。这样的信息组典型地将包含在由诸如www.google.com或www.uspto.gov等统一资源定位符(URL)所标识的网站内。本专利技术的另一目的是提出一种在万维网或其他信息存储器上的信息组之间和之内进行导航的改进方法。这样的信息组典型地将被包含在单个网站的界限内、或通过内容相关的网站内。在所附独立权利要求中限定了本专利技术的各个方面。在从属权利要求中限定了一些优选的特征。根据本专利技术的一个方面,提出了一种对基于文本(text)的电子文档的组或集合进行分布(profiling)的方法,所述方法包括分析组中的每一个文档以识别关键主题;将重要性量度分配给已识别的关键主题;以及使用该量度产生包括多个主题标识符的主题分布图和已识别每一个主题对所述组在整体上的重要性的指示。优选地,所述电子文档的组包括网站的网页。在这种情况下,所述方法还可以包括下载网站的每一个网页以便执行分析步骤。所述分析文档的步骤可以包括搜索特定单词。另外或可选地,所述分析步骤包括搜索并消除与重要关键词无关的主题。另外或优选地,所述分析步骤可以包括确定与组中已识别的多个关键主题的每一个相关的单词列表;确定每一个关键主题是否出现于针对所述组中的其他关键主题的任一个的相关单词的列表中,并丢弃关键主题并未出现于针对任意其他关键主题的相关单词列表中的任意关键主题。根据本专利技术的另一方面,提出了一种对基于文本的电子文档的组或集合进行分布的系统,所述系统包括用于分析组中的每一个文档以识别关键主题的装置;用于将重要性量度分配给已识别的关键主题的装置;以及使用所述量度产生包括多个主题标识符的主题分布图和已识别的主题对所述组在整体上的重要性的量度或指示的装置。根据本专利技术的另一方面,提出了一种在诸如因特网或内联网网站之类例如万维网的子集的电子文档的组内进行导航的方法,所述方法包括在屏幕或显示器上自动呈现多个主题标识符和已识别主题对所述组在整体上的相对重要性的指示,每一个主题是用户可选的;接收用户对给定主题的选择,并响应用户的选择,提供对关于所选主题的信息的访问。通过自动呈现主题标识符以及其相对重要性而不需用户启动关键词搜索,提供了一种简单而有效的技术来允许用户对感兴趣的信息进行容易的导航。根据本专利技术的另一方面,提出了一种允许对诸如因特网或内联网网站之类电子文档组进行导航的交互/电子指南,所述指南用于自动地呈现多个主题标识符和已识别的主题的重要性的指示,每一个主题是用户可选的,其中对给定主题的选择提供对关于所选主题的信息的访问。根据本专利技术的另一方面,提出了一种在万维网上或其他信息存储器中定位信息组的方法,所述方法包括识别多个候选信息组;获得针对每一个候选组的内容分布图;将第一候选组的分布图与所述多个候选组中的每一个其他候选组进行比较,以便识别和测量第一与其他候选组之间的分布图上的任何差别。通过比较多个不同网站的内容分布图,提出了一种简单的机制来识别具有相似或相关内容的网站、或者识别与任意所需内容分布图相匹配的网站。根据本专利技术的另一方面,提出了一种在万维网或其他信息存储器上的信息组之间和之内进行导航的方法,包括在屏幕或显示器上自动呈现多个组标识符、以及已识别的组相对于所需内容分布图的相似性的指示,每一个组是用户可选的;接收用户对给定组标识符的选择,并响应用户的选择,提供对关于所选组的信息的访问。根据本专利技术的另一方面,提出了一种用于在万维网等上定位诸如网站等文档组的交互/电子指南,所述指南用于呈现多个组标识符、以及每一个组对目标内容分布图的相似性的指示,每一个组标识符是用户可选的;其中对组标识符的选择提供了对关于所选组的信息的访问。附图说明将仅作为示例并参考附图来描述本专利技术的各个方面,其中图1是用于在具有关键网站标题列表的网站内定位和导航以及对这些网站进行定位和导航的电子指南的主视图的示例图;图2是当从图1的列表中选择关键主题时呈现给用户的后续视图的示例图;图3是在图1和2所示的网页之间的链接的分级结构的图;图4是对与诸如图1所示的目标主题分布图相关的网站进行定位和导航的电子指南的相关视图的示例图;图5示出了该指南的无限钻过能本文档来自技高网
...

【技术保护点】
一种允许对诸如因特网或内联网网站之类的电子文档组进行导航的交互/电子指南,所述指南用于自动地呈现多个主题标识符,和已识别的主题对所述组在整体上或部分上的重要性的指示,每一个主题是用户可选的,其中对主题标识符进行呈现,而无需用户启动关键词搜索,且对给定主题的选择提供了对所述组中关于所选主题的信息的访问。

【技术特征摘要】
【国外来华专利技术】GB 2003-4-23 0309174.11.一种允许对诸如因特网或内联网网站之类的电子文档组进行导航的交互/电子指南,所述指南用于自动地呈现多个主题标识符,和已识别的主题对所述组在整体上或部分上的重要性的指示,每一个主题是用户可选的,其中对主题标识符进行呈现,而无需用户启动关键词搜索,且对给定主题的选择提供了对所述组中关于所选主题的信息的访问。2.根据权利要求1所述的指南,其中主题按照预定次序呈现,从而提供主题对所述组在整体上或部分上的重要性的指示。3.根据权利要求2所述的指南,其中所述主题按照重要性的降序呈现,最重要的主题呈现在列表的开始处,而最不重要的主题呈现在列表的末尾处。4.根据权利要求1到3任一个所述的指南,其中所述主题标识符是一个或多个关键字或关键短语标识符。5.根据权利要求1到4任一个所述的指南,其中提供图形指示,以给出主题对所述组在整体上或部分上的重要性的可视指示。6.根据权利要求5所述的指南,其中所述图形标识符是横条,其长度提供了相关主题对所述组在整体上或部分上的重要性的指示。7.根据权利要求5或6所述的指南,其中所述图形标识符是可选的,从而允许用户选择相关的主题。8.根据权利要求1到7任一个所述的指南,其中对给定主题的选择使得多个附加指南网页之一得以呈现。9.根据权利要求8所述的指南,其中在选择任一主题或主题标识符时,所述指南用于使附加主题标识符的相似列表得以呈现或者使包含与所需主题相关的内容的活动网页得以呈现。10.根据前述权利要求任一个所述的指南,其中所述指南用于呈现识别诸如以太网或内联网网站之类一个或多个相关的电子文档组的相关组标识符,和第一组与每一个相关组的关键主题分布图之间的相似性的指示或量度。11.一种允许在诸如因特网或内联网网站之类例如万维网的子集的电子文档的组内进行导航的方法,所述方法包括在屏幕或显示器上自动呈现多个主题标识符,和已识别主题对所述组在整体上或部分上的相对重要性的指示;接收用户对给定主题的选择,并响应用户的选择,提供对关于所选主题的信息的访问。12.根据权利要求11所述的方法,包括呈现用于识别诸如以太网或内联网网站之类一个或多个相关的电子文档组的相关组标识符,和第一组与每一个相关组的关键主题分布图之间的相似性的指示或量度。13.一种在诸如因特网或内联网网站之类例如万维网子集的电子文档的组内进行导航的系统,所述系统包括自动地在屏幕或显示器上呈现多个主题标识符,和已识别主题对所述组在整体上或部分上的相对重要性的指示的装置;用于接收用户对给定主题的选择的装置;以及响应用户的选择提供对关于所选主题的信息的访问的装置。14.根据权利要求13所述的方法,包括用于呈现识别诸如以太网或内联网网站之类一个或多个相关的电子文档组的相关组标识符,和第一组与每一个相关组的关键主题分布图之间的相似性的指示或量度的装置。15.一种优选地位于数据载体上或其他一些计算机可读介质上的计算机程序,所述计算机程序用于产生在因特网或内联网等中使用的交互/电子指南,所述程序具有配置来实现以下功能的代码或指令自动地呈现多个主题标识符和所述主题对文档组在整体上或部分上的重要性的指示,每一个主题是用户可选的,接收对给定主题的选择,并响应主题选择,提供对关于所选主题的信息的访问。16.根据权利要求15所述的计算机程序,其中所述计算机程序用于呈现识别诸如以太网或内联网网站之类一个或多个相关的电子文档组的相关组标识符,和第一组与每一个相关组的关键主题分布图之间的相似性的指示或量度。17.一种在万维网上或其他信息存储器中定位信息组的方法,所述方法包括识别多个候选信息组;获得针对每一个候选组的内容分布图;将第一候选组的分布图与所述多个候选组中的每一个其他候选组进行比较,以便识别第一与其他候选组之间的分布图上的任何差别。18.根据权利要求17所述的方法,其中所述分布图由多个主题构成。19.根据权利要求17或18所述的方法,其中每一个所述主题分配有所述主题对所述组在整体上或部分上的内容的重要性量度。20.根据权利要求19所述的方法,其中所述比较步骤包括对第一和其他候选组共用的主题数量进行计数。21.根据权利要求17到20任一个所述的方法,其中所述比较步骤包括将针对所述第一候选组的每一个关键主题的重要性量度与其他候选组中的相同或相似主题的重要性量度进行比较。22.根据权利要求17所述的方法,其中所述比较步骤包括计算所述第一和其他候选组之间共用的所有主题上的总计比较。22.根据权利要求17到22任一个所述的方法,还包括针对任一个或多个候选组,自动地呈现多个主题标识符和已识别的主题的重要性的指示,每一个主题是用户可选的,其中呈现所述主题标识符,而无需用户启动关键字搜索,并且对给定主题的选择提供了对关于所选主题的信息的访问。23.一种在万维网或其他信息存储器上定位信息组的系统,所述系统包括用于识别多个候选信息组的装置;用于获得针对每一个候选组的内容的分布图的装置;以及用于将第一候选组与所述多个候选组中的每一个其他第二候选组进行比较的装置。24.根据权利要...

【专利技术属性】
技术研发人员:戴维瓦特斯蒂芬森
申请(专利权)人:戴维瓦特斯蒂芬森
类型:发明
国别省市:GB[英国]

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1