当前位置: 首页 > 专利查询>约恩吕森根专利>正文

源搜索引擎制造技术

技术编号:5390819 阅读:303 留言:0更新日期:2012-04-11 18:40
一种方法,包括从接口(64)(例如,个人计算机上的web浏览器)接收至少一个搜索项(例如,HIV)。该方法可从网络(66)搜索包括该搜索项的至少一部分的文档(例如,网页)。该方法可确定文档的源(例如,诸如国家地理或国家寻问者等新闻出处)并基于源将文档分类。搜索引擎可实现一种使用文档的源从而基于源来评定搜索结果的资格(例如,分类)的方法。

【技术实现步骤摘要】
【国外来华专利技术】源搜索引擎要求其全部内容通过引用包括于此的美国临时专利申请No. 60/747,735 (于2006年5月19日提交于美国专利商标局)的优先权。背景随着计算机、信息网络、以及因特网的演进,用户己可访问大量的文档。 例如,因特网用户可访问来自遍布全世界的海量资源的网页。随着文档和/或内 容量随着时间迅速增长,用户定位关于他们所感兴趣的主题的相关文档已经变 得困难。因此,伴随着因特网和其他网络(例如,内联网)的出现,开发出了搜索 引擎。搜索引擎允许用户输入搜索项并能够从这些搜索项接收去往文档的索引(例如,因特网链接)。这些索引可以是指示用户的web浏览器通过因特网下 载感兴趣的文档(例如,网页)的因特网链接的形式。然而,许多搜索引擎有诸多能力上的缺陷,从而可能导致搜索引擎效率低 下。例如,当用户输入搜索项(例如,"HIV")时,搜索引擎可产生许多与 该搜索项的主题有关的页面。然而,由于可能存在海量的与该搜索项相关联的 文档,因此搜索引擎可能试图将找到的文档的相关度分级以向用户提供对他们 而言可能最感兴趣的文档的访问。遗憾的是, 一些引擎可能使用不一定向用户 提供最可信和最相关的信息的程序(例如,算法)。因此,虽然一些搜索引擎 可能帮助用户定位网页,但这些搜索引擎可能在提供和帮助用户定位对用户最 有用的文档或信息上仍然效率较低。例如,如果用户向搜索引擎输入搜索项"HIV",结果的量可能是惊人的,而用户最初可见的结果相关度可能是非常 有限的。因此,许多搜索引擎的一个限制是它们对文档相关度进行分级的方式(即, 它们在搜索引擎结果中出现的次序)。从搜索引擎的搜索产生的文档的分级可 能呈现随机性。相关度可以基于用户链接到该页面的量、与该页面相关联的链接的量、或其它经验手段。然而,许多搜索引擎并不使用网络上所能访问的文 档的、可使得搜索引擎得到可靠相关性分级的实质相关度特性。例如,许多搜 索引擎并未使用文档的源(例如,作者)作为将搜索引擎结果的相关度分级的 因素。概要实施例涉及一种方法,包括从接口 (例如,个人计算机上的web浏览器) 接收至少一个搜索项(例如,HIV)。该方法可从网络搜索包括该搜索项的至 少一部分的文档(例如,网页)。该方法可确定文档的源(例如,诸如国家地 理或国家寻问者等新闻出处)并基于源将文档分类。相应地,根据实施例,搜 索引擎可实现一种使用文档的源从而基于源来评定搜索结果的资格(例如,分 类)的方法。例如,从国家地理(常被认为可信新闻源)发布的关于论题"HIV" 的文章将被给予比由国家寻问者(常被视为可不靠新闻源)发布的文章更多的 相关度。通过基于源将文档分类,可向用户提供更为相关的搜索结果。在实施例中, 具有使用源来针对相关度进行分类的搜索引擎的图形用户接口可得到对最终 用户有用的更为相关的搜索结果。在实施例中,来自搜索引擎的搜索结果可通 过向用户列出源来增强。根据实施例,源可以连同搜索结果一起指示。根据实 施例,用户可选择源从而将用户导航至基于源而言与其最为相关的文档。相应 地,根据实施例,使用源搜索引擎可允许用户对于因特网上日益增长的海量可 用文档具有更高效的访问。附图示例图l-9示出了根据实施例包括示例输入和输出的源搜索引擎接口。 示例图9-15示出了根据实施例可由源搜索引擎执行的过程的框图流程图。 示例附图说明图16-19示出了根据实施例的用户接口与网络之间的交互的框图。描述示例图l-9示出了根据实施例的源搜索引擎的示例接口。搜索引擎18可被包括在计算机硬件(例如,服务器、个人计算机、或其它电子设备)中。用 户终端(例如,具有web浏览器的个人计算机、具有图形用户接口的服务器、 具有小键盘输入的蜂窝电话、或其它计算接口机制)可通过网络16 (例如,因 特网、内联网、或其他计算机网络)连接至搜索引擎或直接连接到搜索引擎18。 搜索项输入10可被输入到用户终端14中。同样,搜索输出20可从用户终端 14输出。示例图1示出了响应于输入一搜索项输出一文档列表的源搜索引擎。窗口 12是用户终端14上用户接口——在那里输入一搜索项(例如,"HIV")—— 的示例屏幕截图。在该搜索项通过网络16从用户终端14被传送到搜索引擎18 之后,搜索结果(例如,文档形式的结果)可通过搜索输出20从用户终端14 输出。窗口22示出了响应于搜索项"HIV"通过源搜索引擎输出的相关文档的 示例屏幕截图。如窗口 22中所示,题为"HIV历史"的文档最先出现在文档 列表中,其后跟随题为"HIV药物分析"的文档,而其后跟随题为"HIV来自 外星人"的文档。根据实施例,这些示例搜索结果以基于各文档的源的相关度 被排序。示例图2类似于示例图1中所示的实施例。然而,搜索输出20可具有包 括伴随文档标题一起的文档的源的指示的窗口 24。例如,题为"HIV历史"的 文档被指示为来自期刊国家地理。同样,题为"HIV药物分析"的文档被指示 为来自政府源国家卫生研究所(NIH)。此外,题为"HIV来自外星人"被指 示为源自期刊国家寻问者。可用来对相关度进行排序的文档的源的指示可帮助 用户针对他们的兴趣选择最相关的文档。在图1和2中所示的实施例中,文章标题可包括可通过网络来访问的到这 些文档的链接。示例图3示出了类似于图1和2中示出的实施例的实施例,然而搜索项输 入IO和搜索输出20允许用户在搜索项输入10中指示源。如窗口 26中所示, 源搜索引擎允许输入搜索项和用户感兴趣的源。在窗口 26中所示的示例中, 搜索项是"HIV"且源被指示为"国家地理"和"NIH"。如示例窗口 28中所 示的,所列的文档仅来自源国家地理和NIH。在实施例中,在窗口26中输入 的源可被考虑为预先限定的源,以允许用户限定哪些信息源可被用来输出最相7关的搜索结果。在实施例中,搜索引擎可替换被视为与用于输出相关搜索结果 的这些输入源等价的其它源。示例图4示出了类似于示例图1-3中所示的实施例的实施例,然而搜索输出20输出源结果来代替文档结果。如示例窗口 30中所示的,基于搜索项"HIV" 的输入,源结果被输出。在该示例中,来自搜索项"HIV"的源结果被指示为 "国家地理"、"国家卫生研究院"、以及"国家寻问者"。在实施例中,用 户可选择其中一个源以查看来自该源的文档列表。各个源可基于各源的已建立 可信度、各源可访问的文档数目、各源的其它实质性预定特性、其它经验数据、 和/或因素组合来排序。在实施例中,由于用户可选择源,所以用户能够访问与 其需求最相关的文档。示例图5示出了与图4中所示的实施例相类似的实施例。如窗口 32所示, 源结果的输出可给出与源相关联的文档的其它信息。例如,在源结果中,可以 有与该源相关联的文档的数目的指示。例如,在窗口 32中,指示有两篇文档 与从搜索项"HIV"得到的期刊"国家地理"相关联。同样,指示有一篇文档 来自源"国家卫生研究院"以及一篇文档来自源"国家寻问者"。同样,在图 6中,窗口34中所示的源结果可指示源的资格水平。例如,窗口34中的源结 果将国家地理和国家卫生研究院显示为"高资格",而国家寻问者被指示为具 有"低资格"。对于将某物评定资格为高或低或某一标度的确定可以基于来自 用户的反馈、搜索引擎算法中使用的实质本文档来自技高网...

【技术保护点】
一种方法,包括: 从接口接收至少一个搜索项; 从网络搜索包括所述至少一个搜索项的至少一部分的文档; 确定所述文档中每一个的源;以及 基于所述文档的源将所述文档分类。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:约恩吕森根
申请(专利权)人:约恩吕森根
类型:发明
国别省市:US[美国]

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1