源搜索引擎制造技术

技术编号:15127162 阅读:52 留言:0更新日期:2017-04-10 04:46
公开一种源搜索引擎以及方法。该方法包括从接口(64)(例如,个人计算机上的web浏览器)接收至少一个搜索项(例如,HIV)。该方法可从网络(66)搜索包括该搜索项的至少一部分的文档(例如,网页)。该方法可确定文档的源(例如,诸如国家地理或国家寻问者等新闻出处)并基于源将文档分类。搜索引擎可实现一种使用文档的源从而基于源来评定搜索结果的资格(例如,分类)的方法。

【技术实现步骤摘要】
本申请是国际申请日为2007年5月18日、中国国家阶段申请号为200780023184.1、题为“源搜索引擎”的专利技术专利申请的分案申请。要求其全部内容通过引用包括于此的美国临时专利申请No.60/747,735(于2006年5月19日提交于美国专利商标局)的优先权。背景随着计算机、信息网络、以及因特网的演进,用户已可访问大量的文档。例如,因特网用户可访问来自遍布全世界的海量资源的网页。随着文档和/或内容量随着时间迅速增长,用户定位关于他们所感兴趣的主题的相关文档已经变得困难。因此,伴随着因特网和其他网络(例如,内联网)的出现,开发出了搜索引擎。搜索引擎允许用户输入搜索项并能够从这些搜索项接收去往文档的索引(例如,因特网链接)。这些索引可以是指示用户的web浏览器通过因特网下载感兴趣的文档(例如,网页)的因特网链接的形式。然而,许多搜索引擎有诸多能力上的缺陷,从而可能导致搜索引擎效率低下。例如,当用户输入搜索项(例如,“HIV”)时,搜索引擎可产生许多与该搜索项的主题有关的页面。然而,由于可能存在海量的与该搜索项相关联的文档,因此搜索引擎可能试图将找到的文档的相关度分级以向用户提供对他们而言可能最感兴趣的文档的访问。遗憾的是,一些引擎可能使用不一定向用户提供最可信和最相关的信息的程序(例如,算法)。因此,虽然一些搜索引擎可能帮助用户定位网页,但这些搜索引擎可能在提供和帮助用户定位对用户最有用的文档或信息上仍然效率较低。例如,如果用户向搜索引擎输入搜索项“HIV”,结果的量可能是惊人的,而用户最初可见的结果相关度可能是非常有限的。因此,许多搜索引擎的一个限制是它们对文档相关度进行分级的方式(即,它们在搜索引擎结果中出现的次序)。从搜索引擎的搜索产生的文档的分级可能呈现随机性。相关度可以基于用户链接到该页面的量、与该页面相关联的链接的量、或其它经验手段。然而,许多搜索引擎并不使用网络上所能访问的文档的、可使得搜索引擎得到可靠相关性分级的实质相关度特性。例如,许多搜索引擎并未使用文档的源(例如,作者)作为将搜索引擎结果的相关度分级的因素。概要实施例涉及一种方法,包括从接口(例如,个人计算机上的web浏览器)接收至少一个搜索项(例如,HIV)。该方法可从网络搜索包括该搜索项的至少一部分的文档(例如,网页)。该方法可确定文档的源(例如,诸如国家地理或国家寻问者等新闻出处)并基于源将文档分类。相应地,根据实施例,搜索引擎可实现一种使用文档的源从而基于源来评定搜索结果的资格(例如,分类)的方法。例如,从国家地理(常被认为可信新闻源)发布的关于论题“HIV”的文章将被给予比由国家寻问者(常被视为可不靠新闻源)发布的文章更多的相关度。通过基于源将文档分类,可向用户提供更为相关的搜索结果。在实施例中,具有使用源来针对相关度进行分类的搜索引擎的图形用户接口可得到对最终用户有用的更为相关的搜索结果。在实施例中,来自搜索引擎的搜索结果可通过向用户列出源来增强。根据实施例,源可以连同搜索结果一起指示。根据实施例,用户可选择源从而将用户导航至基于源而言与其最为相关的文档。相应地,根据实施例,使用源搜索引擎可允许用户对于因特网上日益增长的海量可用文档具有更高效的访问。附图示例图1-8示出了根据实施例包括示例输入和输出的源搜索引擎接口。示例图9-15示出了根据实施例可由源搜索引擎执行的过程的框图流程图。示例图16-19示出了根据实施例的用户接口与网络之间的交互的框图。描述示例图1-9示出了根据实施例的源搜索引擎的示例接口。搜索引擎18可被包括在计算机硬件(例如,服务器、个人计算机、或其它电子设备)中。用户终端(例如,具有web浏览器的个人计算机、具有图形用户接口的服务器、具有小键盘输入的蜂窝电话、或其它计算接口机制)可通过网络16(例如,因特网、内联网、或其他计算机网络)连接至搜索引擎或直接连接到搜索引擎18。搜索项输入10可被输入到用户终端14中。同样,搜索输出20可从用户终端14输出。示例图1示出了响应于输入一搜索项输出一文档列表的源搜索引擎。窗口12是用户终端14上用户接口——在那里输入一搜索项(例如,“HIV”)——的示例屏幕截图。在该搜索项通过网络16从用户终端14被传送到搜索引擎18之后,搜索结果(例如,文档形式的结果)可通过搜索输出20从用户终端14输出。窗口22示出了响应于搜索项“HIV”通过源搜索引擎输出的相关文档的示例屏幕截图。如窗口22中所示,题为“HIV历史”的文档最先出现在文档列表中,其后跟随题为“HIV药物分析”的文档,而其后跟随题为“HIV来自外星人”的文档。根据实施例,这些示例搜索结果以基于各文档的源的相关度被排序。示例图2类似于示例图1中所示的实施例。然而,搜索输出20可具有包括伴随文档标题一起的文档的源的指示的窗口24。例如,题为“HIV历史”的文档被指示为来自期刊国家地理。同样,题为“HIV药物分析”的文档被指示为来自政府源国家卫生研究所(NIH)。此外,题为“HIV来自外星人”被指示为源自期刊国家寻问者。可用来对相关度进行排序的文档的源的指示可帮助用户针对他们的兴趣选择最相关的文档。在图1和2中所示的实施例中,文章标题可包括可通过网络来访问的到这些文档的链接。示例图3示出了类似于图1和2中示出的实施例的实施例,然而搜索项输入10和搜索输出20允许用户在搜索项输入10中指示源。如窗口26中所示,源搜索引擎允许输入搜索项和用户感兴趣的源。在窗口26中所示的示例中,搜索项是“HIV”且源被指示为“国家地理”和“NIH”。如示例窗口28中所示的,所列的文档仅来自源国家地理和NIH。在实施例中,在窗口26中输入的源可被考虑为预先限定的源,以允许用户限定哪些信息源可被用来输出最相关的搜索结果。在实施例中,搜索引擎可替换被视为与用于输出相关搜索结果的这些输入源等价的其它源。示例图4示出了类似于示例图1-3中所示的实施例的实施例,然而搜索输出20输出源结果来代替文档结果。如示例窗口30中所示的,基于搜索项“HIV”的输入,源结果被输出。在该示例中,来自搜索项“HIV”的源结果被指示为“国家地理”、“国家卫生研究院”、以及“国家寻问者”。在实施例中,用户可选择其中一个源以查看来自该源的文档列表。各个源可基于各源的已建立可信度、各源可访问的文档数目、各源的其它实质性预定特性、其它经验数据、和/或因素组合来排序。在实施例中,由于用户可选择源,所以用户能够访问与其需求最相关的文档。示例图5示出了与图4中所示的实施例相类似的实施例。如窗口32所示,源结果的输出可给出与源相关联的文档的其它信息。例如,在源结果中,可以有与该源相关联的文档的数目的指示。例如,在窗口32中,指示有两篇文档与从搜索项“HIV”得到的期刊“国家地理”相关联。同样,指示有一篇文档来自源“国家卫生研究院”以及一篇文档来自源“国家寻问者”。同样,在图6中,窗口34中所示的源结果可指示源的资格水平。例如,窗口34中的源结果将国家地理和国家卫生研究院显示为“高资格”,而国家本文档来自技高网...

【技术保护点】
一种电子设备,包括:存储装置;处理器,耦合到所述存储装置并配置为用于:从接口接收至少一个搜索项;从网络搜索包括所述至少一个搜索项的至少一部分的文档;确定所述搜索的所得文档的源;至少基于所述所得文档的源确定所述所得文档的相关度,包括至少基于源的声誉来评定所述所得文档的源的资格;以及至少基于评定所述所得文档的源的资格,将所述所得文档分类。

【技术特征摘要】
2006.05.19 US 60/747,7351.一种电子设备,包括:
存储装置;
处理器,耦合到所述存储装置并配置为用于:
从接口接收至少一个搜索项;
从网络搜索包括所述至少一个搜索项的至少一部分的文档;
确定所述搜索的所得文档的源;
至少基于所述所得文档的源确定所述所得文档的相关度,包括至少
基于源的声誉来评定所述所得文档的源的资格;以及
至少基于评定所述所得文档的源的资格,将所述所得文档分类。
2.如权利要求1所述的电子设备,其特征在于,评定所述所得文档的源
的资格包括以下中的一项或多项:
比较所述源的已建立声誉;
比较从所述源的可访问文档数量;
比较经验数据;或
比较用户输入的至少一个预先评定资格的源的等价物。
3.如权利要求1所述的电子设备,其特征在于,评定所述所得文档的源
的资格包括将每个所得文档的源的已建立声誉与其他所得文档相比较。
4.如权利要求1所述的电子设备,其特征在于,评定所述所得文档的源
的资格包括将每个所得文档的用户输入的至少一个预先评定资格的源的等价
物与其他所得文档相比较。
5.如权利要求1所述的电子设备,其特征在于:
所述接口是互联网接口和内联网接口中的至少一者;以及
所述网络是互联网和内联网中的至少一者。
6.如权利要求1所述的电子设备,其特征在于,文档包括以下至少一项:
网页;
发布的文章;
音频剪辑;
视频剪辑;以及
电子文档。
7.如权利要求1所述的电子设备,其特征在于,所述源是以下至少一项:
创作文档的一个或多个人;
发布文档的一个或多个人;
文档中援引的一个或多个人;
与所述至少一个搜索项相关联的一个或多个人;
创作文档的一个或多个组织;
发布文档的一个或多个组织;
文档中援引的一个或多个组织;或
与所述至少一个搜索项相关联的一个或多个组织。
8.如权利要求1所述的电子设备,其特征在于,所述确定所述文档的相
关度是基于所述文档的源和所述文档与所述至少一个搜索项的匹配质量。
9.如权利要求1所述的电子设备,其特征在于,包括以基于所述文档的
相对相关度的方式向所述接口输出所述文档的标识。
10.如权利要求9所述的电子设备,其特征在于,所述基于所述文档的相
对相关度的方式包括以从最相关到最不相关的次序列出所述文档。
11.如权利要求1所述的电子设备,其特征在于,包括以基于所述源的相
对资格的方式向所述接口输出所述文档的源的标识,其中所述源的标识至少由

\t所述源的声誉确定。
12.如权利要求11所述的电子设备,其特征在于,所述基于源的相对资
格的方式包...

【专利技术属性】
技术研发人员:约恩·吕森根
申请(专利权)人:约恩·吕森根
类型:发明
国别省市:美国;US

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1