用于识别ｗｅｂ文档的方法和系统技术方案

技术编号：2837138 阅读：224 留言：0更新日期：2012-04-11 18:40

一种系统，识别文档，执行搜索以识别与同该文档关联的属性相关的ｗｅｂ文档，并提供与所述ｗｅｂ文档关联的信息和该文档。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】
符合本专利技术原理的系统与方法一般涉及信息检索，更具体而言，涉及提供与特定文档相关的信息。
技术介绍
现代计算机网络，尤其是因特网，使得大量信息能够广泛地且容易地获得。例如，免费因特网搜索引擎标引(index)出了链接至因特网的成千上万的web文档。连接至因特网的用户可以输入简单的搜索查询以快速地定位与该搜索查询相关的web文档。然而，在因特网上不能广泛获得的一类内容包括更传统的作者印刷作品，例如书籍和杂志。使这些作品能够以数字方式获得的阻碍在于难以将作品的印刷版本转换为数字形式。光学字符识别(OCR)(它是使用光学扫描设备生成接下来转换为计算机可读格式(例如ASCII文件)的字符的文本图像的动作)，是将印刷文本转换为可用数字形式的已知技术。OCR系统一般包括用于生成印刷页面图像的光学扫描仪，以及用于分析该图像的软件。
技术实现思路
根据一个方面，一种方法可以包括接收搜索查询；基于该搜索查询执行第一搜索以识别文档；基于与该文档关联的属性执行第二搜索；并呈现第二搜索的结果。根据另一方面，一种系统可以包括存储指令的存储器和执行这些指令的处理器。该系统可以识别文档，执行搜索以识别带有与该文档关联的属性相关的信息的web文档，并呈现与该web文档关联的信息。根据又一方面，计算机可读媒体中体现的图形用户界面可以包括到文档各部分的一组链接，文档内容的描述，以及与该文档关联的著录信息。该图形用户界面还可以包括用于使web文档的搜索得以执行的链接，该web文档带有与该文档关联的属性相关的信息。根据再一方面，一种方法可以包括接收来自用户的文档标识；自动执行多个搜索以识别与该...

【技术保护点】
一种方法，包括：接收搜索查询；基于该搜索查询执行第一搜索以识别文档；基于与该文档关联的属性执行第二搜索；以及呈现第二搜索的结果。

【技术特征摘要】
【国外来华专利技术】US 2004-9-30 10/953,1121.一种方法，包括接收搜索查询；基于该搜索查询执行第一搜索以识别文档；基于与该文档关联的属性执行第二搜索；以及呈现第二搜索的结果。2.根据权利要求1的方法，其中执行第二搜索的步骤包括接收该文档的选择，以及响应于该文档的选择，执行第二搜索。3.根据权利要求1的方法，其中执行第二搜索的步骤包括接收该文档的选择，呈现与该文档关联的引用页面，该引用页面包括与属性关联的多个链接，接收这些链接之一的选择，以及响应于这些链接之一的所述选择，执行第二搜索。4.根据权利要求1的方法，其中呈现第二搜索的结果的步骤包括识别与属性相关的web文档，从该web文档中提取信息，以及呈现所提取的信息。5.根据权利要求1的方法，其中呈现第二搜索的结果的步骤包括将web文档识别为第二搜索的结果，生成所述web文档的得分，基于所述得分对web文档进行分类，以及呈现分类后的web文档。6.根据权利要求5的方法，其中生成所述web文档的得分的步骤包括生成所述web文档的信息检索得分，生成所述web文档的基于链接的得分，以及基于信息检索得分和基于链接的得分，生成所述web文档的总体得分。7.根据权利要求1的方法，还包括呈现与该文档关联的引用页面，该引用页面包括与带有与属性相关的信息的web文档的搜索关联的链接。8.根据权利要求7的方法，其中链接的选择使得第二搜索得以执行。9.根据权利要求7的方法，其中所述引用页面还包括以下中的至少之一该文档的内容的描述，与同该文档关联的封皮、封皮页或封皮内折边之一关联的文本，与该文档关联的著录信息，或广告。10.根据权利要求7的方法，其中所述引用页面还包括来自该文档的摘录，和到该文档各部分的一组链接。11.根据权利要求10的方法，其中所述摘录包括来自该文档的一部分文本的图像。12.根据权利要求10的方法，其中该组链接引用以下中的至少之一与该文档关联的封面，与该文档关联的内容表，与该文档关联的索引，或与该文档关联的封底。13.根据权利要求1的方法，其中呈现第二搜索的结果的步骤包括呈现与该文档关联的引用页面，该引用页面包括到带有与所述属性相关的信息的web文档的链接。14.根据权利要求13的方法，其中该链接通过执行第二搜索而生成。15.根据权利要求13的方法，其中所述引用页面还包括以下中的至少之一该文档的内容的描述，与同该文档关联的封皮、封面或封皮内折边之一关联的...

【专利技术属性】
技术研发人员：舍拉佳哈利克，威廉姆C布鲁格赫，
申请(专利权)人：GOOGLE公司，
类型：发明
国别省市：US[美国]

全部详细技术资料下载我是这个专利的主人