当前位置: 首页 > 专利查询>谷歌公司专利>正文

用于确认文档的作者身份的系统和方法技术方案

技术编号:10195409 阅读:154 留言:0更新日期:2014-07-10 03:28
本发明专利技术提供了一种用于确认文档的作者身份的系统、存储至少一个程序的计算机可读存储介质以及计算机实现的方法。访问托管在第一域的第一网站上的第一文档,该第一文档通过至少一个链接而链接至第二文档,并且相应链接包括第一预定义作者身份属性,其通过与该相应链接的相应目标文档相关联的相应实体而断定包括该相应链接的相应文档的作者身份。当第二文档包括到该第一域的第一网站的第二链接时,通过与第二文档相关联的实体有条件地确认第一文档的作者身份,该第二链接包括第二预定义作者身份属性,其指示与第二文档相关联的实体为第一域的第一网站的内容的作者或者贡献者。

【技术实现步骤摘要】
【国外来华专利技术】
所公开的实施例总体上涉及确认文档的作者身份。
技术介绍
网站上的内容通常包括作者身份信息。例如,一篇文章可以包括列出创作该文章的实体的署名。然而,作者身份信息可能不准确或者可能不是有效的。例如,当一篇文章实际上不是由特定实体创作的时,该文章却可能包括断定(assert)该特定实体创作了该文章的作者身份信息。作者身份信息的不准确和/或无效导致了获得搜索结果时的不准确和/或呈现搜索结果时对用户的混淆。因此,将期望对网站中的内容的作者身份进行确认而使得正确识别创作该内容的实体。【附图说明】这里所公开的实施例在附图的图中通过示例而非限制进行了图示。同样的附图标记贯穿附图指代相对应的部分。图1是图示根据一些实施例的网络系统的框图。图2是图示根据一些实施例的可用来确认文档的作者身份的作者身份属性的框图。图3是图示根据一些实施例的可用来确认文档的作者身份的作者身份属性的框图。图4是图示根据一些实施例的可用来确认文档的作者身份的作者身份标识符的框图。图5是图示根据一些实施例的实体的简档的框图。图6是图示根据一些实施例的服务器系统的框图。图7是图示根据一些实施例的内容服务器系统的框图。图8是根据一些实施例的用于确认文档的作者身份的方法的流程图。图9是根据一些实施例的用于遍历链接的方法的流程图。【具体实施方式】随后的描述包括具体化说明性实施例的示例系统、方法、技术、指令序列和计算机器程序产品。在以下描述中,出于解释的目的给出了很多具体细节以便提供对所描述的实施例的理解。然而,对于本领域技术人员显而易见的是,一些实施例可以在没有这些具体细节的情况下得以实践。通常,没有详细示出公知的指令实例、协议、结构和技术。还要理解的是,虽然术语“第一”、“第二”等可以在这里用来描述各个元素,但是这些元素不应当被这些元素限制。这些术语仅用来将一个元素与其它元素加以区分。例如,第一联系人可以被称作第二联系人,并且类似地,第二联系人可以被称作第一联系人,只要所有出现的“第一联系人”被一致地重新命名且所有出现的“第二联系人”被一致地重新命名,这就并不改变描述的含义。第一联系人和第二联系人是两个联系人,但是他们不是相同的联系人。这里所使用的术语仅是出于描述特定实施例的目的而并非意在对权利要求进行限制。如实施例的描述和所附权利要求中所使用的,除非上下文明确另外指出,否则单数形式“一个”(“a”、“an”和“the”)意在还包括复数形式。还将要理解的是,如这里所使用的术语“和/或”指代并涵盖一个或多个相关联列举项的任意且所有的可能组合。将要进一步理解的是,当在该说明书中使用时,术语“包括”和/或“包含”指定存在所提到的特征、完整物、步骤、操作、元件和/或组件,但是不排除存在或增加一个或多个其它特征、完整物、步骤、操作、元件、组件和/或其群组。如这里所使用的,根据上下文,术语“如果”可以被理解为表示“当…时”或“一旦”或“响应于确定”或“依据确定”或“响应于检测到”所提到的先决条件为真。类似地,根据上下文,短语“如果确定(所提到的先决条件为真)”或者“如果(所提到的先决条件为真)”或者“当(所提到的先决条件为真)时”可以被理解为表示“一旦确定”或者“响应于确定”或者“依据确定”或者“一旦检测到”或者“响应于检测到”所提到的先决条件为真。这里所描述的实施例提供了用于确认文档的作者身份的技术。图1是图示根据一些实施例的网络系统100的框图。网络系统100包括经由网络120耦合至内容服务器系统104、106和108的服务器系统102。网络120通常可以包括能够将计算节点耦合在 一起的任意类型的有线或无线通信信道。这包括但不限于局域网、广域网或者网络的组合。在一些实施例中,网络120包括互联网。服务器系统102(这里为了便于引用有时被称作服务器102,注意服务器系统102的一些实施例包括多个服务器)被配置为确认托管在内容服务器系统(这里为了便于引用有时被称作服务器)104、106和108上的文档的作者身份,如以下参考图2-9更为详细描述的。在一些实施例中,服务器102包括搜索引擎。在一些实施例中,内容服务器104、106和108包括web服务器,其为可经由网络120进行访问的网站托管文档110、112和114。该网站包括但不限于新闻网站、博客、社交网络网站、学术网站和公司网站。文档110、112和114的至少一个子集包括内容,其中每条内容由相应实体创作。实体被定义为人、人的群组或组织。内容包括但不限于文章、博客条目、图书、音乐、视频、文献、在线讨论论坛上的帖子、社交网络网站上的帖子等等。注意,虽然图1示出了单个服务器(例如,服务器102)和三个内容服务器(例如,内容服务器104、106和108),但是在网络系统100中可以存在任意数量的服务器和内容服务器。例如,服务器102、内容服务器104、内容服务器106和内容服务器108中的每一个可以包括多个分布式服务器。多个分布式服务器可以提供负载平衡和/或可以向其它计算机系统提供低延时访问点。分布式服务器可以位于单个位置(例如,数据中心、建筑物等)内或者可以在地理上跨多个位置(例如,处于各个地理位置的数据中心等)进行分布。还应注意,虽然这里所描述的实施例提到了服务器102、内容服务器104、内容服务器106和内容服务器108,但是实施例可以应用于多个服务器和内容服务器。此外,服务器102、内容服务器104、内容服务器106和内容服务器108中任一个的功能可以在单个服务器(或分布式服务器的集合)内实现。例如,服务器102和内容服务器104可以位于相同服务器(或分布式服务器的相同集合)上。在一些实施例中,链接中包括的预定义作者身份属性被用来确认文档的作者身份。图2是图示根据一些实施例的可用来确认文档的作者身份的作者身份属性的框图200。如图2所示,文档204包括链接206而文档214包括链接216。文档204和214可以是分别来自托管在内容服务器104、106和108上的文档110、112和114中的任意文档。文档204包括在网站202中(即,存储在其处、存储在其上或者可从其进行访问)。网站包括由一个或多个实体创作、拥有或维护的文档的集合。此外,网站可以位于域(例如,www.example, com)、子域(例如,me.example, com)、域或子域内的子目录(例如,www.example, com/me/)、以及域或子域中动态生成的网页的集合(例如,www.example, com/profile ? user_id = 1001)。在一些实施例中,文档214包括在网站202中(即,包括文档204的相同网站)。在一些实施例中,文档214包括在与网站202分开且与其不同的网站中。在一些实施例中,文档214是文档214断定(例如,经由署名等)为文档214的作者或者贡献者的实体的简档页面。在一些实施例中,链接206包括目标属性208和作者身份属性210。目标属性208包括识别链接206所引用的目标文档的信息,或者指定能够访问目标文档的位置的信息。如图2中所示,由目标属性208所引用的目标文档是文档214。在一些实施方式中,目标属性208包括通用资源定位符(URL)。在一些实施方式中,目标属性本文档来自技高网...

【技术保护点】
一种用于确认文档的作者身份的计算机实现的方法,所述方法在具有至少一个处理器以及存储供所述至少一个处理器执行以便执行所述方法的至少一个程序的存储器的服务器上执行,所述方法包括:访问托管在第一域的第一网站上的第一文档,所述第一文档通过链接的链中的至少一个链接而链接到第二文档,所述链接的链中的相应链接包括第一预定作者身份属性,所述第一预定作者身份属性通过与所述相应链接的相应目标文档相关联的相应实体而断定包括所述相应链接的相应文档的作者身份;以及当所述第二文档包括指向所述第一域的所述第一网站的第二链接时,通过与所述第二文档相关联的实体有条件地确认所述第一文档的作者身份,所述第二链接包括第二预定作者身份属性,所述第二预定作者身份属性指示与所述第二文档相关联的实体是在所述第一域的所述第一网站处的内容的作者或者贡献者。

【技术特征摘要】
【国外来华专利技术】2011.09.08 US 61/532,5091.一种用于确认文档的作者身份的计算机实现的方法,所述方法在具有至少一个处理器以及存储供所述至少一个处理器执行以便执行所述方法的至少一个程序的存储器的服务器上执行,所述方法包括: 访问托管在第一域的第一网站上的第一文档,所述第一文档通过链接的链中的至少一个链接而链接到第二文档,所述链接的链中的相应链接包括第一预定作者身份属性,所述第一预定作者身份属性通过与所述相应链接的相应目标文档相关联的相应实体而断定包括所述相应链接的相应文档的作者身份;以及 当所述第二文档包括指向所述第一域的所述第一网站的第二链接时,通过与所述第二文档相关联的实体有条件地确认所述第一文档的作者身份,所述第二链接包括第二预定作者身份属性,所述第二预定作者身份属性指示与所述第二文档相关联的实体是在所述第一域的所述第一网站处的内容的作者或者贡献者。2.根据权利要求1所述的计算机实现的方法,其中,在通过与所述第二文档相关联的所述实体有条件地确认所述第一文档的作者身份之前,包括: 识别所述第一文档中链接到所述第二文档的第一链接,其中所述第一链接包括所述第一预定作者身份属性; 访问所述第二文档;以及 确定所述第二 文档包括所述第二链接,所述第二链接包括所述第二预定作者身份属性。3.根据权利要求2所述的计算机实现的方法,其中,在通过与所述第二文档相关联的所述实体有条件地确认所述第一文档的作者身份之前,包括:以所述第一文档开始,遍历所述链接的链中的链接直至识别出包括包含所述第二预定作者身份属性的所述第二连接的所述第二文档。4.根据权利要求1-3中任一项所述的计算机实现的方法,包括在无法找到具有包括所述第二预定作者身份属性的所述第二链接的第二文档时,确定所述第一文档具有非确认的作者身份。5.根据权利要求1-4中任一项所述的计算机实现的方法,其中所述第二文档包括与所述实体相关联的信任文档。6.根据权利要求1-5中任一项所述的计算机实现的方法,其中所述第二文档包括所述实体的简档。7.根据权利要求1-6中任一项所述的计算机实现的方法,其中所述第二链接链接至所述第一域的所述第一网站的根。8.根据权利要求1-7中任一项所述的计算机实现的方法,其中所述第二文档托管在不同于所述第一域的第二域上。9.根据权利要求1-7中任一项所述的计算机实现的方法,其中所述第二文档托管在所述第一域上。10.根据权利要求1-9中任一项所述的计算机实现的方法,进一步包括响应于通过所述实体而确认所述第一文档的作者身份,将所述第一文档添加至所述实体的简档。11.根据权利要求1-10中任一项所述的计算机实现的方法,进一步包括响应于通过所述实体确认所述第一文档的作者身份,将所述第一文档添加至所述实体的社交网络网页。12.根据权利要求1-11中任一项所述的计算机实现的方法,进一步包括响应于通过所述实体确认所述第一文档的作者身份,将与所述第一文档相关的信息添加到包括与所述实体所创作的文档相关的信息的网页。13.根据权利要求1-12中任一项所述的计算机实现的方法,进一步包括响应于通过所述实体确认所述第一文档的作者身份,在搜索索引中将所述第一文档与所述实体相关联。14.一种用于确认文档的作者身份的系统,包括: 至少一个处理器; 存储器;以及 存储在所述存储器中并且能由所述至少一个处理器执行的至少一个程序,所述至少一个程序包括用于以下的指令: 访问托管在第一域的第一网站上的第一文档,所述第一文档通过链接的链中的至少一个链接而链接到第二文档,所述链接的链中的相应链接包括第一预定作者身份属性,所述第一预定作者身份属性通过与所述相应链接的相应目标文档相关联的相应实体而断定包括所述相应链接的相应文档的作者身份;以及 当所述第二文档包括指向所述第一域的所述第一网站的第二链接时,通过与所述第二文档相关联的实体有条件地确认所述第一文档的作者身份,所述第二链接包括第二预定作者身份属性,所述第二预定作者身份属性指示与所述第二文档相关联的实体是在所述第一域的所述第一网站处的内容的作者或者贡献者。15.根据权利要求14所述的系统,其中,在通过与所述第二文档相关联的所述实体有条件地确认所述第一文档的作者身份之前,所述至少一个程序包括用于以下的指令: 识别所述第一文档中链接到所述第二文档的第一链接,其中所述第一链接包括所述第一预定作者身份属性; 访问所述第二文档;以及 确定所述第二文档包括所述第二链接,所述第二链接包括所述第二预定作者身份属性。16.根据权利要求15所述的系统,其中,在通过与所述第二文档相关联的所述实体有条件地确认所述第一文档的作者身份之前,所述至少一个程序包括用于以下的指令:以所述第一文档开始,遍历所述链接的链中的链接直至识别出包括包含所述第二预定作者身份属性的所述第二连接的所述第二文档。17.根据权利要求14-16中任一项所述的系统,包括用于以下的指令:在无法找到具有包括所述第二预定作者身份属性的所述第二链接的第二文档时,确定所述第一文档具有非确认的作者身份。18.根据权利要求14-17中任一项所述的系统,其中所述...

【专利技术属性】
技术研发人员:奥塔尔·汉松农杜·亚纳基拉姆罗伯特·恩纳尔斯乔纳森·汤龚骏洪文惠
申请(专利权)人:谷歌公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1