当前位置: 首页 > 专利查询>雅虎公司专利>正文

结合万维网搜索技术和万维网内容的被赞助搜索条目的匹配和排名制造技术

技术编号:4882051 阅读:227 留言:0更新日期:2012-04-11 18:40
公开了一种用于使用计算机网络,响应于来自搜索者的搜索请求,生成搜索结果列表的系统。包括第一多个搜索条目的第一数据库被维护。包括具有一般web内容的文档的第二数据库被维护。搜索请求从搜索者被接收。从第一数据库中识别第一组搜索条目,并且从第二数据库中识别第二组搜索条目,第一组搜索条目具有产生与搜索请求匹配的文档,第二组搜索条目具有产生与搜索请求匹配的文档。为来自第一组搜索条目的每个条目确定信心分数,其中信心分数是根据每个条目当与第二组搜索条目的条目相比较时的相关性而确定的。至少部分地根据每个搜索条目的信心分数,对从第一组搜索条目的识别出的搜索条目排序。

【技术实现步骤摘要】
【国外来华专利技术】结合万维网搜索技术和万维网内容的被赞助搜索条目的匹配和排名 相关申请本申请要求享受2005年1月18日递交的美国临时申请No. 60/645,054 的优先权,该申请的全部内容通过引用结合于此。本专利申请文件的公开内容的一部分包含受版权保护的资料。由于Jl: 出现在专利商标局专利文件或记录中,版权所有人不反对任何人对专利文 件或专利公开的复印,但是不管怎样,在其他情况中,保留所有的版权权 利。賴粉在计算机网络上传递信息是机构、公司和个人进行商务的宽耍方式。 多年来,计算机网络已经从被建立来满足单个团体的需要的独立、隔绝的 实体,发展为将不同的物理网络互联起来并允许它们作为协同的系统来工 作的众多的互联网。目前,最大的计算机网络是因特网,其是使用公共协 议进行通信的计算机网络的世界性互联。在很大程度上由于引入万维网(World Wide Web, web)这一信 息系统带来的驱动,因特网已经转变为货物和服务的全球性市场。连接到 因特网的计算机可以通过具有强大但易学的图形用户界面的浏览器程序, 来访问web页面。在因特网搜索引擎上的基于web的搜索中,用户输入-个或多个关键词的搜索项,搜索引擎然后使用该搜索项来生成用户通过超 链接可以访问的web页面的条目。因特网的搜索引擎功能应当针对促进这样的在线市场,其对搜索者提 供快速、容易和相关的搜索结果,同时对因特网网络信息提供者提供定位 客户的成本有效的方式。使用促进了这种在线市场的搜索引擎的客户找到6了提供搜索者正寻求的产品、服务或信息的公司或交易。在在线市场中, 提供产品、服务或信息的公司可以针对在由因特网搜索引擎生成的搜索结 果列表上的竞拍,在基于公开竞拍的排名环境中竞价。某些基于竞拍的搜索引擎的运营者可能正失去潜在的收益,例如对某 些搜索项不能显示足够多的受到赞助的结果。另外,可能出现不相关的结 果和/或结果的低有效收益。某些运营者可能不能有力地控制相关性和结果 的覆盖范围之间的平衡。类似的,商业互联网的搜索查询可能不满足用户 的需要。如果被赞助结果仅仅是基于用户的搜索项中的某些项而示出的, 则可能示出了不相关的结果。此外,当利用某些基于拍卖的搜索引擎时,广告者可能经受低的流量。广告者可能承担生成与他们的web页面相对应 的被竞价的项的负担,以试图将到他们的站点的相关搜索流量最大化。可 能发生丢失向特定査询提供高质量匹配的机会。类似的,由于该结果被发 现为是不相关的,许多用户可能访问广告者的站点而不购买任何东西。这 样,广告者可能要对来自购买物品的可能性很低的用户的点进进行付^。
技术实现思路
一种系统使用计算机网络,响应于来自搜索者的搜索请求,生成搜索 结果列表。可以维护包括第一多个搜索条目的第一数据库,其屮毎个搜'^ 条目可以与一个或多个搜索项相关联。可以维护包括具有--般web内容的 文档的第二数据库。搜索请求从搜索者被接收。从第一数据库中识别第一-组搜索条目,并且从第二数据库中识别第二组搜索条目,第一组搜索条B 具有产生与搜索请求的匹配的文档,第二组搜索条目具有产生与搜索请求 的匹配的文档。为来自第一组搜索条目的每个条目确定信心分数,其中信 心分数是根据每个条目当与第二组搜索条目的条目相比较时的相关性而确 定的。至少部分地根据每个搜索条目的信心分数,对来自第一组搜索条自 的识别出的搜索条目进行排序。在研究了附图和说明书之后,本专利技术的其他系统、方法、特征和优点 对于本领域的技术人员来说,将会是或者将变得明显。所有这样的另外的 系统、方法、特征和优点应被包括在本说明书中,被包括在本专利技术的范围内,并由所附权利要求所保护。 附图说明参考附图和下面的说明,可以更好地理解本专利技术。附图中的组成部分 未必是按比例的,而是强调示出本专利技术的原理。此外,在附图中,在不同 的图形中类似的参考标号指示相应的部分。图1示出了针对搜索査询提供结果的系统。图2示出了用于管理査询和数据库内容的系统。 图3是示例性搜索流水线的框图。图4是示出了用于呈现来自多种服务器的条目的条目组合集合的休系 结构的框图。图5示出了可以被返回给用户的web页面的示例性屏幕截图。 图6是示出了使用系统将查询项和被赞助条目匹配到任意web页面的 框图。贼鄉讨系统可以组合对被广告者赞助的条目、广告者web站点内容、万维网 内容、查询倾向和/或用户行为统计,以提供相关的匹配者,例如被赞助的 匹配者,以及相关联的査询的属性和结果。如这里所用的,相关项包括包 括为搜索提供者带来收益的结果、深度的或者广范围的结果、和/或与搜索 者有关的结果。系统可以组合地分析由一个或多个服务器提供的搜索査询 结果。可以根据分别的、不同的搜索查询的结果,来确定来自第一搜索杏 询的结果的相关性或质量。图1示出了针对搜索査询提供结果的系统100。诸如用户110之类的 搜索者使用访问前端服务器120 (例如YAHOO或OVERTURE)的web 浏览器,提交搜索查询。査询可以包括一个或多个项。前端服务器120可 以将搜索查询发送给第一后端服务器130,例如被赞助条目服务器或者其 他类型的服务器。被赞助条目服务器可以为搜索查询提供结果,这些结果 包括为了被包括在结果中而付费了的广告者。第一服务器130可以访问被赞助条目匹配引擎140。被赞助条目服务器130可以与IDP代理150连 接,以处理输入的搜索査询。IDP代理150可以与诸如被赞助条目搜索集 群160和免费web爬取(crawl)搜索集群170之类的不同的搜索集群连 接。图2示出了用于管理査询和数据库内容的系统。被赞助条目服务器 130可以利用来自被赞助条目搜索集群160和免费web爬取搜索集群170 的结果。被赞助条目搜索集群160可以从被赞助条目数据库200获得条 目。当被赞助条目服务器130是由与免费web爬取搜索集群170不同的实 体运营的时候,可以使用被赞助条目数据库200。被赞助条目服务器130 和免费web爬取搜索集群170的运营者也可以是同一实体。为了从被赞助条目数据库200获得条目,系统100可以执行上下文标 引(context indexing)。上下文标引可以包括捕获被赞助条目数据库200 的快照,以确定在前匹配的合格条目。合格的条目包括这样的条问其广 告者已经同意让他们的条目使用系统100的算法被显示。来自条目数据库 的信息可以例如通过被赞助条目更新服务器220,被传输到被赞助条l l爬 取集群210。被赞助条目编组器(marshaler) 230可以被用于创建内容的标 引。IDPD标签程序(IDPD Tag Daemon) 240可以被用于例如基于诸如去 除垃圾条目、到无用的条目的链接和具有低点进率的链接之类的编辑考 虑,标记被标引的页面。IDPD标记代理240可以从编辑数据库250获符 编辑内容。可以利用相关的注释、爬取的内容、例如与入站(inbound)链 接相关联的文本的到目标页面的锚(anchor)文本、或者算法生成的总结 或关键字,来标引条目。为了获得用于免费web爬取搜索集群170的文档,经由免费web爬取 集群260和免费web爬取编组器270,从web 250收集文档。可以从编辑 数据库250为免费web爬取编组器280处的文档提本文档来自技高网
...

【技术保护点】
一种使用计算机网络,响应于来自搜索者的搜索请求,生成搜索结果列表的方法,包括: 维护包括第一多个搜索条目的第一数据库; 维护包括具有一般web内容的文档的第二数据库; 从所述搜索者接收搜索请求; 从所述第一数据库中识 别第一组搜索条目,并且从所述第二数据库中识别第二组搜索条目,所述第一组搜索条目具有产生与所述搜索请求的匹配的文档,所述第二组搜索条目具有产生与所述搜索请求的匹配的文档; 为来自所述第一组搜索条目的每个条目确定信心分数,其中所述信心分数 是根据每个条目当与所述第二组搜索条目的条目相比较时的相关性而确定的;以及 至少部分地根据所述每个搜索条目的信心分数,对来自所述第一组搜索条目的识别出的搜索条目进行排序。

【技术特征摘要】
【国外来华专利技术】US 2005-1-18 60/645,0541.一种使用计算机网络,响应于来自搜索者的搜索请求,生成搜索结果列表的方法,包括维护包括第一多个搜索条目的第一数据库;维护包括具有一般web内容的文档的第二数据库;从所述搜索者接收搜索请求;从所述第一数据库中识别第一组搜索条目,并且从所述第二数据库中识别第二组搜索条目,所述第一组搜索条目具有产生与所述搜索请求的匹配的文档,所述第二组搜索条目具有产生与所述搜索请求的匹配的文档;为来自所述第一组搜索条目的每个条目确定信心分数,其中所述信心分数是根据每个条目当与所述第二组搜索条目的条目相比较时的相关性而确定的;以及至少部分地根据所述每个搜索条目的信心分数,对来自所述第一组搜索条目的识别出的搜索条目进行排序。2. 根据权利要求1所述的方法,其中,每个搜索条目与一个或多个投 索项相关联。3. 根据权利要求2所述的方法,其中,所述与至少一个搜索条目相关 联的一个或多个搜索项中的至少一个是基于位于与所述至少一个投索条目 相关联的第一地址处的信息而自动生成的。4. 根据权利要求1所述的方法,还包括 在识别所述第一组之前,修改所述查询。5. 根据权利要求1所述的方法,其中,来自所述第一组搜索条目的每个条目与第一组属性相关联,所 述第一组属性中的每个属性与一个属性权重相关联,并且其中,所述信心分数是通过利用所述相关联的属性权重,对针对毎个 条目的至少一个属性进行加权而确定的。6. 根据权利要求5所述的方法,其中,所述搜索者与地理区域相关联,并且其中,所述信心分数是通过利用与所述地理区域相关联的第二组属性 权重,对针对每个条目的至少一个属性进行加权而确定的。7. 根据权利要求1所述的方法,其中,所述识别出的搜索条目还根据 否定关键词的列表被排序。8. 根据权利要求1所述的方法,其中,所述识别出的搜索条目与至少一个特征相关联,并且 其中,所述识别出的搜索条目还根据所述至少一个特征被排序。9. 根据权利要求1所述的方法,其中,所述信心分数是使用机器学习 方法确定的。10. —种用于使用计算机网络,响应于来自搜索者的搜索请求,生成 搜索结果列表的服务器,包括用于存储数据和指令的存储器;和与所述存储器通信的处理器,所述处理器用于基于所述被存储的指令来使能进行动作,所述被存储的指令包括用于以下内容的指令 与第一数据库通信,所述第一数据库包括第一多个搜索条目; 与第二数据库通信,所述第二数据库包括具有一般web内容的文档; 从所述搜索者接收搜索请求;从所述第一数据库中识别第一组搜索条目,并且从所述第二数据库屮 识别第二组搜索条目,所述第一组搜索条目具有产生与所述搜索请求的匹 配的文档,所述第二组搜索条目具有产生与所述搜索请求的匹配的文档;为来自所述第一组搜索条目的每个条目确定信心分数,其中所述信心 分数是根据每个条目当与所述第二组搜索条目的条目相比较时的相关性而 确定的;以及至少部分地根据所述每个搜索条目的信心分数,对来自所述第组搜 索条目的识别出的搜索条目进行排序。11. 根据权利要求IO所述的服...

【专利技术属性】
技术研发人员:查尔斯C小卡森德韦卡查瓦拉詹姆斯B哈维玛特维内蒙曼莫伊特萨哈瓦尔马可J扎卡
申请(专利权)人:雅虎公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1