改变文档和/或搜索查询的相关性的方法和系统技术方案

技术编号:12570707 阅读:56 留言:0更新日期:2015-12-23 12:43
为通过增加(例如,与文档关联的索引)一个或多个术语关系(可以导致,例如,增加一个或多个非明显术语)以改变文档相关性提供多种实施例。为通过基于一个或多个确定的术语关系向搜索查询增加一个或多个术语以改变搜索查询相关性(在一个例子中,增加的术语可以是一个或多个非明显术语),提供其它实施例。

【技术实现步骤摘要】
【国外来华专利技术】【专利说明】
技术介绍
本专利技术一般涉及通过附加(例如,向文档相关的索引)一个或多个术语(term)关系(其可以导致,例如,附加一个或多个非明显的术语)改变文档相关性(relevancy)。本专利技术也一般涉及基于一个或多个确定的术语关系(在一个例子中,附加的术语可以是一个或多个非明显术语),通过附加一个或多个术语到搜索查询改变搜索查询相关性的领域。在各类例子中,改变文档和/或搜索查询的相关性可以系统、方法和/或算法的方式实现。在传统网络搜索引擎中文档是连续识别和索引的。图1示出了三种假设性文档的一个例子(在该例子中,网页A(以附图标记101识别),网页B(以附图标记103识别)和文本文档A(以附图标记105识别))由网络引擎(未示出)维持的对应的索引107也被示出。如该例子所示,网页A包括三个不同的术语:术语1,术语2和术语3。进一步地,在本例中,网页B包括四个不同术语:术语4,术语5,术语6,术语7。更进一步地,在本例中,索引107对每个文档各自识别关联术语。每个术语可以是单个词或多个词。操作中,当用户使用传统互联网搜索引擎执行搜索,用户将输入一个或多个术语作为关键词。关键词将与索引的内容进行比较,基于关键词和索引术语的任何匹配,对应文档将作为搜索结果发送给用户(该文档可以被返回,例如,以链接的形式)。给出一个具体例子,如果用户输入“术语4”和“术语9”作为两个关键词,然后网页B和文本文档A可能作为搜索结果返回。在传统互联网搜索引擎的一个具体例子中,当用户执行搜索,搜索引擎检查用户的搜索历史和用户的朋友的搜索历史并给用户结果,例如,基于用户以前所看的,基于用户的朋友与用户的结果相似的结果,和基于用户的朋友在社交网络网站已分享的内容和类似内容。在这方面,搜索引擎结果据信是仅基于与在用户的社交网络中的人们所分享的内容匹配的链接。
技术实现思路
在各种实施例中,提供通过使用一个或多个术语关系自动改变文档和/或搜索查询的相关性的方法。在一个实施例中,提供一种与具有多个社交网络合作方(partners)的社交网络相关联使用的术语关系识别方法,该方法包括:由处理器在第一文档中识别至少一个术语,该第一文档已由所述多个社交网络合作方中的一个生成;由处理器确定所述第一文档和至少一第二文档之间的关联,该第二文档已由所述多个社交网络合作方中的一个生成;以及由所述处理器基于所确定的所述第一文档与第二文档的关联,改善搜索结果,其中在第一文档中所识别的术语用于在搜索结果中包含所述第二文档。在另一个实施例中,提供一种计算机可读存储介质,有形地实现可由计算机运行的程序指令,用于识别与具有多个社交网络合作方的社交网络相关联的的术语关系,该程序指令,当运行时,执行下述步骤:在第一文档中识别至少一个术语,该第一文档已由所述多个社交网络合作方中的一个生成;确定所述第一文档和至少一第二文档之间的关联,该第二文档已由所述多个社交网络合作方中的一个生成;以及基于所确定的所述第一文档与第二文档的关联,改善搜索结果,其中在第一文档中所识别的术语用于在搜索结果中包含所述第二文档。在另一个实施例中,提供一种识别与具有多个社交网络合作方的社交网络相关联使用的术语关系的系统,该系统包括:识别部件,被配置用于在第一文档中识别至少一个术语,该第一文档已由所述多个社交网络合作方中的一个生成;确定部件,被配置用于确定所述第一文档和至少一第二文档之间的关联,该第二文档已由所述多个社交网络合作方中的一个生成;以及改善部件,被配置用于基于所确定的所述第一文档与第二文档的关联,改善搜索结果,其中在第一文档中所识别的术语用于在搜索结果中包含所述第二文档。【附图说明】本专利技术的多种专利技术目的、特点以及优点,通过参考下面的详细描述同时结合附图,将对本领域技术人员变得明显,其中:图1描述了与互联网搜索相关的传统术语索引相关图;图2描述了根据本专利技术实施例的流程框图;图3描述了根据本专利技术实施例的系统框图;图4描述了根据本专利技术实施例的系统框图。【具体实施方式】在一个例子中,提供一个或多个系统、方法和/或算法,其自动改变文档和/或搜索查询相关性。为了描述和保护本专利技术,术语“社交网络”是指根据介于两人和/或多人之间的一个或多个关系的一组人。在一个例子中,社交网络可以包括多个成员和可以通过计算机系统组织和维护。为了描述和保护本专利技术,术语“社交网络合作方”是指在社交网络中的两个或多个人,其以一些方式相关。在各种例子中,这样的关系可以是家庭、朋友、同事、同伙、朋友的朋友、校友和/或其它合适的特点或特征。为了描述和保护本专利技术,术语“结果”或“搜索结果”是指由电子搜索确定的文档,其中搜索基于包括为该搜索的一个或多个关键词输入的查询。在各种例子中,这样确定的文档可以包括网页(例如,超文本标记语言(HTML)网页)、维基页、博客发布(例如,微博发布)、字处理或文本文档、可移植文档格式(TOF)文档、图形或组合图形和文本演示文稿文档、或电子表格或其他表格文档。为了描述和保护本专利技术,术语“结果集”是指包括一个或多个结果的集合。为了描述和保护本专利技术,术语“搜索结果集”是指包括一个或多个搜索结果的集入口 ο为了描述和保护本专利技术,术语“搜索短语”是指一个或多个关键词或一个或多个术语集。为了描述和保护本专利技术,术语“关联性”(比如用在上下文“一个文档与另外的关联性”)是指明示或暗示的关系。例子包括(但不限于):基于上下文第一单词与第二单词有联系;搜索查询导致的给定搜索结果的用户的选择。当执行一电子搜索时,用户将典型地输入一个或多个关键字并且基于输入的关键字的相关性返回结果。由于语言对于相同或者相近的概念通常有多个不同词/术语,通常在传统搜索中潜在的结果没有返回(但该结果可能相关),因为其没有包括用户搜索用的关键词。多个实例采用术语关系解决该问题。进一步地,在多个例子中,如果给定搜索结果在实质上证明对一个或多个用户有用,这些用户已经表明他们使用的这些关键词应该被考虑与有问题的结果相关。现在根据实施例参考一个例子。在该例子中,3个人像如下执行搜索:用户I使用术语“x,y,z”搜索;用户2使用术语“x,a,b”搜索;用户3使用术语“X z q”搜索。文档“M”作为结果#12返回给用户1,作为结果#42返回给用户2,作为结果#3返回给用户3。这些用户(用户1、用户2、用户3)已发现文档“M”有用(比如确定,作为例子,通过点击如此每个用户点击了结果链接并且没有很快回到结果列表)。而且X是文档“M”中的术语但q,b和z不是术语,然而,由于用户(用户1、用户2、用户3)发现文档“M”实质有用,他们已经表明了这些术语:“q,b,和z”应当被加入到文档“M”中(即,文档“M”的索引),即使这些术语没有在文档“M”中。除了这个“众包(crowd source) ”的概念,如所描述的多种实施例可有助于利用一个人的社交网络。当以上用户I执行他的搜索,搜索算法可以利用用户I的社交网络来向使用的术语指派含义。在用户I是信息技术文化中的一员当前第1页1 2 3 4 本文档来自技高网
...

【技术保护点】
一种与具有多个社交网络合作方的社交网络相关联使用的术语关系识别方法,该方法包括:由处理器在第一文档中识别至少一个术语,该第一文档已由所述多个社交网络合作方中的一个生成;由处理器确定所述第一文档和至少一第二文档之间的关联,该第二文档已由所述多个社交网络合作方中的一个生成;以及由所述处理器基于所确定的所述第一文档与第二文档的关联,改善搜索结果,其中在第一文档中所识别的术语用于在搜索结果中包含所述第二文档。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:M·巴纳瓦拉D·A·布鲁克斯J·A·鲁索
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1