使用语义密钥的改良搜索制造技术

技术编号:7978438 阅读:145 留言:0更新日期:2012-11-16 05:33
本发明专利技术公开一种用于执行搜索的方法、计算机可读介质和计算机系统。本发明专利技术的实施例提供用于基于搜索数据执行搜索的方便且有效的机制,其中搜索数据可以包括搜索查询和至少一个语义密钥。所述语义密钥可以用于确定至少一个文档。可以使用所述至少一个文档来过滤搜索结果。以这种方式,可以返回更多的相关搜索结果。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及一种使用语义密钥的改良搜索
技术介绍
传统的搜索引擎通常使用来自用户输入搜索查询的关键字以定位并显示网页。例如,如果用户对了解哪些国家与美国接壤感兴趣,那么用户可以输入搜索查询“与美利坚合众国接壤的国家”。作为响应,传统的搜索引擎可能返回带有“国家”、“接壤”、“美利坚”和“合众国”这四个词中的全部或部分的网页。然而,此类查询很可能返回大量(例如,数以千万的)不相关或不想要的网页。例如,结果可能含有关于美国乡村音乐(注“国家”的英文单词也有“乡村”的含义)、关于美国的总体信息等的网页。因而,用户一般执行过度限制性搜索以将结果的数量限制在更易于管理的数量之内,由此从结果中排除许多相关的网页。因此,使用传统的基于关键字的搜索引擎在互联网上找到相关信息是一项冗长且费时的任务。另外,通过传统的搜索引擎返回的相关结果的数量还受传统的关键字搜索方法的字面性质的限制。例如,网页可能使用与在搜索查询中输入的关键字相关的同义词或其它字词,但是不使用一个或更多个确切的关键字。在这种情况下,传统的基于关键字的搜索引擎可能不会返回这些网页,尤其在使用更具限制性的搜索(例如,在搜索查询的关键字之间使用“and” ( “与”)运算符等等)的情况下更为如此。因此,在考虑到传统的关键字搜索的字面性质的情况下,使用传统的搜索引擎搜索相关信息变得更加繁琐。此外,一些传统的搜索引擎基于每个网页与输入的关键字的相关性对识别结果执行排名。尽管这可能重新组织识别结果,但是其不能解决不相关结果的上述问题和与传统的基于关键字的搜索引擎的字面性质相关的其它问题。专利技术概要相应地,对搜索引擎和搜索方法有一种返回更多相关结果的需要。对搜索引擎和搜索方法还有另一种需要,即需要能够执行更宽范围的搜索,同时减少不相关结果的数量。另外,还需要搜索引擎以不那么冗长且费时的方式返回相关结果。本专利技术的实施例提供对 这些需要和如下文所述的其它需要的新颖解决方案。本专利技术的实施例针对一种用于执行搜索的方法、计算机可读介质和计算机系统。更具体而言,本专利技术的实施例提供一种用于基于搜索数据(例如,用户经由用户接口的输入)执行搜索的方便且有效的机制,其中搜索数据可以包括搜索查询(例如,用于执行搜索)和至少一个语义密钥。语义密钥可以用于确定至少一个文档(例如,通过为语义密钥数据库编索引,所述语义密钥数据库包括对应于每个语义密钥和/或每个语义子密钥的至少一个相应的文档)。可以使用至少一个文档(例如,通过从搜索结果中删除不与该文档相关联的文档)来过滤搜索结果(例如,包括诸如网页、电子文档或文件、广告内容等的文档)。以这种方式,可以返回更多的相关搜索结果。在一个实施例中,一种由计算机实现的用于执行搜索的方法包括访问包含语义密钥和搜索查询的搜索数据,其中搜索数据源自于经由用户接口的用户输入。确定与语义密钥相关联的至少一个文档。可以基于搜索查询来执行搜索以产生搜索结果。在另一实施例中,一种计算机可读介质可以具有计算机可读程序代码,该代码实现于计算机可读介质中,用于使计算机系统执行用于执行搜索的方法。且在又一实施例中,一种系统可以包括处理器和存储器,其中存储器包括在由系统执行时实现用于执行搜索的方法的指令。附图简述在附图中通过示例的方式而不是通过限制的方式来说明本专利技术,且其中相同的参考编号指相似的元件。图I示出根据本专利技术的一个实施例的用于实现搜索引擎的示例性系统。图2示出根据本专利技术的一个实施例的由计算机实现的用于执行网页搜索的过程的示例性流程图。图3示出根据本专利技术的一个实施例的网页搜索执行的示例性数据流图。图4示出根据本专利技术的一个实施例的由计算机实现的用于基于搜索查询的焦点确定语义密钥的过程的示例性流程图。图5示出根据本专利技术的一个实施例的语义子密钥的示例性组织。图6示出根据本专利技术的一个实施例的与数值表达式相关联的语义子密钥的示例性组织。图7A示出根据本专利技术的一个实施例的由计算机实现的用于过滤网页搜索结果的过程的示例性流程图。图7B示出根据本专利技术的一个实施例的用于描绘网页搜索过滤机制的示例性方框图。图8A示出根据本专利技术的一个实施例的由计算机实现的用于使用从关键字搜索结果产生的文本过滤网页搜索结果的过程的示例性流程图。图SB示出根据本专利技术的一个实施例的用于描绘使用从关键字搜索结果产生的文本的网页搜索过滤机制的示例性方框图。图9示出根据本专利技术的一个实施例的由计算机实现的用于根据语义子密钥频率对网页搜索结果进行排名的过程的示例性流程图。 附图说明图10示出根据本专利技术的一个实施例的由计算机实现的用于根据关键字频率对网页搜索结果进行排名的过程的示例性流程图。图11示出根据本专利技术的一个实施例的由计算机实现的用于根据语义子密钥与搜索查询关键字的接近性对网页搜索结果进行排名的过程的示例性流程图。图12示出根据本专利技术的一个实施例的可以用于确定网页的两个部分之间的接近性的网页内容的示例性文字顺序排序。图13示出根据本专利技术的一个实施例的用于执行网页搜索的示例性屏幕上的图形用户接口。图14示出根据本专利技术的一个实施例的用于执行网页搜索的示例性屏幕上的图形用户接口以及显示的搜索结果。图15示出根据本专利技术的一个实施例的执行搜索的示例性数据流图。图16示出根据本专利技术的一个实施例的由计算机实现的用于建立语义密钥数据库的过程的示例性流程图。图17示出根据本专利技术的一个实施例的语义密钥和语义子密钥的示例性表。图18示出根据本专利技术的一个实施例的示例性倒排索引。图19示出根据本专利技术的一个实施例的示例性语义密钥数据库。图20示出根据本专利技术的一个实施例的由计算机实现的用于执行搜索的过程的示例性流程图。图21示出根据本专利技术的一个实施例的用于执行搜索的示例性用户接口。图22示出根据本专利技术的一个实施例的使用搜索数据处理器执行搜索的示例性数据流图。图23示出根据本专利技术的一个实施例的由计算机实现的用于修改搜索查询以进一步包括至少一个语义子密钥的过程的示例性流程图。图24示出根据本专利技术的一个实施例的包括至少一个属性的示例性语义密钥数据库。图25示出根据本专利技术的一个实施例的由计算机实现的用于修改搜索查询以进一步包括语义密钥或语义密钥的一部分的过程的示例性流程图。图26A示出根据本专利技术的一个实施例的用于描绘语义关键字的自动完成或建议的示例性屏幕上的图形用户接口的第一视图。图26B示出根据本专利技术的一个实施例的用于描绘语义关键字的自动完成或建议的示例性屏幕上的图形用户接口的第二视图。图27示出根据本专利技术的一个实施例的用于呈现搜索结果的示例性屏幕上的图形用户接口。图28示出根据本专利技术的一个实施例的由计算机实现的用于基于改变的搜索查询执行搜索的过程的示例性流程图。图29示出根据本专利技术的一个实施例的用于使用修改的搜索查询执行搜索的示例性数据流图。图30示出可以实现本专利技术的实施例的示例性计算机系统平台。 具体实施例方式现在详细参考本专利技术的实施例,其示例在附图中示出。尽管将结合以下实施例论述本专利技术,但是应理解其目的不是将本专利技术仅限于这些实施例。相反,本专利技术旨在涵盖可以包括在由附带的权利要求书定义的本专利技术的精神和保护范围内的替代、修改和等效物。此夕卜,在本专利技术的以下详细描述中,陈述了众多的特定细节以便提供对本专利技术的透彻理解。然而,可以在不具有这些本文档来自技高网...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:乔鸿亮
申请(专利权)人:莱克西私人有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1