搜索引擎方法及装置制造方法及图纸

技术编号:2850424 阅读:165 留言:0更新日期:2012-04-11 18:40
一种用于搜索数据库(12)以产生提炼结果空间(34)的交互方法,该方法包括:为搜索标准进行分析(22),采用所述搜索标准(22)来搜索所述数据库(12),以便得到初始结果空间(34),以及获得用户输入(20)以限定所述初始结果空间(34),从而得到所述提炼结果空间(34)。提炼包括采用所检索数据条目的分类来制订对用户的提示(32),向所述用户询问制订的提示(32)中的至少一个并接收其响应;以及与分类值结合采用响应来排除结果的一部分,从而向用户提供所检索数据条目的子集作为查询结果(34)。

【技术实现步骤摘要】
【国外来华专利技术】
及背景本专利技术涉及搜索引擎,更具体、但非排他地涉及与包括连网数据库在内的数据库和信息存储器结合使用的搜索引擎。信息检索(IR)系统以及与其关联的搜索引擎(SE)自六十年代初期已经开始研究和开发。但是,随着因特网和内联网世界的出现以及通过这些途径可得到的巨大数量的信息和服务,它们所起的作用、它们的重要性以及它们对计算机化信息系统的有效性的重要影响显著增加。搜索引擎如何在因特网上使用的典型实例包括以下方面-研究者采用诸如Google、AltaVista、Lycos等常见SE搜索在因特网上某个位置估计可获得的关于非常具体的主题、例如太阳能或英国民歌的信息。-消费者希望通过诸如Yahoo之类的电子经销商的门户站点或者通过特定经销商网站购买诸如衬衣、数字照相机或书籍之类的具体产品。消费者依靠门户站点或网站SE准确查找所请求的产品。-大企业中的雇员寻找大企业文本仓库中的特定数据,依靠企业特定的搜索引擎,立刻为他带来正是他所想的内容。-显然,这些完全不同的需求由于各种程度的用户复杂性而混合。另一方面,寻找预期信息时的用户坚持以及对接收不完整或错误结果的反应只能猜测。可是,很有可能在上述实例中,由于当今SE固有的不足,用户往往变得很丧气并最终对信息检索能力产生否定态度,甚至可能完全停止使用信息检索,随之而产生的缺少使用可能间接造成数据库的衰退或萎缩,使它不再值得进行维护。作为它们支持上述成功操作的关键,当前大部分可用SE遭遇到精确度或准确度、覆盖率和焦点的尖锐问题,这些问题严重妨碍它们的性能以及设计它们支持的操作的充分起作用。搜索一般把输入查询当作关键字列表来处理,并搜索与关键字列表的最佳匹配,而没有明显地考虑预期意义或者意义之间的关系。因此,众所周知的搜索引擎将识别诸如“San Francisco”和“New York”之类的某些众所周知的单词对应当作为单个检索词来处理的能力视为其最先进功能之一。在IR系统的数据库或数据存储器或者信息库(IS)组件中表示的、作为搜索的可能对象的条目往往采取自由文本文档的形式。文档可能很短(只有一行,如电子经销商网站中的产品名称)、中等长度(几行,如新闻简讯中)或者相当长(数页,如财经报导、科学论文或百科全书条目中)。仍然要突出强调的是,文本媒体虽然无疑是当今最常见的,但绝不是数据库条目的唯一适用媒体。IS可由作为图片、视频、声音剪辑、电子转录乐谱或者包含信息的其它任何资源的条目组成。查询则可包括描述所需图片(颜色、形状等)或声音、短音乐或节奏模式等的部分或特征。作为所述具体实施例的背景,在电子商务领域、以下称作电子商务上下文(ECC)中提供一些解说。在当前上下文中,IS是产品名称、图片以及描述的巨大存储库,查询是用户以描述(可能不完全地)其需求的文本字符串形式提交的请求。选取EC上下文的原因有三个a)电子商务以指数增长,并显示巨大潜力,b)根据用户不会购买无法找到的物品,优秀的SE是成功操作必不可少的。特别是,如果用户只能找到接近他所想的内容,则他在这时不太可能进行购买,并且对于将来的购买也不太可能尝试电子商务,以及c)可用的SE未能满足为了允许根据不熟练的典型用户输入来准确查找所需产品所需要的功能。以下引述其中还支持上述观察a)关于电子零售领域的潜力-“到2002年底,全球有超过6亿人将访问万维网,并且他们将花费超过1万亿美元在线购物”(13/2/2001,Newsfactor.com,“E-commerce to top $1 trillion shopping online”)。-“电子零售业有前途吗?在Booz-Allen,我们的答案是响亮的“是”!这个部分的增长潜力是巨大的”(3/2001,ebusinessforum,Booz-Allen&Hamilton)。b)关于优秀SE对这种应用的重要性-“一半以上的在线购买者利用搜索来查找产品-搜索工具越好,他们购买越多”,...,“每当我们对搜索增加新功能,出价会更高”,...,“忽视搜索的重要性的网站在不知不觉中损失销售额”(24/9/2001,Businessweek.com,“Desperately seeking searchtechnology”)。-“如果搜索功能没有正常工作,则80%的在线用户将放弃网站”(28/11/2001,webmastrcase.com,“Secrets to site search success”)。c)关于目前情况-“可证明电子商务不获利的主要原因在于忽略了搜索能力...优秀的搜索能力能够帮助扭转那种局面”(24/9/2001,Seybold Group,Businessweek.com,“Desperately seeking Search technology”)。-“阻止用户在网站上购买的最常见因素是他们没有找到正寻找的商品。在我们的研究中,这种情况占所有损失销售额的27%。而且当他们使用网站的搜索功能尝试查找商品时,失效率甚至更高-足有36%的用户无法找到他们所需的”(02/2001,webtechniques.com,“Building web sites with depth”)。-“购物者有时只是想搜索该商品,迅速找到它并付款离开。然而,大部分电子零售网站采用不一定有效的较旧的搜索技术,往往阻碍使用”(28/3/2001,professionaljeweler.com)。-“去年春天由Forrester Research测试的在线零售网站超过三分之二无法在搜索结果的首页列示最相关内容。难怪网站遭遇到无能力使浏览者转化为购买者的情况。顾客简直就是被无力的搜索技术赶走。”(28/2/2001,nytimes.com,Lisa Guernsey的“Revving-up the searchengines to keep the E-Aisles clear”)。信息检索系统在其最一般和基本的形式中,IR系统由两个组件组成-a)数千到数百万(有时甚至是数千万)条目的信息库;以及-b)搜索引擎,它可处理给定查询-以自由流自然语言或者以某种预定形式语言来表达,或者甚至作为从菜单、地图或给定目录中的选择-以及从IS返回系统判定与用户查询相关的条目组。检索条目可作为未组织的集合或作为有序列表来呈现,按诸如日期、作者或价格之类的某种元数据标准,或者更贴切地按假定测量它与用户请求的接近程度的条目的评分(从最好到最差)来排序。结果则可作为到相干条目的指针(或引用)来呈现,或者通过完整地显示这些条目来呈现,或者最终通过仅显示由系统判定为用户最感兴趣的这些条目的所选部分来呈现。已经提出这种基本范例的若干增强,在某种程度上,还通过后代SE来实现。因此,可通过采用可能增强查询/条目匹配成功率的有用数据、如关键字或描述符对IS中的条目注释来对其预处理。此外,查询本身可经过澄清过程,其中拼写错误被识别及纠正,以及同义词被识别并附加到查询的某些部分。用户可通过根据他的原始查询结果进行第二次搜索来提炼其搜索。最后,结果可通过更相干的结构来呈现,即作为树或分层结构,或者以预定义的方式,或者通过顶部结果的“即时”聚类来呈现。在检索上下文中,上述方案仍然有多个问题未得到解决;本文档来自技高网...

【技术保护点】
一种用于搜索数据库以产生提炼结果空间的交互方法,所述方法包括:为搜索标准进行分析,使用所述搜索标准来搜索所述数据库,从而得到初始结果空间,以及获取用户输入以限定所述初始结果空间,从而得到所述提炼结果空间。

【技术特征摘要】
【国外来华专利技术】US 2003-5-14 10/436,9961.一种用于搜索数据库以产生提炼结果空间的交互方法,所述方法包括为搜索标准进行分析,使用所述搜索标准来搜索所述数据库,从而得到初始结果空间,以及获取用户输入以限定所述初始结果空间,从而得到所述提炼结果空间。2.如权利要求1所述的方法,其特征在于,所述搜索包括浏览。3.如权利要求1所述的方法,其特征在于,在搜索之前对所述数据库执行所述分析,从而为所述搜索优化所述数据库。4.如权利要求1所述的方法,其特征在于,所述分析对用户输入的搜索标准来执行。5.如权利要求1所述的方法,其特征在于,所述分析包括采用语言分析。6.如权利要求4所述的方法,其特征在于,包括对初始搜索标准执行所述分析,以便得到附加搜索标准。7.如权利要求6所述的方法,其特征在于,所述搜索标准是无效标准。8.如权利要求6所述的方法,其特征在于,为附加搜索标准进行的所述分析采用所述初始搜索标准的语言分析来执行。9.如权利要求1所述的方法,其特征在于,所述分析通过选择相关概念来执行。10.如权利要求1所述的方法,其特征在于,所述分析采用从所述方法的过去操作得到的数据来执行。11.如权利要求1所述的方法,其特征在于,包括通过产生具有至少两个答案的至少一个提示,来产生用于所述获取用户输入的提示,所述答案被选取以划分所述初始结果空间。12.如权利要求11所述的方法,其特征在于,所述产生提示包括产生具有多个可能答案的至少一个分段提示,每个答案对应于所述结果空间的一部分。13.如权利要求12所述的方法,其特征在于,所述结果空间的各部分包括所述结果空间的实质上成比例的份额。14.如权利要求12所述的方法,其特征在于,包括产生多个分段提示,以及从其中选择其答案最均匀地划分所述结果空间的提示。15.如权利要求11所述的方法,其特征在于,所述限定所述结果空间包括从所述结果空间中排除不对应于所述用户输入中给出的答案的任何结果。16.如权利要求15所述的方法,其特征在于,还包括允许用户插入附加文本,所述文本可用作所述限定中所述用户输入的一部分。17.如权利要求11所述的方法,其特征在于,还包括通过产生具有至少两个答案的至少一个进一步提示,重复所述获取用户输入,所述答案被选取以划分所述提炼结果空间。18.如权利要求17所述的方法,其特征在于,包括继续所述限定,直至所述提炼结果空间收缩到预定大小。19.如权利要求17所述的方法,其特征在于,包括继续所述限定,直至没有发现进一步提示。20.如权利要求17所述的方法,其特征在于,包括继续所述限定,直至接收到用户输入,从而停止进一步限定并提交现有结果空间。21.如权利要求17所述的方法,其特征在于,还包括确定所提交结果空间不包括预期条目,以及在所述确定之后,向所述用户提交已经通过所述限定排除的初始检索条目。22.如权利要求20所述的方法,其特征在于,还包括从用户获取所提交结果空间不包括预期条目的确定,以及向所述用户提交通过所述限定排除的初始检索条目。23.如权利要求1所述的方法,其特征在于,包括作为用户输入接收所述初始搜索标准。24.如权利要求11所述的方法,其特征在于,所述获取所述用户输入包括为用户提供对所述提示不选择答案的可能性。25.如权利要求24所述的方法,其特征在于,还包括在所述用户不选择答案之后询问附加提示。26.如权利要求1所述的方法,其特征在于,还包括根据用户在查询之后对条目的最终选择来更新系统内部搜索支持信息。27.如权利要求26所述的方法,其特征在于,所述更新包括修改所述选择的条目与所述获取的用户输入之间的相关性。28.用于交互地搜索数据库以产生提炼结果空间的装置,包括搜索标准分析器,用于分析以获得搜索标准,数据库搜索器,与所述搜索标准分析器关联,用于利用所述搜索标准来搜索所述数据库,从而得到初始结果空间,以及限定器,用于获取用户输入以限定所述结果空间,并利用所述用户输入来限定所述结果空间,从而制订提炼结果空间。29.如权利要求28所述的装置,其特征在于,所述搜索标准分析器包括数据库数据条目分析器,它能够产生数据条目的分类,以便与所分析的搜索标准对应。30.如权利要求28所述的装置,其特征在于,所述搜索标准分析器包括数据库数据条目分析器,它能够利用数据条目的分类,以便与所分析的搜索标准对应。31.如权利要求29所述的装置,其特征在于,所述搜索标准分析器还能够利用数据条目的分类,以便与所分析的搜索标准对应。32.如权利要求29所述的装置,其特征在于,所述数据库数据条目分析器可用于在所述搜索之前分析所述数据库的至少一部分。33.如权利要求29所述的装置,其特征在于,所述数据库数据条目分析器可用于在所述搜索期间分析所述数据库的至少一部分。34.如权利要求28所述的装置,其特征在于,所述分析包括语言分析。35.如权利要求28所述的装置,其特征在于,所述分析包括统计分析。36.如权利要求34所述的装置,其特征在于,所述分析包括统计语言分析。37.如权利要求28所述的装置,其特征在于,所述搜索标准分析器配置成接收来自用户的初始搜索标准用于所述分析。38.如权利要求37所述的装置,其特征在于,所述初始搜索标准是无效标准。39.如权利要求37所述的装置,其特征在于,所述分析器配置成执行所述初始搜索标准的语言分析。40.如权利要求28所述的装置,其特征在于,所述分析器配置成根据相关概念的选择来执行分析。41.如权利要求28所述的装置,其特征在于,所述分析器配置成根据先前搜索中得到的历史知识来执行分析。42.如权利要求28所述的装置,其特征在于,所述限定器可用于产生用于所述获取用户输入的提示,所述提示包括至少两个可选响应,所述响应可用于划分所述初始结果空间。43.如权利要求42所述的装置,其特征在于,所述提示包括具有多个可能答案的分段提示,每个答案对应于所述结果空间的一部分,以及每个部分包含所述结果空间的实质上成比例的份额。44.如权利要求42所述的装置,其特征在于,产生所述提示包括产生各具有多个可能答案的多个分段提示,每个答案对应于所述结果空间的一部分,以及每个部分包含所述结果空间的实质上成比例的份额,以及选择其答案最均匀地划分所述结果空间的所述提示之一。45.如权利要求42所述的装置,其特征在于,还包括允许用户插入附加文本,所述文本可由所述限定器用作所述用户输入的一部分。46.如权利要求42所述的装置,其特征在于,所述限定所述结果空间包括从其中排除不对应于所述用户输入中给出的答案的任何结果,从而产生修订结果空间。47.如权利要求46所述的装置,其特征在于,所述限定器可用于产生具有至少两个答案的至少一个进一步提示,所述答案被选取以划分所述修订结果空间。48.如权利要求47所述的装置,其特征在于,所述限定器配置成继续所述限定,直至所述提炼结果空间收缩到预定大小。49.如权利要求47所述的装置,其特征在于,所述限定器配置成继续所述限定,直至没有发现进一步提示。50.如权利要求47所述的装置,其特征在于,所述限定器配置成继续所述限定,直至接收到用户输入,从而停止进一步限定并提交现有结果空间。51.如权利要求50所述的装置,其特征在于,使用户能够响应所提交结果空间不包括预期条目,所述装置配置成在接收到这种响应时向所述用户提交已经通过所述限定排除的初始检索条目。52.如权利要求47所述的装置,其特征在于,包括确定所提交结果空间不包括预期条目的可操作性,所述装置在这种确定之后配置成在接收到这种响应时向所述用户提交已经通过所述限定排除的初始检索条目。53.如权利要求28所述的装置,其特征在于,所述分析器配置成作为用户输入接收所述初始搜索标准。54.如权利要求42所述的装置,其特征在于,所述限定器配置成通过所述提示为用户提供对所述提示不选择答案的可能性。55.如权利要求54所述的装置,其特征在于,所述限定器可用于在所述用户不选择答案之后提供进一步提示。56.如权利要求28所述的装置,其特征在于,还包括更新单元,用于根据用户在查询之后对条目的最终选择来更新系统内部搜索支持信息。57.如权利要求56所述的装置,其特征在于,所述更新包括修改所述选择的条目与所述获取的用户输入之间的相关性。58.如权利要求56所述的装置,其特征在于,所述更新包括修改所述选择的条目的分类与所述获取的用户输入之间的相关性。59.一种数据库,具有用于交互式搜索数据库以产生提炼结果空间的装置,所述装置包括搜索标准分析器,用于为搜索标准而分析,数据库搜索器,与所述搜索标准分析器关联,用于利用搜索标准来搜索所述数据库,从而得到初始结果空间,以及限定器,用于获取用户输入以限定所述结果空间,并利用所述用户输入来限定所述结果空间,从而提供所述提炼结果空间。60.如权利要求59所述的装置,其特征在于,所述搜索标准分析器包括数据库数据条目分析器,它能够产生数据条目的分类,以便与所分析的搜索标准对应。61.如权利要求59所述的数据库,其特征在于,所述搜索标准分析器包括数据库数据条目分析器,它能够利用数据条目的分类,以便与所分析的搜索标准对应。62.如权利要求60所述的数据库,其特征在于,所述数据库数据条目分析器还能够利用数据条目的分类,以便与所分析的搜索标准对应。63.如权利要求59所述的数据库,其特征在于,所述搜索标准分析器包括能够按照所述数据库中条目的分类结构来分析用户提供的搜索标准的搜索标准分析器。64.如权利要求59所述的数据库,其特征在于,包括数据条目,以及其中各数据条目被分析为可能的搜索标准,从而优化与用户输入搜索标准的匹配。65.如权利要求60所述的数据库,其特征在于,所述数据库数据条目分析器可用于执行语言分析。66.如权利要求60所述的数据库,其特征在于,所述数据库数据条目分析器可用于执行统计分析。67.如权利要求65所述的数据库,其特征在于,所述数据库数据条目分析器可用于执行统计分析。68.如权利要求59所述的数据库,其特征在于,所述搜索标准分析器配置成接收来自用户的初始搜索标准用于所述分析。69.如权利要求68所述的数据库,其特征在于,所述初始搜索标准是无效标准。70.如权利要求68所述的数据库,其特征在于,所述分析器配置成执行所述初始搜索标准的语言分析。71.如权利要求59所述的数据库,其特征在于,所述分析器配置成根据相关概念的选择来执行分析。72.如权利要求59所述的数据库,其特征在于,所述分析器配置成根据先前搜索中得到的历史知识来执行分析。73.如权利要求59所述的数据库,其特征在于,所述限定器可用于产生用于所述获取用户输入的提示,所述提示包括具有至少两个答案的提示,所述答案被选取以划分所述初始结果空间。74.如权利要求73所述的数据库,其特征在于,所述提示是具有多个可能答案的分段提示,每个答案对应于所述结果空间的一部分,以及每个部分包含所述结果空间的实质上成比例的份额。75.如权利要求59所述的数据库,其特征在于,还包括允许用户插入附加文本,所述文本可由所述限定器用作所述用户输入的一部分。76.如权利要求73所述的数据库,其特征在于,所述限定所述结果空间包括从其中排除不对应于所述用户输入的所述答案之一的任何结果,从而产生修订结果空间。77.如权利要求76所述的数据库,其特征在于,所述限定器可用于产生具有至少两个答案的至少一个进一步提示,所述答案被选取以划分所述修订结果空间。78.如权利要求77所述的数据库,其特征在于,所述限定器配置成继续所述限定,直至所述提炼结果空间收缩到预定大小。79.如权利要求77所述的数据库,其特征在于,所述限定器配置成继续所述限定,直至没有发现进一步提示。80.如权利要求77所述的数据库,其特征在于,所述限定器配置成继续所述限定,直至接收到用户输入,从而停止进一步限定并提交现有结果空间。81.如权利要求80所述的数据库,其特征在于,使所述用户能够响应所提交结果空间不包括预期条目,所述数据库可用于在接收到这种响应时向所述用户提交已经通过所述限定排除的初始检索条目。82.如权利要求77所述的数据库,其特征在于,还可用于确定所提交结果空间不包括预期条目,所述数据库可用于在这种确定之后向所述用户提交已经通过所述限定排除的初始检索条目。83.如权利要求59所述的数据库,其特征在于,所述分析器配置成作为用户输入接收所述初始搜索标准。84.如权利要求73所述的数据库,其特征在于,所述限定器配置成通过所述提示为用户提供对所述提示不选择答案的可能性。85.如权利要求84所述的数据库,其特征在于,所述限定器还配置成在所述用户不选择答案之后提供附加提示。86.如权利要求59所述的数据库,其特征在于,还包括更新单元,用于根据用户在查询之后对条目的最终选择来更新系统内部搜索支持信息。87.如权利要求86所述的数据库,其特征在于,所述更新包括修改所述选择的条目与所述获取的用户输入之间的相关性。88.如权利要求86所述的数据库,其特征在于,所述更新包括修改所述选择的条目的分类与所述获取的用户输入之间的相关性。89.一种用于搜索所存储数据条目的查询方法,所述方法包括i)接收包含至少第一搜索检索词的查询,ii)通过向所述查询添加与所述至少第一搜索检索词相关的检索词来扩充所述查询,iii)检索与所述检索词中的至少一个对应的数据条目,iv)使用应用于所述所检索数据条目的属性值来制订对所述用户的提示,v)向所述用户询问所述制订的提示中的至少一个,作为用于聚焦所述查询的提示,vi)接收对其的响应,以及vii)使用所述接收的响应与所述属性的值进行比较,以便排除所述所检索条目中的一些,从而提供所述所检索数据条目的子集作为查询结果。90.如权利要求89所述的方法,其特征在于,所述查询包括多个检索词,以及所述扩充所述查询还包括分析所述检索词以便确定所述检索词中的一些之间的语法上的相互关系。91.如权利要求90所述的方法,其特征在于,还包括使用所述语法上的相互关系来标识所述搜索查询的主检索词和辅助检索词。92.如权利要求89所述的方法,其特征在于,所述扩充包括分别向所述查询添加下列各项的三阶段过程a)与所述搜索检索词密切相关的条目,b)在较小程度上与所述搜索检索词相关的条目,以及c)因所述搜索检索词中固有的任何多义性而得到的备选解释。93.如权利要求92所述的方法,其特征在于,所述条目是包括词汇术语和概念表示的组中的一个。94.如权利要求89所述的方法,其特征在于,还包括重复阶段iii)至vi)的至少一个附加聚焦过程,从而提供所述所检索数据条目的提炼子集作为所述查询结果。95.如权利要求89所述的方法,其特征在于,还包括按照基于概率值的熵权重对所述制订的提示排序,并询问具有更极端的熵权重的所述提示中的一些。96.如权利要求95所述的方法,其特征在于,还包括在接收到对于先前提示的响应之后重新计算所述概率值,从而重新计算所述熵权重。97.如权利要求95所述的方法,其特征在于,还包括采用各提示的动态答案集,所述动态答案集包含与分类值关联的答案,所述分类值对于一些所接收条目为真,对于另一些所接收条目为假,从而区别所述所检索条目。98.如权利要求97所述的方法,其特征在于,还包括根据区别所述所检索条目的相应能力对所述动态答案集内的各个答案分级。99.如权利要求95所述的方法,其特征在于,还包括根据用户搜索行为来修改所述概率值。100.如权利要求99所述的方法,其特征在于,所述用户搜索行为包括当前用户的过去行为。101.如权利要求99所述的方法,其特征在于,所述用户搜索行为包括在一组用户上聚集的过去行为。102.如权利要求99所述的方法,其特征在于,所述修改包括采用所述用户搜索行为来获得各个数据条目的先验选择概率,以及修改所述权重以反映所述概率。103.如权利要求95所述的方法,其特征在于,所述熵权重与包括所述条目的所述条目分类和相应分类值的组中的至少一个关联。104.如权利要求89所述的方法,其特征在于,包括在所述接收查询之前对所述所存储数据条目进行语义分析。105.如权利要求89所述的方法,其特征在于,包括在搜索会话期间对所述所存储数据条目进行语义分析。106.如权利要求104所述的方法,其特征在于,所述语义分析包括把所述数据条目分为若干类。107.如权利要求106所述的方法,其特征在于,还包括把属性分为属性类。108.如权利要求106所述的方法,其特征在于,所述分类包括在对象类或主类之中以及在属性类之中都进行区分。109.如权利要求108所述的方法,其特征在于,所述分类包括提供对单个数据条目的多个分类。110.如权利要求106所述的方法,其特征在于,对于相应数据库的主题的内在意义预先选择各个类的分类排列。111.如权利要求110所述的方法,其特征在于,包括分级排列所述类中的主类。112.如权利要求107所述的方法,其特征在于,包括分级排列属性类。113.如权利要求112所述的方法,其特征在于,还包括从所述检索词的分级排列确定所述数据条目中的检索词的语义意义。114.如权利要求111所述的方法,其特征在于,所述类还用于分析所述查询。115.如权利要求110所述的方法,其特征在于,根据相应数据库的主题对属性值分配权重。116.如权利要求110所述的方法,其特征在于,根据相应数据库的主题对所述属性值和所述类中的至少一个分配角色。117.如权利要求116所述的方法,其特征在于,所述角色还用于剖析所述查询。118.如权利要求117所述的方法,其特征在于,还包括按照所述根据所述数据库的所述主题所分配的角色来分配重要性权重。119.如权利要求118所述的方法,其特征在于,包括采用所述重要性权重来区别部分满足的查询。120.如权利要求106所述的方法,其特征在于,所述分析包括名词短语类型剖析。121.如权利要求106所述的方法,其特征在于,所述分析包括采用与所述所存储数据条目的主题相关的知识库所支持的语言技术。122.如权利要求106所述的方法,其特征在于,所述分析包括采用统计分类技术。123.如权利要求106所述的方法,其特征在于,所述分析包括采用以下各项的组合i)与所述所存储数据条目的主题相关的知识库所支持的语言技术,以及ii)统计技术。124.如权利要求123所述的方法,其特征在于,所述统计技术在所述语言技术之后对数据条目执行。125.如权利要求123所述的方法,其特征在于,所述语言技术包括以下各项中的至少一个分割,标记化,词形归类,标记,词性标记,以及所述数据条目的至少部分命名实体识别。126.如权利要求123所述的方法,其特征在于,还包括采用概率以及排列为权重的概率中的至少一个来区别来自所述各个技术的不同结果。127.如权利要求126所述的方法,其特征在于,还包括根据用户搜索行为来修改所述权重。128.如权利要求127所述的方法,其特征在于,所述用户搜索行为包括当前用户的过去行为。129.如权利要求127所述的方法,其特征在于,所述用户搜索行为包括在一组用户上聚集的过去行为。130.如权利要求123所述的方法,其特征在于,所述语言技术的输出用作所述至少一种统计技术的输入。131.如权利要求123所述的方法,其特征在于,所述至少一种统计技术用于所述语言技术中。132.如权利要求123所述的方法,其特征在于,包括采用两种统计技术。133.如权利要求89所述的方法,其特征在于,还包括分配表明与所述所存储数据条目中的至少一个关联的意义的至少一个代码,所述分配是对很可能见于针对所述至少一个所存储数据条目的查询中的检索词。134.如权利要求133所述的方法,其特征在于,与所述所存储数据条目中的至少一个关联的所述意义是所述条目、所述条目的属性类以及所述条目的属性值中的至少一个。135.如权利要求133所述的方法,其特征在于,还包括通过把新检索词分配给所述至少一个代码,来扩充很可能见于查询中的所述检索词的范围。136.如权利要求133所述的方法,其特征在于,包括提供类检索词的分组以及属性值检索词的分组。137.如权利要求106所述的方法,其特征在于,如果所述分析标识多义性,则对于所述多义性中的各意义的语义有效性执行测试所述查询的阶段,以及对于被认为在语义上有效的各意义,向所述用户提供解决所述有效性的提示。138.如权利要求106所述的方法,其特征在于,如果所述分析标识多义性,则对于所述多义性中的各意义的语义有效性执行测试所述查询的阶段,以及对于被认为在语义上...

【专利技术属性】
技术研发人员:T鲁本茨克N德肖维茨Y乔伊卡M弗洛O霍德A罗思
申请(专利权)人:塞利布罗斯有限公司
类型:发明
国别省市:IL[以色列]

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1