【技术实现步骤摘要】
【国外来华专利技术】著作权通告本专利文献的公开内容的一部分包含受著作权保护的素材。著作权所有人不反对任何人对专利文献或专利公开以其出现在专利商标局专利文件或记录中的形式进行复制再现,但除此之外保留一切著作权权利。相关申请的交叉引用本申请与以下未决申请相关,特此通过引用将每个所述未决申请全部内容并入在此:·2005年8月10日递交的题为“SYSTEM AND METHOD FORDETERMINING ALTERNATE SEARCH QUERIES”的美国专利申请No.11/200,851;以及·2005年11月9日递交的题为“MODULAR OPTIMIZED DYNAMICSETS”的美国专利申请No.60/736,133。
本专利技术一般地提供了用于识别与根据具有多个书写系统(writingsystem)的语言(language)书写的给定搜索查询(search query)相关的一个或多个查询的方法和系统。更具体而言,本专利技术提供了用于接收根据具有多个书写系统的语言的一个或多个书写系统的组合来书写的搜索查询并且从查询的候选集合(candidate set of queries)中识别一个或多个相关查询的方法和系统。
技术介绍
由于因特网的出现和万维网(“web”)上用户可获得的众多网页、媒体内容、广告等等,向用户提供流线型的方法以从web获得有关信息已-->经成为一种需求。搜索系统和过程已经被开发出来满足用户获得这种信息的需求。这种技术的示例可通过Yahoo!、Google和其他搜索提供商网站来得到。目前,用户可以使用能够接入广域网(例如因特网)的客户端设备(例如个 ...
【技术保护点】
一种用于识别与给定查询相关的一个或多个查询的方法,该方法包括: 接收根据具有多个书写系统的语言的一个或多个书写系统书写的查询; 识别根据所述具有多个书写系统的语言的一个或多个书写系统书写的查询的候选集合;以及 为所述候选集合中的一个或多个查询计算指示出所述一个或多个查询与接收的查询的相似性的得分。
【技术特征摘要】
【国外来华专利技术】US 2006-2-28 11/365,3151.一种用于识别与给定查询相关的一个或多个查询的方法,该方法包括:接收根据具有多个书写系统的语言的一个或多个书写系统书写的查询;识别根据所述具有多个书写系统的语言的一个或多个书写系统书写的查询的候选集合;以及为所述候选集合中的一个或多个查询计算指示出所述一个或多个查询与接收的查询的相似性的得分。2.如权利要求1所述的方法,其中,接收查询包括接收根据一个或多个日语书写系统的组合书写的查询。3.如权利要求1所述的方法,其中,识别查询的候选集合包括识别与所述接收的查询相关的一个或多个查询的集合。4.如权利要求3所述的方法,其中,识别与接收的查询相关的查询的候选集合包括识别如一个或多个查询日志中所指示的与所述接收的查询相关的一个或多个查询。5.如权利要求1所述的方法,其中,接收查询包括接收根据日语平假名书写系统书写的查询。6.如权利要求1所述的方法,其中,接收查询包括接收根据日语片假名书写系统书写的查询。7.如权利要求1所述的方法,其中,接收查询包括接收根据日语假名书写系统书写的查询。8.如权利要求1所述的方法,其中,接收查询包括接收根据日语罗马字书写系统书写的查询。9.如权利要求1所述的方法,其中,接收查询包括接收根据日语JASCII书写系统书写的查询。10.如权利要求1所述的方法,其中,接收查询包括接收根据日语汉字书写系统书写的查询。11.如权利要求1所述的方法,其中,接收查询包括接收构成短语的词语的集合。12.如权利要求1所述的方法,其中,为所述候选集合中的一个或多个查询计算得分包括计算指示出来自所述候选的给定查询与所述接收的查询在含义上的相似性的得分。13.如权利要求1所述的方法,其中,计算得分包括:将所述接收的查询的一个或多个字符转换成罗马字符;将从所述候选集合中选择的查询的一个或多个字符转换成罗马字符;以及计算所述接收的查询和所述从所述候选集合中选择的查询之间的字符编辑距离。14.如权利要求1所述的方法,其中,计算得分包括:将所述接收的查询的一个或多个字符转换成罗马字符;将从所述候选集合中选择的查询的一个或多个字符转换成罗马字符;从所述接收的查询和所述从所述候选集合中选择的查询中去除空格字符;以及计算所述接收的查询和所述从所述候选集合中选择的查询之间的字符编辑距离。15.如权利要求1所述的方法,其中,计算得分包括:将所述接收的查询的一个或多个字符转换成罗马字符;将从所述候选集合中选择的查询的一个或多个字符转换成罗马字符;识别所述接收的查询和所述选择的查询中的独特空格分隔共现单词的数目;识别所述接收的查询和所述选择的查询两者之中的独特空格分隔单词的总数;计算所述独特空格分隔共现单词的数目与两个查询中的所述独特空格分隔单词的总数的商;以及计算数值一(“1”)与计算出的商之间的差。16.如权利要求1所述的方法,其中,计算得分包括识别某一数字是否是所述接收的查询或者从所述候选集合中选择的查询所特有的。17.如权利要求1所述的方法,其中,计算得分包括:识别所述接收的查询和从所述候选集合中选择的查询中的共现日语汉字字符的数目;识别所述接收的查询和所述从所述候选集合中选择的查询中的独特日语汉字字符的总数;计算所述共现日语汉字字符的数目与所述独特日语汉字字符的总数的商;以及计算数值一(“1”)与计算出的商之间的差。18.如权利要求1所述的方法,其中,计算得分包括:将所述接收的查询的一个或多个字符转换成罗马字符;将从所述候选集合中选择的查询的一个或多个字符转换成罗马字符;以及计算所述接收的查询和所述选择的查询共有的罗马字符的数目。19.如权利要求1所述的方法,其中,计算得分包括识别所述接收的查询或者从所述候选集合中选择的查询是否包含非罗马字符。20.如权利要求1所述的方法,其中,计算得分包括:将所述接收的查询的一个或多个日语汉字字符转换成日语假名字符;将从所述候选集合中...
【专利技术属性】
技术研发人员:罗斯琼斯,凯文巴兹,本杰明雷,
申请(专利权)人:雅虎公司,
类型:发明
国别省市:US[美国]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。