Search for content can be improved by using unique reserved phrases. A reserved phrase can point a query to the specific preselected portion of content. Synonyms can be generated and associated with reserved phrases so that even if the query does not include reserved phrases, synonyms can also be used to map queries to reserved phrases and related content. Synonyms can be generated and filtered so that synonyms are associated only with a reserved phrase, thus reducing search ambiguity.
【技术实现步骤摘要】
【国外来华专利技术】上下文搜索字符串同义词的自动生成
本专利技术的实施例一般涉及用于响应于查询而向用户提供更相关和有用的内容的方法和系统,并且更具体地涉及响应于查询而使用特有预留短语向用户提供结果。
技术介绍
由用户执行的Web搜索或企业搜索常常将返回与搜索的预期目标不相关的结果。例如,可能向搜寻产品的技术帮助的用户呈现针对不相关的产品的结果或者该产品的新版本的销售报价。在许多情况下,当用户没有输入产品的全名或其它搜索项时,web搜索或企业搜索可能不会返回任何结果。因此,需要改进的方法和系统,以用于向用户提供更相关和有用的内容。
技术实现思路
本专利技术的实施例提供了用于响应于查询而向用户提供更相关和有用的内容的系统和方法。根据一个实施例,可以利用特有预留短语来改进对内容的搜索。预留短语可以将查询指向内容的具体预选部分。同义词可以被生成并且与预留短语相关联,以使得即使当查询不包括预留短语时,同义词也可以被用于将查询映射到预留短语和相关联的内容。同义词可以被生成和过滤,以使得同义词仅与一个预留短语相关联,由此减少搜索歧义。根据一个实施例,搜索字符串扩展可以包括接收预留短语的列表。列表中的每个预留短语可以与内容相关,并且每个字符串可以与内容的一部分相关联。每个预留短语可以根据语言特性来分类。例如,语言特性包括名词、动词或地点中的至少一个。可以为列表中的每个预留短语生成同义词的候选列表。可以通过去除同义词重复、将同义词与同义词规则进行比较以及去除与同义词规则匹配的同义词来过滤同义词的候选列表。每个同义词可以根据相关联的预留词的语言特性进行分类。根据一个实施例,生成同义词的候选列表可以包 ...
【技术保护点】
一种用于搜索字符串扩展的方法,所述方法包括:接收预留短语的列表,所述列表中的每个预留短语与内容相关,并且其中每个字符串与所述内容的一部分相关联;根据语言特性对每个预留短语进行分类;为所述列表中的每个预留短语生成同义词的候选列表;通过以下操作来过滤所述同义词的候选列表:去除同义词重复;以及将同义词与同义词规则进行比较,并且去除与所述同义词规则匹配的同义词;以及根据相关联的预留词的语言特性来对每个同义词进行分类。
【技术特征摘要】
【国外来华专利技术】2014.11.20 US 14/548,5531.一种用于搜索字符串扩展的方法,所述方法包括:接收预留短语的列表,所述列表中的每个预留短语与内容相关,并且其中每个字符串与所述内容的一部分相关联;根据语言特性对每个预留短语进行分类;为所述列表中的每个预留短语生成同义词的候选列表;通过以下操作来过滤所述同义词的候选列表:去除同义词重复;以及将同义词与同义词规则进行比较,并且去除与所述同义词规则匹配的同义词;以及根据相关联的预留词的语言特性来对每个同义词进行分类。2.如权利要求1所述的方法,还包括:接收查询字符串;从候选同义词的经过滤的列表中识别与所述查询字符串的一部分匹配的匹配同义词;以及确定所述查询字符串的所述部分是否与所述匹配的同义词的语言特性匹配。3.如权利要求1所述的方法,还包括:发送与匹配同义词的预留短语相关联的所述内容的所述部分。4.如权利要求1所述的方法,其中生成同义词的候选列表包括:生成所述预留短语中的每个预留短语的子串变体的列表。5.如权利要求1所述的方法,其中生成同义词的候选列表包括:分析所述内容;以及确定所述内容中的被用于指代所述预留短语中的每个预留短语的替代词。6.如权利要求1所述的方法,其中语言特性包括名词、动词或地点中的至少一个。7.一种系统,包括:处理器;以及存储器,所述存储器与所述处理器耦接并且可由所述处理器读取,并且在所述存储器中存储指令集合,所述指令集合当由所述处理器执行时,使得所述处理器通过以下操作来执行搜索字符串扩展:接收预留短语的列表,所述列表中的每个预留短语与内容相关,并且其中每个字符串与所述内容的一部分相关联;根据语言特性对每个预留短语进行分类;为所述列表中的每个预留短语生成同义词的候选列表;通过以下操作来过滤所述同义词的候选列表:去除同义词重复;以及将同义词与同义词规则进行比较,并且去除与所述同义词规则匹配的同义词;以及根据相关联的预留词的语言特性对每个同义词进行分类。8.如权利要求7所述的系统,还包括:接收查询字符串;从候选同义...
【专利技术属性】
技术研发人员:F·诺兹,C·奇斯格,G·克鲁斯特曼,J·拉施拉斯,A·D·E·委德拉尔,S·尼斯瓦,M·扎拉芬,
申请(专利权)人:甲骨文国际公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。