【技术实现步骤摘要】
【国外来华专利技术】对跨语言查询建议的查询翻译进行评价
本说明书涉及用计算机实现的查询建议服务,尤其涉及提供跨语言查询建议。
技术介绍
搜索引擎可以提供与用户的查询输入相对应的输入建议(例如查询建议)。输入建议包括对用户提交的搜索查询的查询替选项和/或与用户输进的部分查询输入匹配的建议(例如自动完成)。为了提供可能与用户的兴趣和当前信息需要相关的输入建议,搜索引擎在选择特定输入建议候选对象以向用户呈现之前,基于各种标准对输入建议候选对象进行评价。有关同一主题或信息的因特网内容在万维网上经常以不同的自然语言和/或书写系统而存在。多语言用户可以尝试以不同的语言和/或书写系统拟定相应的查询,并且向搜索引擎提供查询以定位不同语言和/或书写系统的相关内容。然而,即使有多语言字典的帮助,使用非母语语言或书写系统拟定有效搜索查询,对于许多多语言用户来说也可能是挑战。能够提供跨语言输入建议(例如跨语言查询建议)的搜索引擎可以帮助减轻这种困难。需要提高机器生成的跨语言查询建议的质量和有效性的技术。
技术实现思路
本说明书描述与跨语言查询建议的生成有关的技术。通常,在本说明书中描述的主题的一个方面可以通过包括如下动作的方法来实施:接收以第一语言书写的查询,所述查询是基于向搜索引擎提交的用户输入生成的主要语言查询建议;获得所述第一语言的所述查询的一个或更多个唯一候选分段,每个唯一候选分段由通过分割所述第一语言的所述查询而获得的片段的各自的序列构成;对于所述一个或更多个唯一候选分段中的每一个,通过翻译所述候选分段的片段的各自的序列,确定第二语言的一个或更多个候选翻译的各自的集合;对于所述一个 ...
【技术保护点】
一种用计算机实现的方法,包括:接收以第一语言书写的查询,所述查询是基于向搜索引擎提交的用户输入生成的主要语言查询建议;获得所述第一语言的所述查询的一个或更多个唯一候选分段,每个唯一候选分段由通过分割所述第一语言的所述查询而获得的片段的各自的序列构成;对于所述一个或更多个唯一候选分段中的每一个,通过翻译所述候选分段的片段的各自的序列,确定第二语言的一个或更多个候选翻译的各自的集合;对于所述一个或更多个唯一候选分段中的每一个的每个候选翻译:至少部分基于从所述唯一候选分段的片段的各自的序列中去除了多少个停止词、以及所述唯一候选分段在第一查询日志中作为以所述第一语言书写的完整查询出现的各自的第一频率,确定所述唯一候选分段的各自的分段质量;及至少基于针对所述唯一候选分段确定的所述各自的分段质量、以及所述候选翻译在第二查询日志中作为以所述第二语言书写的完整查询出现的各自的第二频率,确定所述候选翻译的各自的评分;以及基于所述候选翻译各自的评分,提供所述候选翻译中的至少一个作为所述查询的跨语言查询建议。
【技术特征摘要】
【国外来华专利技术】1.一种用计算机实现的方法,包括: 接收以第一语言书写的查询,所述查询是基于向搜索引擎提交的用户输入生成的主要语言查询建议; 获得所述第一语言的所述查询的一个或更多个唯一候选分段,每个唯一候选分段由通过分割所述第一语言的所述查询而获得的片段的各自的序列构成; 对于所述一个或更多个唯一候选分段中的每一个,通过翻译所述候选分段的片段的各自的序列,确定第二语言的一个或更多个候选翻译的各自的集合; 对于所述一个或更多个唯一候选分段中的每一个的每个候选翻译: 至少部分基于从所述唯一候选分段的片段的各自的序列中去除了多少个停止词、以及所述唯一候选分段在第一查询日志中作为以所述第一语言书写的完整查询出现的各自的第一频率,确定所述唯一候选分段的各自的分段质量 '及 至少基于针对所述唯一候选分段确定的所述各自的分段质量、以及所述候选翻译在第二查询日志中作为以所述第二语言书写的完整查询出现的各自的第二频率,确定所述候选翻译的各自的评分;以及 基于所述候选翻译各自的评分,提供所述候选翻译中的至少一个作为所述查询的跨语言查询建议。2.一种用计算机实现的方法,包括: 接收以第一语言书写的查询; 获得所述第一语言的所述查询的一个或更多个唯一候选分段,每个唯一候选分段由通过分割所述第一语言的所述查询而获得的片段的各自的序列构成; 对于所述一个或更多个唯一候选分段中的每一个: 确定所述唯一候选分段的分段质量的各自的度量;及 通过翻译所述候选分段的片段的各自的序列,获得第二语言的一个或更多个候选翻译的各自的集合; 对于所述一个或更多个唯一候选分段中的每一个的每个候选翻译: 确定所述候选翻译在第一查询日志中作为以所述第二语言书写的完整查询出现的第一频率;及 至少基于所述候选翻译在所述第一查询日志中作为以所述第二语言书写的完整查询出现的所述第一频率、以及所述候选分段的分段质量的度量,确定所述候选翻译的各自的评分;以及 基于所述候选翻译各自的评分,提供所述候选翻译中的至少一个作为所述查询的跨语言查询建议。3.根据权利要求2所述的用计算机实现的方法,其中,获得所述第一语言的所述查询的一个或更多个唯一候选分段还包括: 获得作为所述第一语言的所述查询的分区的至少一个候选分段。4.根据权利要求2所述的用计算机实现的方法,其中,获得所述第一语言的所述查询的一个或更多个唯一候选分段还包括: 获得从所述候选分段中去除了一个或更多个停止词的至少一个候选分段。5.根据权利要求4所述的用计算机实现的方法,其中,对于所述一个或更多个唯一候选分段中的每一个,确定所述唯一候选分段的分段质量的各自的度量还包括: 至少部分基于从所述候选分段的片段的各自的...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。