基于原始用户输入建议和细分用户输入的系统和方法技术方案

技术编号：8366774 阅读：203 留言：0更新日期：2013-02-28 05:19

本发明专利技术提供了一种基于原始用户输入建议和细分用户输入的系统和方法。该方法可以针对基于罗马语系的语言和/或诸如汉语的基于非罗马语系的语言来实现。该方法通常可以包括：接收原始用户输入并识别其中的核心词语；通过根据相似矩阵用另一词语替代原始输入中的核心词语和/或通过根据扩展/缩略表用另一个字序列代替原始输入中的字序列来确定潜在可选输入，其中，一个字序列是另一个字序列的子串；计算每个潜在可选输入的似然；以及根据预定标准（例如，可选输入的似然至少是原始输入的似然）来选择最有可能的可选输入。可以提供包含预计算的原始用户输入和相应的可选输入的高速缓冲存储器。

全部详细技术资料下载

【技术实现步骤摘要】
本申请是分案申请，其原案申请的申请号为200680021940.2，申请日为2006年5 月4日，专利技术名称为“基于原始用户输入建议和细分用户输入”。
本专利技术总的来说涉及生成可选用户输入。更具体地，公开了基于诸如搜索查询的原始用户输入生成更改和细分的用户输入的系统和方法。
技术介绍
在给定的搜索会话(session)期间，许多用户常常，有时重复地，更改或细分其原始搜索查询。例如，用户可以将原始搜索查询更改为更具体的搜索查询、更宽泛的搜索查询、和/或使用可选的查询词语(term)的搜索查询，直到生成期望的搜索结果。用户搜索查询细分通过基于罗马语系语言(例如，英语)的查询、以及通过基于非罗马语系语言(例如，汉语、日语、韩语(CJK)、泰国语等)来产生。当原始搜索查询未产生一组好的搜索结果时(例如，如果搜索查询太具体或太宽泛，或者如果搜索查询使用不合适的词语)，用户通常更改或细分他们的搜索查询。例如，当一个或多个搜索词语有多种意思且一些返回文档涉及不同于用户想要的多义搜索词语的一个意思时、和/或用户仅对搜索词语的许多方面中给定搜索词语的一个方面感兴趣时，原始用户...

【技术保护点】
一种方法，包括：接收输入，所述输入包括一个或多个核心词语；识别所述输入中的第一核心词语；确定所述第一核心词语的替代词语，包括：构建出现在语料库中的一个或多个词语中的每个词语的特征矢量，其中，所述一个或多个词语包括所述第一核心词语，确定所述第一核心词语的第一特征矢量与所述出现在语料库中的一个或多个词语的各个特征矢量中的每个特征矢量之间的各个相似性测度，使用所确定的所述第一核心词语的特征矢量与所述出现在语料库中的一个或多个词语的各个特征矢量之间的相似性测度来构建相似性矩阵，以及基于所确定的所述相似性矩阵中的相似性测度，选择替代词语；生成可选输入，包括用所选择的替代词语来替换所述输入中的所述第一核心...

【技术特征摘要】
...

【专利技术属性】
技术研发人员：吴军，林德康，钱哲，周杰，
申请(专利权)人：谷歌公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人