自动查询模式生成制造技术

技术编号:17269330 阅读:120 留言:0更新日期:2018-02-14 18:44
描述一个总体方面,其包括一种用于生成模式图的计算机实现的方法。所述方法可包括访问与web文档的语料库相关的数据。所述数据可包括多个查询文档对。所述方法还可包括识别所述多个查询文档对中的至少一个查询模式,且所述查询模式可与所述语料库中的一部分web文档相关联。所述方法还可包括识别所述至少一个查询模式中的多个子短语,在web文档的所述语料库中确定包括所述多个子短语中的至少一个的多个其他查询模式,以及将分类符指派给所述至少一个查询模式和包括所述子短语中的至少一个的所述多个其他查询模式中的每一个。

Automatic query mode generation

Describe an overall aspect, which includes a method of computer implementation for generating pattern graphs. The methods described can include access to data related to the corpus of Web documents. The data can include multiple query document pairs. The method can also include identifying at least one query mode in the multiple query document pairs, and the query mode can be associated with a part of Web documents in the corpus. A plurality of sub phrases, the method can also include the identification of the at least one query mode, including the plurality of sub phrases of at least one of the plurality of other query patterns in the corpus of the web document, and the classifier assigned to the at least one query mode and includes every one of the sub phrases of at least one of the plurality of other in query mode.

【技术实现步骤摘要】
【国外来华专利技术】自动查询模式生成相关申请的交叉引用本申请主张2016年8月3日提交的题为“AutomaticQueryPatternGeneration(自动查询模式生成)”的美国非临时专利申请第15/227,456号的优先权并且是其继续申请,该案进而主张2015年8月4日提交的题为“自动查询模式生成”的美国临时专利申请第62/200,819号的优先权,前述专利申请的公开内容通过引用的方式全部并入本文中。
本描述大体上涉及搜索系统的使用。具体的具体的,本描述涉及生成和使用查询模式图。
技术介绍
互联网搜索引擎可响应于用户提交的搜索查询来返回搜索结果。一些搜索结果可被认为是响应于用户的搜索查询,并且其他搜索结果可被认为是不相干的或者极少相关的。由于用户通常正在搜索有帮助的信息,因此根据用户需求提供最响应的搜索结果可节省用户时间,并可消除执行多个搜索查询以找到所需信息的负担。
技术实现思路
一个或多个计算机的系统可被配置成依靠在系统上安装在操作中致使所述系统执行动作的软件、固件、硬件、或其组合来执行特定的操作或动作。一个或多个计算机程序可被配置成通过包括依靠在由数据处理装置执行时致使所述装置执行动作的指令来本文档来自技高网...
自动查询模式生成

【技术保护点】
一种用于生成模式图的计算机实现的方法,所述方法包括:访问与web文档的语料库相关的数据,所述数据包括多个查询文档对;识别所述多个查询文档对中的至少一个查询模式,所述查询模式与所述语料库中的一部分web文档相关联;识别所述至少一个查询模式中的多个子短语;在web文档的所述语料库中确定包括所述多个子短语中的至少一个的多个其他查询模式;将分类符指派给所述至少一个查询模式和包括所述子短语中的至少一个的所述多个其他查询模式中的每一个;使所述分类符与所述语料库中的所述一部分web文档相关联;以及将所述查询模式和所述其他查询模式聚合到模式图中。

【技术特征摘要】
【国外来华专利技术】2015.08.04 US 62/200,819;2016.08.03 US 15/227,4561.一种用于生成模式图的计算机实现的方法,所述方法包括:访问与web文档的语料库相关的数据,所述数据包括多个查询文档对;识别所述多个查询文档对中的至少一个查询模式,所述查询模式与所述语料库中的一部分web文档相关联;识别所述至少一个查询模式中的多个子短语;在web文档的所述语料库中确定包括所述多个子短语中的至少一个的多个其他查询模式;将分类符指派给所述至少一个查询模式和包括所述子短语中的至少一个的所述多个其他查询模式中的每一个;使所述分类符与所述语料库中的所述一部分web文档相关联;以及将所述查询模式和所述其他查询模式聚合到模式图中。2.根据权利要求1所述的方法,其中,所述模式图被配置成表示所述一部分web文档中的至少两个web文档之间的相似性。3.根据权利要求1所述的方法,其中,所述分类符与用户输入相关联且包括确定的一个或多个主题类别以及所述一个或多个主题类别内的特异度水平。4.根据权利要求1所述的方法,进一步包括:基于使所述子短语中的至少一个与所述语料库中的至少一个web文档匹配来将所述分类符指派给所述至少一个查询模式。5.根据权利要求1所述的方法,进一步包括识别所述多个查询文档对中的多个额外查询模式,以及对于所述额外查询模式中的每一个:识别所述额外查询模式中的短语和多个子短语以及在web文档的所述语料库中确定包括所述额外查询模式中的所述多个子短语中的至少一个的多个其他查询模式;将所述分类符指派给所述额外查询模式和所述其他查询模式中的每一个;使所述分类符与所述语料库中的一部分web文档相关联;以及根据所述分类符将所述额外查询模式聚合到所述模式图中。6.根据权利要求5所述的方法,其中,将所述查询模式和所述其他查询模式聚合到模式图中包括:组装包括多个节点和边的图,每个节点表示查询模式且每个边表示所述图中两个或多于两个的查询模式之间的相似性分值。7.根据权利要求6所述的方法,进一步包括:使用邻居节点来滤出对应于与所关联的分类符不同的分类符的一个或多个查询模式。8.根据权利要求1所述的方法,其中,所述模式图包括直方图、矩阵、曲线图、和散点图矩阵中的至少一个。9.一种计算机实现的方法,所述方法包括:获得多个搜索查询;基于所述多个搜索查询来生成多个经转译搜索查询;生成每个搜索查询和经转译搜索查询的转译对;对于每个所生成的转译对:应用查询注释器以确定所述转译对中的一个或多个子短语之间的匹配标识符;响应于确定至少一个匹配标识符,用占位符替换所述至少一个匹配标识符,所述占位符指示所述搜索查询和与所述转译对相对应的经转译搜索查询之间的模式关系;生成至少一个查询模式以表示所述转译对,所述查询模式至少部分地基于所述匹配标识符;以及通过用围绕所述匹配标识符的所述经转译搜索查询中的至少一个子短语交换围绕所...

【专利技术属性】
技术研发人员:托默·什米尔德维尔·凯沙尔韦雷德·科恩
申请(专利权)人:谷歌有限责任公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1