在搜索查询当中识别查询模式及相关联的聚合统计制造技术

技术编号:18824917 阅读:18 留言:0更新日期:2018-09-01 13:46
在各个实施方式中,本文所述的特征增进在处理搜索查询时保留信息的机密性,并且能够以计算上相对廉价的方式将n‑gram分类成私有或非私有。基于在私有搜索查询的搜索日志内找到的多个非私有n‑gram,可以生成多个查询模式。可以从搜索日志确定与每个查询模式相关联的聚合搜索活动统计(“ASAS”)。与每个查询模式相关联的ASAS可以指示与搜索日志中匹配该查询模式的多个私有搜索查询相关联的搜索后活动。响应于确定针对给定查询模式的ASAS满足性能准则,基于与给定查询模式相关联的ASAS,可以更改用于生成响应于匹配给定查询模式的搜索查询而呈现的数据的方法。

【技术实现步骤摘要】
【国外来华专利技术】在搜索查询当中识别查询模式及相关联的聚合统计
技术介绍
搜索查询的搜索日志可能有益于确定搜索查询当中常见的查询模式。这些查询模式可能有益于各种目的,诸如生成替选的查询建议和/或对其进行排名、对搜索结果进行排名等等。然而,一些搜索查询可能包括私有用户信息。在将被视为用户和/或用户所关联的实体(例如,她的雇主)私有的搜索查询提交给系统的场境(context)下,情况尤其如此。例如,用户可能使用相对有可能包含诸如姓名、联系信息、账户编号等的私有信息的搜索查询来搜索诸如电子邮件系统、文件系统、文档管理系统等的许多个人或实体内系统。
技术实现思路
本公开主要涉及在处理搜索查询时保留信息的机密性。本公开大体上涉及用于分析搜索查询的搜索日志(其中许多可能是私有的和/或包含潜在私有的信息)以及对应的搜索后活动以生成一个或多个查询模式而不会将潜在私有的信息暴露给人类用户的方法、装置和计算机可读介质(暂时性和非暂时性)。针对一个或多个所生成的查询模式,可以确定与匹配一个或多个查询模式的搜索查询相关联的聚合搜索活动统计(包括关于搜索后活动的统计)。然后,可以将那些一个或多个查询模式以及对应的聚合搜索活动统计用于各种目的,下面将描述其中几个目的。例如,可以使用与给定查询模式相关联的聚合搜索活动统计来更改用于生成数据的方法,该数据被呈现给提交匹配给定查询模式的搜索查询的用户。在一些实施方式中,可以提供一种计算机实现的方法,其包括以下步骤:在私有搜索查询以及对应的搜索后活动的搜索日志内,识别私有搜索查询中所包含的满足隐私准则的多个非私有n-gram;基于多个非私有n-gram,从搜索日志生成多个查询模式;从搜索日志确定与多个查询模式中的每一个相关联的聚合搜索活动统计,其中,与每个查询模式相关联的聚合搜索活动统计指示与搜索日志中匹配该查询模式的多个私有搜索查询相关联的搜索活动;以及响应于确定针对给定查询模式的聚合搜索活动统计满足性能准则,基于与该给定查询模式相关联的聚合搜索活动统计,更改用于生成响应于匹配该给定查询模式的搜索查询而呈现的数据的方法。该方法以及本文中所公开技术的其他实施方式均可以可选地包括以下特征中的一个或多个。在一些实施方式中,所述方法可以被更改成使得:至少部分地基于与给定查询模式相关联的聚合搜索活动统计,对响应于匹配该给定查询模式的搜索查询而呈现的查询建议进行排名。通过这种方式,能够达成对查询建议包括机密信息的可能性的控制。在一些实施方式中,所述方法可以被更改成:至少部分地基于与给定查询模式相关联的聚合搜索活动统计,对响应于匹配该给定模式的搜索查询而呈现的搜索结果进行排名。通过这种方式,能够达成对搜索结果包括机密信息的可能性的控制。在一些实施方式中,在搜索日志内以满足频率阈值的频率出现的n-gram可以满足隐私准则。在一些实施方式中,在搜索日志内出现至少最小次数的n-gram可以满足隐私准则。在一些实施方式中,生成可以包括基于私有搜索查询当中非私有n-gram出现的频率来生成非私有n-gram的直方图。这些特征能够以计算上相对廉价的方式分类私有n-gram和非私有n-gram。在一些实施方式中,与多个查询模式中的每一个相关联的聚合搜索活动统计可以包括搜索日志中匹配该查询模式的搜索查询的总数。在一些实施方式中,与多个查询模式中的每一个相关联的聚合搜索活动统计包括搜索日志中匹配该查询模式的不同的搜索查询的数目。在一些实施方式中,与给定查询模式相关联的聚合搜索活动统计可以包括:关于与搜索日志中匹配该给定查询模式的多个私有搜索查询相关联的搜索后活动的聚合统计。在一些实施方式中,与给定查询模式相关联的聚合搜索后活动统计可以包括与该给定查询模式相关联的点击位置统计。在一些实施方式中,与给定查询模式相关联的聚合搜索后活动统计可以包括与该给定查询模式相关联的点击率。在一些实施方式中,与给定查询模式相关联的聚合搜索后活动统计可以包括与该给定查询模式相关联的放弃率。在一些实施方式中,性能准则在放弃率满足最小阈值的情况下被满足。其他实施方式可以包括一种存储指令的非暂时性计算机可读存储介质,所述指令可由处理器执行以执行诸如上所述的方法中的一个或多个的方法。又一实施方式可以包括一种系统,其包括存储器以及一个或多个处理器,所述一个或多个处理器可操作成执行存储在所述存储器中的指令以执行诸如上所述的方法中的一个或多个的方法。应领会到,本文中详述的前述概念以及附加概念的所有组合均被构想为本文中所公开的主题的一部分。例如,在本公开的文末出现的所要求保护的主题的所有组合均被构想为本文中所公开的主题的一部分。附图说明图1图示出根据各个实施方式的环境的可以通过本公开的各个组件来分析搜索查询的一个或多个日志以生成查询模式和对应的聚合搜索活动统计。图2描绘出根据各个实施方式的可以如何处理私有搜索查询和对应的搜索后活动以获得查询模式和相关联的聚合搜索活动统计。图3描绘出图示根据各个实施方式的生成查询模式和对应的聚合搜索活动统计并且将该信息应用于各种目的的示例方法的流程图。图4示意性描绘出计算机系统的示例架构。具体实施方式图1图示出用户可以在各个系统上执行可以被视为私有的搜索的示例环境。该示例环境包括客户端设备102、文档存储系统104和电子邮件系统106。文档存储系统104和/或电子邮件系统106可以在例如通过网络(未示出)通信的一个或多个计算机中实现。文档存储系统104和/或电子邮件系统106是可以实现本文所述的技术和/或本文所述的系统、组件和技术可以与之相接口的系统的示例。用户可以经由客户端设备102与文档存储系统104和/或电子邮件系统106相交互。文档存储系统104和/或电子邮件系统106可以从客户端设备102接收搜索查询108并且响应于搜索查询108而返回搜索结果110。如本文所用,“搜索查询”108可以指代对可以提交给搜索接口——诸如搜索引擎——的信息的请求。在许多实例中,搜索查询可以包括共同形成对信息的请求的一个或多个n-gram。然而,这并无限制意义。搜索查询108同样可以呈其他形式,诸如图像、音频等等。在一些实施方式中,其他计算机设备可以向文档存储系统104和/或电子邮件系统106提交搜索查询,诸如附加客户端设备和/或为已同文档存储系统104和/或电子邮件系统106的提供者合作的web站点实现服务的一个或多个服务器。然而,为简洁起见,在客户端设备102的场境中描述这些示例。在各个实施方式中,客户端设备102可以是通过一个或多个网络(未示出)以通信方式耦合至文档存储系统104和/或电子邮件系统106的计算机,所述一个或多个网络诸如局域网(LAN)或者广域网(WAN)诸如互联网。例如,客户端设备102可以是桌面型计算设备、膝上型计算设备、平板型计算设备、移动电话计算设备、用户的车辆的计算设备(例如,车载通信系统、车载娱乐系统、车载导航系统)或者包括计算设备的用户的可穿戴装置(例如,具有计算设备的用户的手表、具有计算设备的用户的眼镜)。可以提供附加和/或替选的客户端设备。客户端设备102通常包括一个或多个应用以促进提交搜索查询以及通过网络发送和接收数据。例如,客户端设备102可以执行允许用户制定搜索查询并且将查询提交给文档存储系统104和/或电本文档来自技高网...

【技术保护点】
1.一种计算机实现的方法,包括:在私有搜索查询以及对应的搜索后活动的搜索日志内,识别所述私有搜索查询中所包含的满足隐私准则的多个非私有n‑gram;基于所述多个非私有n‑gram,从所述搜索日志生成多个查询模式;从所述搜索日志确定与所述多个查询模式中的每一个相关联的聚合搜索活动统计,其中,与每个查询模式相关联的聚合搜索活动统计指示与所述搜索日志中匹配所述查询模式的多个私有搜索查询相关联的搜索活动;以及响应于确定针对给定查询模式的聚合搜索活动统计满足性能准则,至少部分地基于与所述给定查询模式相关联的聚合搜索活动统计,对响应于匹配所述给定查询模式的搜索查询而呈现的查询建议或搜索结果进行排名。

【技术特征摘要】
【国外来华专利技术】2015.11.24 US 14/950,0521.一种计算机实现的方法,包括:在私有搜索查询以及对应的搜索后活动的搜索日志内,识别所述私有搜索查询中所包含的满足隐私准则的多个非私有n-gram;基于所述多个非私有n-gram,从所述搜索日志生成多个查询模式;从所述搜索日志确定与所述多个查询模式中的每一个相关联的聚合搜索活动统计,其中,与每个查询模式相关联的聚合搜索活动统计指示与所述搜索日志中匹配所述查询模式的多个私有搜索查询相关联的搜索活动;以及响应于确定针对给定查询模式的聚合搜索活动统计满足性能准则,至少部分地基于与所述给定查询模式相关联的聚合搜索活动统计,对响应于匹配所述给定查询模式的搜索查询而呈现的查询建议或搜索结果进行排名。2.根据权利要求1所述的计算机实现的方法,其中,在所述搜索日志内以满足频率阈值的频率出现的n-gram满足所述隐私准则。3.根据权利要求1所述的计算机实现的方法,其中,在所述搜索日志内出现至少最小次数的n-gram满足所述隐私准则。4.根据权利要求1所述的计算机实现的方法,其中,所述生成包括基于所述私有搜索查询当中所述非私有n-gram出现的频率来生成所述非私有n-gram的直方图。5.根据权利要求1所述的计算机实现的方法,其中,与所述多个查询模式中的每一个相关联的聚合搜索活动统计包括所述搜索日志中匹配该查询模式的搜索查询的总数。6.根据权利要求1所述的计算机实现的方法,其中,与所述多个查询模式中的每一个相关联的聚合搜索活动统计包括所述搜索日志中匹配该查询模式的不同的搜索查询的数目。7.根据权利要求1所述的计算机实现的方法,其中,与所述给定查询模式相关联的聚合搜索活动统计包括:关于与所述搜索日志中匹配所述给定查询模式的多个私有搜索查询相关联的搜索后活动的聚合统计。8.根据权利要求7所述的计算机实现的方法,其中,与所述给定查询模式相关联的聚合搜索后活动统计包括与所述给定查询模式相关联的点击位置统计。9.根据权利要求7所述的计算机实现的方法,其中,与所述给定查询模式相关联的聚合搜索后活动统计包括与所述给定查询模式相关联的点击率。10.根据权利要求7所...

【专利技术属性】
技术研发人员:麦克·本德斯基唐纳德·梅茨勒马克·亚历山大·纳约尔克多尔·纳韦弗拉德·帕纳伊特王选会
申请(专利权)人:谷歌有限责任公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1