当前位置: 首页 > 专利查询>苹果公司专利>正文

基于机器学习的搜索改进制造技术

技术编号:17202196 阅读:22 留言:0更新日期:2018-02-04 03:02
本发明专利技术公开了用于利用用户设备上本地学习的查询特征来改善从一个或多个搜索域返回至用户的搜索结果的系统和方法。搜索引擎可接收、分析和转发来自多个搜索域的查询结果并将查询结果传递给客户端设备。搜索引擎可通过分析查询结果来确定特征,为特征生成预测器,指示客户端设备使用预测器来对特征进行训练,以及向搜索引擎报告回训练进度。搜索引擎可指示第一组和第二组客户端设备分别对预测器集A和B进行训练,并将训练进度报告回搜索引擎。客户端设备可存储搜索会话上下文并在与一个或多个搜索引擎的会话之间与搜索引擎共享上下文。同步系统可在用户的多个客户端设备之间同步本地预测器。

【技术实现步骤摘要】
【国外来华专利技术】基于机器学习的搜索改进相关申请本美国专利申请根据35U.S.C.§119(e)要求以下美国专利申请的优先权,以下美国专利申请在与本公开相符的程度上通过引用并入本文中:(1)提交于2014年5月30日的标题为“MULTI-DOMAINSEARCHONACOMPUTINGDEVICE”的专利申请62/005,985(代理人案卷号4860P23595Z);本美国专利申请涉及以下专利申请,以下专利申请中每一者在与本公开相符的程度上通过引用并入本文:(1)提交于2014年5月30日的标题为“MULTI-DOMAINQUERYCOMPLETION”的专利申请62/005,996(代理人案卷号4860P22924Z);(2)提交于2014年9月30日的标题为“MULTI-DOMAINQUERYCOMPLETION”的专利申请62/005,996(代理人案卷号2486P22924);(3)提交于2014年5月30日的标题为“USEOFUSERFEEDBACKINACITATIONSEARCHINDEX”的专利申请62/006,000(代理人案卷号4860P23537Z);(4)提交于2014年9月30日的标题为“USEOFUSERFEEDBACKINACITATIONSEARCHINDEX”的专利申请62/006,000(代理人案卷号4860P23537);(5)提交于2014年5月30日的标题为“FEDERATEDSEARCH”的专利申请62/006,001(代理人案卷号4860P23848Z);(6)提交于2014年9月30日的标题为“FEDERATEDSEARCH”的专利申请62/006,001(代理人案卷号4860P23848);(7)提交于2014年8月29日的标题为“REDUCEDRESOLUTIONLOCATIONDETERMINATIONFORIMPROVEDANONYMITYOFUSERLOCATION”的专利申请62/044,176(代理人案卷号4860P24081Z);(8)提交于2014年9月30日的标题为“REDUCEDRESOLUTIONLOCATIONDETERMINATIONFORIMPROVEDANONYMITYOFUSERLOCATION”的专利申请14/502,869(代理人案卷号4860P24081);和(9)提交于2014年9月30日的标题为“MULTI-DOMAINSEARCHONACOMPUTINGDEVICE”的专利申请14/502,881(代理人案卷号4860P23595)。
本公开涉及改善响应于搜索查询而返回给用户的搜索结果的相关性的领域。
技术介绍
将查询输入到搜索引擎中的计算系统用户希望接收与用户相关的搜索结果。搜索引擎所返回的结果是否与输入查询的特定用户相关是输入查询的特定用户的主观看法。因此,搜索引擎能够采集越多关于特定用户的信息,就越有可能搜索引擎将返回与特定用户相关的结果。然而,采集关于特定用户的信息引起隐私顾虑。
技术实现思路
描述了用于通过利用客户端设备上的本地学习结合远程搜索引擎的学习来改善从本地私人信息数据库返回给用户的搜索结果和/或远程搜索引擎从一个或多个搜索域返回的结果的实施方案。本地私人数据在确定与这个特定用户相关的搜索结果的类型中非常有用。远程搜索引擎收集和存储包括许多用户的查询和与查询结果的交互的大量“众包”数据。众包数据生成旨在与大多数用户相关、但对于特定用户可能不是最相关的结果。本文公开的系统和方法能通过以基于众包数据的远程搜索引擎的学习增强客户端设备上的本地学习、并类似地以特定用户的偏好的本地学习增强远程搜索引擎学习来改善响应于查询而返回给用户的本地和远程搜索结果二者的相关性。在一个实施方案中,可通过使用传感器数据(例如客户端设备上的本地传感器,诸如GPS或WiFi接收器或环境光传感器或加速度计等等)分选或过滤搜索结果来改善本地搜索结果或远程搜索结果或这二个搜索结果的相关性。此外,在一个实施方案中,可利用客户端设备状态数据(例如哪些应用程序正在使用或者在最前面、日历事件数据、通讯录中的联系人等等)分选或过滤一个或两个搜索结果来改善这一个或两个此类搜索结果的相关性。此外,在一个实施方案中,客户端侧机器学习和服务器侧(远程)机器学习二者可利用这个两部分模型结合传感器数据(例如从所接收WiFi信号推导的位置)和客户端设备状态数据二者来改善,在所述两部分模型的两个部分处进行的这个经改善的机器学习可用于基于传感器数据和客户端设备状态数据改善结果的情境相关性。在一个实施方案中,客户端设备包括初始的一组能从用户的查询以及用户与本地和远程搜索查询结果二者的交互进行学习的一个或多个预测器。在一个实施方案中,所述初始的一组一个或多个预测器可被修改以为所述一个或多个预测器中的预测器添加特征、减少特征、或替换特征。搜索引擎还可指示客户端设备为所述初始的一组预测器添加预测器以及指示客户端设备对预测器进行学习。搜索引擎还可指示客户端用搜索引擎发送给客户端设备的另一预测器替换本地预测器。搜索引擎还可指示客户端设备修改现有预测器以为预测器训练新特征。在一个实施方案中,搜索引擎可指示客户端向搜索引擎报告回所添加、所替换、或所修改的预测器是否生成用户与之交互的搜索结果。如果对于具有多个特征的预测器,可用的数据太少,则机器学习算法可将预测器过拟合到可用数据,从而生成预测器对数据的“有噪声”(精确度较低)拟合。在一个实施方案中,客户端设备可能检测到对于特定预测器,在客户端设备上存在的数据不足够,诸如在客户端设备对于用户是新设备的时候。在此类情况下,客户端设备可减少预测器中特征的数量,使得预测器不会尝试将可用数据过拟合到预测器。本地预测器中特征的数量可被减少,诸如通过特征缩减来减少,或者本地预测器可由从远程搜索引擎接收的预测器替换,从远程搜索引擎接收的预测器与其所替换的本地预测器相比具有更少或不同的特征。客户端设备可生成大量对于用户而言私人的信息。在一个实施方案中,私人信息可被用于生成可用于确定客户端设备的用户的偏好的一个或多个本地预测器。私人信息也可用于为现有本地预测器添加一个或多个特征。在一个实施方案中,客户端设备的用户的私人信息中的至少一些可被匿名化并与远程搜索引擎共享。例如,客户端设备可生成学习到这个特定用户在冬天周末晚上在家时常常从搜索结果中选择电影的预测器。特定用户具体选择什么电影观看以及特定用户的家庭地址是私人信息,不会被发送给远程搜索引擎。然而,(通过一个或多个位置传感器确定)用户现在在家以及用户喜欢特定类型的电影诸如爱情喜剧这样的事实可被充分地匿名化,使得类型和“在家”状态可被发送给远程搜索引擎以改善搜索结果。例如,客户端设备可检测来自用户家中用户的WiFi基站的RF信号,并且那些信号的检测可用于确定用户在家,但用户的家庭地址不被提供给远程搜索引擎。经匿名化的私人信息保护了客户端设备的用户的隐私,同时改善了响应于对远程搜索引擎的查询而返回给用户的搜索结果的用户相关性。在另一个实施方案中,搜索引擎可基于从许多用户与搜索引擎交互生成的众包数据学习到的差异来生成预测器。搜索引擎也可基于从为搜索引擎提供结果的另一搜索域学习到的差异来生成预测器。例如,如本文档来自技高网
...
基于机器学习的搜索改进

【技术保护点】
一种计算机实现的方法,包括:客户端设备接收来自远程搜索引擎的响应于所述客户端设备发出的查询的查询结果;所述客户端设备分析所接收的查询结果以识别与所述查询相关的特征;所述客户端设备生成包括与所述查询相关的所述特征的预测器;所述客户端设备对于所述特征进行训练。

【技术特征摘要】
【国外来华专利技术】2015.05.26 US 14/721,9451.一种计算机实现的方法,包括:客户端设备接收来自远程搜索引擎的响应于所述客户端设备发出的查询的查询结果;所述客户端设备分析所接收的查询结果以识别与所述查询相关的特征;所述客户端设备生成包括与所述查询相关的所述特征的预测器;所述客户端设备对于所述特征进行训练。2.根据权利要求1所述的方法,还包括在分析之前:接收来自所述客户端设备上的本地数据库的响应于所述客户端设备发出的所述查询的本地查询结果;其中查询结果包括从所述远程搜索引擎接收的查询结果和从所述客户端设备上的本地数据库接收的本地查询结果二者。3.根据权利要求1所述的方法,其中生成所述预测器包括以下中的一个:修改所述客户端设备上的现有预测器以为所述现有预测器添加所识别的特征,或者用所识别的特征替换现有预测器中的特征。4.根据权利要求1所述的方法,还包括:所述客户端设备接收和存储代表所述客户端设备的用户与所述查询结果中的一者或多者的交互的用户交互数据。5.根据权利要求4所述的方法,还包括:所述客户端设备向所述远程搜索引擎传输所述用户交互数据的至少一部分。6.根据权利要求5所述的方法,还包括:所述客户端设备对传输给所述远程搜索引擎的所述交互数据的所述至少一部分匿名化。7.根据权利要求4所述的方法,其中对于所述特征进行训练包括所述客户端设备使用机器学习来确定所述查询、所述特征、以及所述用户所交互的所述查询结果中的一个或多个查询结果之间的关系。8.根据权利要求7所述的方法,还包括:所述客户端设备向所述远程搜索引擎传输代表所述机器学习的进度的数据。9.根据权利要求1所述的方法,还包括:所述客户端设备接收包括与所述查询相关的特征的预测器;所述客户端设备对于所接收的预测器中的所述特征进行训练。10.一种编程有指令的非暂态计算机可读介质,所述指令在被客户端设备上的处理系统运行时执行包括如下的操作:所述客户端设备接收来自远程搜索引擎的响应于所述客户端设备发出的查询的查询结果;所述客户端设备分析所接收的查询结果以识别与所述查询相关的特征;所述客户端设备生成包括与所述查询相关的所述特征的预测器;所述客户端设备对于所述特征进行训练。11.根据权利要求10所述的介质,其中所述查询结果包括来自所述远程搜索引擎的查询结果和来自所述客户端设备上的本地数据库的查询结果二者。12.根据权利要求10所述的介质,其中生成所述预测器包括以下中的一个:修改所述客户端设备上的现有预测器以为所述现...

【专利技术属性】
技术研发人员:J·M·霍恩科韦斯特G·卡珀尔
申请(专利权)人:苹果公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1