针对搜索结果的因素化模型和基于搜索结果的通信制造技术

技术编号:21089920 阅读:36 留言:0更新日期:2019-05-11 10:05
在示例实施例中,训练两个机器学习模型。一个被训练为输出在社交网络服务中具有成员简档的搜索者将选择潜在的搜索结果的概率。另一个被训练为输出与潜在的搜索结果相对应的成员将响应来自搜索者的通信的概率。特征可以从查询、关于搜索者的信息、以及关于与潜在的搜索结果相对应的成员的信息中提取,并且被馈送至机器学习模型。机器学习模型的输出可以被组合并且用于将搜索结果排名以返回给搜索者。

Factorized Model for Search Results and Communication Based on Search Results

【技术实现步骤摘要】
针对搜索结果的因素化模型和基于搜索结果的通信
概括而言,本公开涉及用于解决电子通信中的技术挑战的计算机技术。更加具体地,本公开涉及用于返回搜索结果的因素化机器学习模型,所述搜索结果很可能引起按照所述结果的主题而由搜索者选择以及返回通信两者。
技术介绍
互联网的崛起已经产生了两个不同但相关的现象:社交网络出现的增加,其对应的成员简档对大量的人可见,以及对接触满足严格标准的小群体的社交网络成员的期望的增加。这在招聘领域尤其显著,其中招聘人员通常试图找到具有特定资格(例如,教育、经验、技能等)的成员,并且招聘人员通常会接触具有特定资格的成员,以查明所述成员是否愿意申请招聘人员已有的工作空缺。工作征集通信(例如,由招聘人员向可能是未来的求职人员的成员发送的电子邮件)在招聘人员这一方可能会花费很多时间,尤其是当其有效地完成时。一般而言,有效的工作征集通信包括关于成员的个人化信息并且使得征集具体地针对该成员,因此使其看上去较不像对许多潜在的申请发送的群体通信,而更像招聘人员具体地将该成员定位目标。然而,招聘人员花在创建这样的工作征集通信中的时间量是有限的,并且因此在机制已就位以减少浪费这样的时间的可能性的情况下将极大地受益。然而,在确定根据计算机系统可获得的信息所测量的特定成员是否有可能响应于特定的通信时会产生技术问题,并且即使这样的确定是可行的,在确定如何利用这样的信息来减少被浪费的资源时也会产生技术问题。附图说明作为示例而非限制,在附图的图中示出了本技术的一些实施例。图1是示出了根据示例实施例的客户端-服务器系统的框图。图2是示出了与本公开的一些实施例一致的社交网络服务的功能组件的框图,其包括在本文中被称为搜索引擎的数据处理模块,以在生成和提供针对搜索查询的搜索结果时使用。图3是更加详细地示出了图2中的应用服务器模块的框图。图4是更加详细地示出了根据示例实施例的、图3中的通信回复分数搜索结果生成器308的框图。图5是示出了根据示例实施例的、用于在在线计算机系统中返回搜索结果的方法500的流程图。图6是示出了可以安装在上文所描述的设备中的任何一个或多个上的软件602的架构的框图600。图7示出了根据示例实施例的、采用计算机系统的形式的机器700的图解表示,在该机器中可以执行一组指令以使得该机器执行在本文中所讨论的方法中的任何一个或多个方法。具体实施方式概要本公开描述了个体地提供针对一个或多个机器学习算法模型的功能的方法、系统、和计算机程序产品等。在以下的描述中,出于解释的目的,阐述了许多具体细节以便提供对本公开的不同实施例的各个方面的透彻理解。然而,对本领域的熟练技术人员显而易见的是,可以在没有所有这些具体细节的情况下实践本公开。在示例实施例中,提供了一种平台,该平台利用计算机可获得的信息来馈送两个不同的机器学习模型。第一机器学习模型被训练为确定搜索者会在向他或她呈现给定的潜在的搜索结果的情况下对其进行选择的概率。第二机器学习模型被训练为确定潜在的搜索结果的主题将响应于来自搜索者的通信的概率。接着,可以组合这些概率以确定是否向搜索者呈现潜在的搜索结果,并且如果是,则确定将潜在的搜索结果在其他搜索结果中排名多高。在一些示例实施例中,可以将这些技术应用于作为与特定成员唯一相关联的成员简档或其他内容的搜索结果。例如,招聘人员可以是社交网络服务中的成员简档的搜索者。在这样的实例中,第一机器学习模型被训练为如果给定成员的简档作为搜索结果而被返回,则确定招聘人员将选择该给定成员的概率,而第二机器学习模型被训练为确定如果被联系的话,与成员简档对应的成员将响应招聘人员的概率。出于该文档的目的,社交网络服务的成员可以被称为候选者。向招聘人员呈现的搜索结果可以被称为印象。从招聘人员到候选者的通信可以被称为发送。响应于发送而从候选者到招聘人员的通信可以被称为接受。一般而言,在招聘人员/成员的情况下,所述概率可以被描述为:P(发送,接受|印象)->p(接受|发送)·p(发送|印象)在示例实施例中,可以针对要评估的每一潜在的搜索结果来创建特征向量。下文将更详细地描述特征向量的细节。特征向量被用作到第一机器学习模型和第二机器学习模型的输入以生成例如在上面公式的右侧的概率。在一些示例实施例中,这可以按照如下内容在数学上被反映:p(z=1|x)=p(z=1|x;y=1)*p(y=1|x)~=\hat{p}(z=1|x;y=1)^a*\hat{p}(y=1|x)^b其中,x是印象的特征向量,y是指示是否存在发送的二进制变量,而z是指示是否存在接受的二进制变量。p(·)表示事件的概率,\hat{p}表示p的经验估计。第二个步骤是超松弛(overrelaxation)。由于\hat{p}是不精确的近似,超松弛帮助我们减轻近似中的不精确效果。超松弛与分数概率校准一起给出了使用模型的灵活性,这可以在预测中在接收方运行特性的曲线下获得更好的区域而不是较好的交叉熵。在一些示例实施例中,alpha(a)在以下的公式中是大约0.5。因此,保留变换的顺序变成:logp(z=1|x)=a*logp(z=1|x;y=1)+b*logp(y=1|x)应该注意的是,如在该文档通篇中所使用的术语“社交”应该宽泛地被解释为覆盖服务的任何类型的在线成员分组,在该分组中可以通过该服务发送通信。这与服务的在线成员组形成对比,在上述在线成员的分组中仅通过外部方式发送了通信(例如,传统的电子邮件、电话等),并且也与一般互联网用户的分组形成对比。图1是示出了根据示例实施例的客户端-服务器系统100的框图。联网系统102经由网络104(例如,互联网或广域网(WAN))向一个或多个客户端提供服务器侧功能。例如,图1示出了在相应的客户端机器110和112上执行的网络客户端106(例如,浏览器)和程序化客户端108。应用程序接口(API)服务器114和网络服务器116耦合至一个或多个应用服务器118,并且向一个或多个应用服务器118分别提供程序化的和网络接口。应用服务器118托管一个或多个应用120。进而,示出了应用服务器118耦合至促进访问一个或多个数据库126的一个或多个数据库服务器124。尽管在图1中示出了用于形成联网系统102的一部分的应用120,但是将理解的是,在可替代的实施例中,应用120可以形成与联网系统102分离且不同的服务的部分。此外,尽管在图1中示出的客户端-服务器系统100采用客户端-服务器架构,但当然本公开不限于这样的架构,并且可以同样好地在例如分布式或对等的架构系统中发现应用。各种应用120也可以被实现为独立的软件程序,其不一定具有联网能力。网络客户端106经由由网络服务器116支持的网络接口来访问各种应用120。类似地,程序化客户端108经由由API服务器114所提供的程序化接口来访问由应用120所提供的各种服务和功能。由于具有经由由API服务器114所提供的编程化接口对联网系统102的程序化访问,因此图1还示出了在第三方服务器130上执行的第三方应用128。例如,利用从联网系统102所取回的信息,第三方应用128可以支持在由第三方托管的网站上的一个或多个特征或功能。例如,第三方网站可以提供由联网系统102的相关应用120所支持的一个或多个功能。在本文档来自技高网...

【技术保护点】
1.一种用于在在线计算机系统中返回搜索结果的系统,所述系统包括:具有存储在其上的指令的计算机可读介质,所述指令当由处理器执行时,使得所述系统执行以下操作:响应于与搜索者相对应的查询而获得多个候选者搜索结果;在社交网络服务中,获得与所述搜索者相对应的成员简档;针对来自所述多个候选者搜索结果的每个候选者搜索结果:获得与所述候选者搜索结果相对应的成员的活动和使用信息;解析所述候选者搜索结果、与所述候选者搜索结果相对应的所述成员的所述活动和使用信息、以及与所述搜索者相对应的所述成员简档,以提取第一组一个或多个特征以及第二组一个或多个特征;将所提取的第一组一个或多个特征馈送到第一机器学习模型中,所述第一机器学习模型被训练为输出具有采样成员简档的搜索者将选择潜在的搜索结果的概率;将所提取的第二组一个或多个特征馈送到第二机器学习模型中,所述第二机器学习模型被训练为输出与候选者搜索结果相对应的第一成员将响应来自搜索者的通信的概率;将所述第一机器学习模型的输出和所述第二机器学习模型的输出进行组合,以形成针对所述候选者搜索结果的组合概率;按照其对应的组合概率来将所述多个候选者搜索结果排名;以及基于该排名来返回所述多个候选者搜索结果中的一个或多个候选者搜索结果。...

【技术特征摘要】
2017.10.30 US 15/7976241.一种用于在在线计算机系统中返回搜索结果的系统,所述系统包括:具有存储在其上的指令的计算机可读介质,所述指令当由处理器执行时,使得所述系统执行以下操作:响应于与搜索者相对应的查询而获得多个候选者搜索结果;在社交网络服务中,获得与所述搜索者相对应的成员简档;针对来自所述多个候选者搜索结果的每个候选者搜索结果:获得与所述候选者搜索结果相对应的成员的活动和使用信息;解析所述候选者搜索结果、与所述候选者搜索结果相对应的所述成员的所述活动和使用信息、以及与所述搜索者相对应的所述成员简档,以提取第一组一个或多个特征以及第二组一个或多个特征;将所提取的第一组一个或多个特征馈送到第一机器学习模型中,所述第一机器学习模型被训练为输出具有采样成员简档的搜索者将选择潜在的搜索结果的概率;将所提取的第二组一个或多个特征馈送到第二机器学习模型中,所述第二机器学习模型被训练为输出与候选者搜索结果相对应的第一成员将响应来自搜索者的通信的概率;将所述第一机器学习模型的输出和所述第二机器学习模型的输出进行组合,以形成针对所述候选者搜索结果的组合概率;按照其对应的组合概率来将所述多个候选者搜索结果排名;以及基于该排名来返回所述多个候选者搜索结果中的一个或多个候选者搜索结果。2.根据权利要求1所述的系统,其中,所述指令还使得所述系统执行以下操作:取回所述社交网络服务的成员的多个采样成员简档、多个采样成员标签、以及与由这些成员在所述社交网络服务上采取的动作有关的活动和使用信息;针对所述多个采样成员简档中的第一采样成员简档和第二采样成员简档的每个组合:解析所述第一采样成员简档、所述第二采样成员简档、以及与由这些成员在所述社交网络服务上采取的动作有关的所述活动和使用信息,以提取第三组一个或多个特征和第四组一个或多个特征;将采样成员标签和所提取的第三组特征馈送到第一机器学习算法中,以训练所述第一机器学习模型输出具有所述第二采样成员简档的搜索者将选择与所述第一采样成员简档相对应的潜在的搜索结果的概率;以及将采样成员标签和所提取的第四组特征馈送到第二机器学习算法中,以训练所述第二机器学习模型输出与所述第一采样成员简档相对应的成员将响应来自具有所述第二采样成员简档的搜索者的通信的概率。3.根据权利要求1所述的系统,其中,所述第一组特征与所述第二组特征是相同的。4.根据权利要求2所述的系统,其中,所述第三组特征与所述第四组特征是相同的。5.根据权利要求1所述的系统,其中,所述将输出进行组合包括将分别的权重应用至所述第一机器学习模型的所述输出和所述第二机器学习模型的所述输出。6.根据权利要求5所述的系统,其中,所述权重是基于关于所述搜索者的信息而动态地确定的。7.根据权利要求5所述的系统,其中,所述权重是使用第三机器学习算法来确定的。8.一种用于在在线计算机系统中返回搜索结果的计算机实现的方法,所述方法包括:响应于与搜索者相对应的查询而获得多个候选者搜索结果;在社交网络服务中,获得与所述搜索者相对应的成员简档;针对每个候选者搜索结果:获得与所述候选者搜索结果相对应的成员的活动和使用信息;解析所述候选者搜索结果、与所述候选者搜索结果相对应的所述成员的所述活动和使用信息、以及与所述搜索者相对应的所述成员简档,以提取第一组一个或多个特征以及第二组一个或多个特征;将所提取的第一组一个或多个特征馈送到第一机器学习模型中,所述第一机器学习模型被训练为输出具有采样成员简档的搜索者将选择潜在的搜索结果的概率;将所提取的第二组一个或多个特征馈送到第二机器学习模型中,所述第二机器学习模型被训练为输出与候选者搜索结果相对应的第一成员将响应来自搜索者的通信的概率;将所述第一机器学习模型的输出和所述第二机器学习模型的输出进行组合,以形成针对所述候选者搜索结果的组合概率;按照其对应的组合概率来将所述多个候选者搜索结果排名;以及基于该排名来返回所述多个候选者搜索结果中的一个或多个候选者搜索结果。9.根据权利要求8所述的方法,还包括:取回所述社交网络服务的成员的多个采样成...

【专利技术属性】
技术研发人员:郭奇胡泊吴显仁A·R·奈尔周山L·G·科特尔三世
申请(专利权)人:微软技术许可有限责任公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1