用于改进数字内容推荐的实体表示学习制造技术

技术编号:22295500 阅读:51 留言:0更新日期:2019-10-15 04:39
计算机配置为改进内容推荐。例如,机器访问表示职位描述与成员简档之间的亲和度的第一得分。基于表示职位描述的第一嵌入以及表示成员简档的第二嵌入生成第一得分,并且第一嵌入包括标识与职位描述相关联的组织的特征。基于第一得分超过第一阈值,机器使得在用户接口中显示职位描述的推荐。该机器基于对职位描述的选择的指示,生成表示与该组织相关联的文章的第三嵌入。该机器生成表示成员简档‑职位亲和度的第二得分,并且基于第二得分超过第二阈值,使得在用户接口中显示该文章的推荐。

Entity Representation Learning for Improving Digital Content Recommendation

【技术实现步骤摘要】
用于改进数字内容推荐的实体表示学习
本申请一般涉及用于改进数字内容推荐的实体表示学习的系统、方法和计算机程序产品。
技术介绍
一些个性化搜索涉及针对可能结果的语料库分析用户特征以找到针对用户的最佳选项。例如,职位搜索可以根据他们的背景、教育、经验等为不同的用户生成不同的结果。有时,发现用户之间的相似性是有帮助的,因为如果用户已经表现出对一个职位感兴趣,则具有类似特征的用户也可能对该职位同样感兴趣。然而,在线系统的用户数量可以是数百万,并且与用户相关联的数据类别(例如,教育机构、当前职位等)也可以达数千或数百万。鉴于大量数据和可能的类别,在所有这些用户之间发现相似性可能是计算上昂贵的提议,从而导致执行搜索的计算机系统的电子资源的过度消耗的技术问题。附图说明一些实施例在附图中通过示例而不是限制的方式示出,其中:图1是示出根据一些示例实施例的客户端-服务器系统的网络图;图2示出了根据一些示例实施例的机器学习程序的训练和使用;图3是示出根据一些示例实施例的由机器学习系统生成的文章嵌入的框图;图4是示出根据一些示例实施例的用于由机器学习系统确定成员-文章亲和度的深度网络的框图;图5是示出根据一些示例实施例的用于由机器学习系统确定成员-职位亲和度的深度网络的框图;图6是示出根据一些示例实施例的机器学习系统的组件的框图;图7是示出根据一些示例实施例的用于改进数字内容推荐的实体表示学习的方法的流程图;图8是示出根据一些示例实施例的用于改进数字内容推荐的实体表示学习的方法以及表示图7中所示的方法的附加步骤的流程图;图9是示出根据一些示例实施例的用于改进数字内容推荐的实体表示学习的方法以及更详细地表示步骤702以及表示图7中所示的方法的附加步骤的流程图;图10是示出根据一些示例实施例的用于改进数字内容推荐的实体表示学习的方法并且表示图9中所示的方法的附加步骤的流程图;图11是示出根据一些示例实施例的用于改进数字内容推荐的实体表示学习的方法并且更详细地表示图9中所示的方法的步骤708、908和710的流程图;图12是示出根据一些示例实施例的用于改进数字内容推荐的实体表示学习的方法的流程图;以及图13是示出根据一些示例实施例的能够从机器可读介质读取指令并执行本文所讨论的任何一种或多种方法的机器的组件的框图。具体实施方式描述了用于改进数字内容推荐的实体表示学习的示例方法和系统。在以下描述中,出于解释的目的,阐述了许多具体细节以提供对示例实施例的透彻理解。然而,对于本领域技术人员显而易见的是,可以在没有这些具体细节的情况下实践本主题。此外,除非另外明确说明,否则组件和功能是可选的并且可以组合或细分,并且操作可以按顺序变化或者组合或细分。诸如在线文章之类的数字内容在在线服务的多个途径中无处不在-作为旗舰馈送、兴趣馈送、电子邮件、通知和其他产品的一部分。在线服务的示例是社交网络服务(例如,专业网络服务)。尽管社交网络服务上的数字内容项目无处不在,但是对于特定用户的兴趣存在有限的内容个性化。通常,仅将与数字内容相关联的基本内容特征用于确定应向特定用户显示哪些数字内容项的模型(下文中也称为“社交网络服务的成员”或“成员”)。例如,在诸如社交网络服务(以下也称为“SNS”)之类的在线服务的馈送中提供的文章基于文章的全球流行度或者基于成员与文章作者或共享文章的其他成员的社交亲和度被排名并显示给SNS的成员。在一些示例实施例中,信息的相关性是改进推荐并在社交网络服务(以下也称为“SNS”)(例如Linkedin)处提供更具参与性的用户体验的重要因素。通过向用户提供相关信息而增强的应用的示例是馈送排名、职位推荐、人物搜索、职位搜索、内容搜索、招聘人员搜索以及您可能知道的人(以下也称为“PYMK”)。跨多个这样的应用共享的某些关键数据特征(下文中也称为“属性”)被重复用于训练机器学习模型。在机器学习中,特征是个体可测量的特性或被观察现象的特点。例如,在特定SNS的上下文中,成员简档、职位描述和数字内容(例如文章)是SNS生态系统的三个关键组成部分。成员和职位特征是机器学习模型的输入,用于识别用户可能感兴趣的职位,或促进职位搜索。根据另一示例,成员和文章特征是机器学习模型的输入,其为用户标识相关文章,并促进馈送中的内容推荐。在一些示例实施例中,机器学习系统以集中方式存储各种类型的实体嵌入(例如,成员嵌入、职位描述嵌入、文章嵌入等),这增强了跨多个各种应用的机器学习模型的构建。包含在一些实体嵌入中的信息可以在其他实体嵌入之间共享,这进而使得能够将与某些实体有关的信息(例如,成员简档、职位申请、文章、公司、行业、兴趣集群、技能等)与解决与其他实体有关的问题的各种机器学习模型共享。例如,在你可能感兴趣的工作(以下也称为“JYMBII”)应用的上下文中,使用深度学习方法,可以使用反向传播训练一个或多个机器学习模型来生成(例如,开发,构建,更新等)针对成员和职位的不同类型的监督式潜在表示(下文中也称为“嵌入”)(例如,通过构建利用成员和职位嵌入的深和宽模型)。类似地,在文章推荐问题的上下文中,可以训练一个或多个机器学习模型以生成成员和文章潜在表示。取决于用户(例如,SNS的成员)看到的数字内容的量,用户的潜在表示(例如,表示成员的成员简档的嵌入和/或呈现给成员的内容和/或成员采取的行动)可能不是很准确。如果用户是活跃的求职者,则一个或多个机器学习模型可以从JYMBII应用程序生成成员的合理准确的潜在表示,然后其可以用于初始化用于文章推荐任务的模型(或用于对文章推荐任务进行评分)以便于识别讨论与用户已申请的职位相关联的公司的在线文章。附加地或替代地,在职位推荐问题的上下文中,可以使用成员潜在表示和文章潜在表示来训练一个或多个机器学习模型,以基于用户读取的文章来识别用户感兴趣的目标公司,其中文章讨论目标公司。一个或多个机器学习模型还可以识别与用户相关的职位描述,并且可以生成对用户的相关职位描述的推荐。在各种示例实施例中,使用深度学习模型中的表达特征来理解内容以及用户对内容的偏好不仅为用户提供更丰富的体验,而且还增强了用于数字内容处理和理解的机器学习工具。此外,内容表示学习提高了数据处理效率和数据存储。深度学习是指用于通过使用多层神经网络生成复杂数据变换和抽象来对响应建模的一类技术。深度学习可以支持大量应用程序,范围包括响应预测,特征生成,自然语言理解,语音或图像识别以及理解。当机器学习系统在特定上下文中向用户推荐数字内容项(例如,文章、职位描述、歌曲、电影等)时,可以使用深度学习技术来建模用户的响应。用于内容推荐的上下文的示例包括馈送建模、链接预测、职位搜索等。用户对数字内容项或数字内容推荐的响应通常是数字内容项与用户的兴趣、上下文或数字内容的呈现时间的相关性的函数。许多相关性问题旨在为用户识别、预测或搜索某物,诸如在SNS上找到社交连接,找到将使用户感兴趣的职位、文章或广告。在一些示例实施例中,相关性基于用户特征和一种或多种类型的相似性帮助识别适合于用户的事物。例如,职位搜索引擎可以找到对于用户感兴趣的职位,因为“类似”用户已经探索了这些职位。然而,发现用户之间、用户和职位之间、用户和文章之间、用户和广告之间等的相似性是复杂的问题,尤其是在可本文档来自技高网...

【技术保护点】
1.一种方法,包括:从数据库访问表示在线服务上的职位描述和与所述在线服务的成员相关联的成员简档之间的亲和度的第一亲和度得分值,所述第一亲和度得分值是基于第一嵌入和第二嵌入使用一个或多个机器学习算法生成的,所述第一嵌入表示所述职位描述,并且包括标识与所述职位描述相关联的组织的特定特征,所述第二嵌入表示所述成员简档;基于所述第一亲和度得分值超过第一阈值,使得在与所述成员相关联的客户端设备的用户接口中显示所述职位描述的第一推荐;基于从所述客户端设备接收的、响应于所述第一推荐对所述职位描述的选择的指示,更新所述第二嵌入以将所述特定特征添加到所述第二嵌入;基于响应于所述第一推荐对所述职位描述的所述选择的所述指示,生成第三嵌入,所述第三嵌入表示与所述组织相关联的文章,并且包括标识所述组织的所述特定特征,对所述第三嵌入的所述生成是使用一个或多个硬件处理器执行的;使用所述一个或多个机器学习算法,基于更新的第二嵌入和所述第三嵌入,生成表示所述成员简档与所述文章之间的亲和度的第二亲和度得分值;以及基于所述第二亲和度得分值超过第二阈值,使得在与所述成员相关联的所述客户端设备的所述用户接口中显示所述文章的第二推荐。...

【技术特征摘要】
2018.03.30 US 15/941,7501.一种方法,包括:从数据库访问表示在线服务上的职位描述和与所述在线服务的成员相关联的成员简档之间的亲和度的第一亲和度得分值,所述第一亲和度得分值是基于第一嵌入和第二嵌入使用一个或多个机器学习算法生成的,所述第一嵌入表示所述职位描述,并且包括标识与所述职位描述相关联的组织的特定特征,所述第二嵌入表示所述成员简档;基于所述第一亲和度得分值超过第一阈值,使得在与所述成员相关联的客户端设备的用户接口中显示所述职位描述的第一推荐;基于从所述客户端设备接收的、响应于所述第一推荐对所述职位描述的选择的指示,更新所述第二嵌入以将所述特定特征添加到所述第二嵌入;基于响应于所述第一推荐对所述职位描述的所述选择的所述指示,生成第三嵌入,所述第三嵌入表示与所述组织相关联的文章,并且包括标识所述组织的所述特定特征,对所述第三嵌入的所述生成是使用一个或多个硬件处理器执行的;使用所述一个或多个机器学习算法,基于更新的第二嵌入和所述第三嵌入,生成表示所述成员简档与所述文章之间的亲和度的第二亲和度得分值;以及基于所述第二亲和度得分值超过第二阈值,使得在与所述成员相关联的所述客户端设备的所述用户接口中显示所述文章的第二推荐。2.如权利要求1所述的方法,其中,所述职位描述、所述成员简档和所述文章是与所述在线服务相关联的实体,并且其中,所述方法还包括:更新一个或多个其它嵌入,所述一个或多个其它嵌入表示与所述在线服务相关联的一个或多个其它实体,更新所述一个或多个其他嵌入包括将包括在所述第一嵌入、所述第二嵌入或所述第三嵌入中的至少一个中的一个或多个其他特征添加到所述一个或多个其他嵌入中,更新所述一个或多个其他嵌入基于响应于所述第一推荐对所述职位描述的所述选择的所述指示或者从所述客户端设备接收的响应于所述第二推荐对所述文章的选择的指示中的至少一个。3.如权利要求1所述的方法,其中,所述一个或多个机器学习算法涉及向所述在线服务的一个或多个成员推荐职位描述或向所述在线服务的所述一个或多个成员推荐文章中的至少一个,其中,所述第一嵌入包括第一特征向量,所述第一特征向量包括表示所述职位描述的第一组特征,所述特定特征包含在所述第一组特征中,其中,所述第二嵌入包括第二特征向量,所述第二特征向量包括表示所述成员简档的第二组特征,以及其中,所述方法还包括:基于所述成员的查看与所述组织相关联的多个职位描述的多个选择来确定所述成员是所述组织处的职位的活跃求职者;以及进一步更新所述第二嵌入以向所述第二嵌入添加另一特征,所述另一特征指示所述成员是所述组织处的职位的活跃求职者;以及使用所述第一嵌入、进一步更新的第二嵌入和所述一个或多个机器学习算法,训练亲和度特征模型,所述训练包括基于所述第一特征向量和所述第二特征向量生成与所述职位描述和所述成员简档之间的亲和度有关的第一组附加特征。4.如权利要求3所述的方法,其中,所述亲和度特征模型预测所述成员将选择所述职位描述的第一可能性或所述成员将选择所述文章的第二可能性中的至少一个。5.如权利要求3所述的方法,还包括:更新所述第一嵌入或所述第三嵌入中的至少一个,以将所述另一特征添加到所述第一嵌入或所述第三嵌入中的所述至少一个;以及使用更新的第一嵌入或更新的第三嵌入中的至少一个来执行对所述亲和度特征模型的进一步训练。6.如权利要求5所述的方法,其中,生成表示所述成员简档与所述文章之间的亲和度的第二亲和度得分值是基于使用更新的第一嵌入、更新的第二嵌入或更新的第三嵌入中的至少一个来训练所述亲和度特征模型的。7.如权利要求3所述的方法,其中,所述第三嵌入包括第三特征向量,所述第三特征向量包括表示与所述组织相关联的所述文章的第三组特征,所述特定特征包含在所述第三组特征中,其中,对所述亲和度特征模型的所述训练包括:将成员-文章亲和度层添加到所述亲和度特征模型,以基于所述第二特征向量和所述第三特征向量生成与所述成员简档和所述文章之间的亲和度有关的第二组附加特征,将所述成员-文章亲和度层添加到所述亲和度特征模型包括对所述第二特征向量和所述第三特征向量执行Hadamard乘积运算,Hadamard乘积的所述执行导致生成包括所述第二组附加特征的第四特征向量,以及其中,所述第二亲和度得分值是基于包括所述第二组附加特征的所述第四特征向量生成的。8.如权利要求1所述的方法,其中,所述第一推荐是基于欧几里德距离值、使用所述职位描述的最近邻表示来生成的。9.如权利要求1所述的方法,其中,所述第二推荐是基于欧几里德距离值、使用所述文章的最近邻表示来生成的。10.如权利要求1所述的方法,其中,所述第一嵌入、所述第二嵌入和所述第三嵌入存储在集中位置,所述存储在所述集中位置提供一个或多个推荐应用程序对所述第一嵌入、所述第二嵌入和所述第三嵌入的可访问性,以及在所述一个或多个推荐应用程序之间的、嵌入数据的共享。11.一种系统,包括:一个或多个硬件处理器;以及用于存储指令的非暂时性机器可读介质,所述指令当由所述一个或多个硬件处理器执行时,使得所述一个或多个硬件处理器执行包括以下的操作:从数据库访问表示在线服务上的文章和与所述在线服务的成员相关联的成...

【专利技术属性】
技术研发人员:A·萨哈A·穆拉里达兰
申请(专利权)人:微软技术许可有限责任公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1