当前位置: 首页 > 专利查询>脸谱公司专利>正文

使用深度学习模型识别实体制造技术

技术编号:19076001 阅读:23 留言:0更新日期:2018-09-29 17:56
在一个实施方式中,一种方法包括访问在社交网络系统中的用户已经交互的第一组实体、以及第二组实体。使用深度学习模型确定第一组实体的第一组矢量表示。从第一组实体中选择目标实体,并且从第一组中移除目标实体的矢量表示。将第一组中的其余矢量表示结合以确定用户的矢量表示。使用深度学习模型确定第二组实体的第二组矢量表示。计算在用户与目标实体和第二组实体中的实体的每一个之间的相似性评分。使用深度学习模型基于相似性评分更新第二组实体中的实体的矢量表示。

【技术实现步骤摘要】
【国外来华专利技术】使用深度学习模型识别实体
本公开总体上涉及训练深度学习模型。
技术介绍
深度学习是一种机器学习,可以涉及在受监督或无监督的环境中训练模型。可以对深度学习模型进行训练以学习数据表示。作为实例而并非以限制的方式,深度学习模型可以将数据表示为强度值的矢量。可以在数据分类中使用深度学习模型。分类可以涉及通过训练深度学习模型来确定数据点属于一组类别中的哪一种。
技术实现思路
在具体实施方式中,社交网络系统可以使用深度学习模型来预测用户的相关实体。深度学习模型可以被训练成将实体映射为矢量表示。可以基于用户在社交网络系统中已经交互的一组实体来确定该用户的矢量表示。在具体实施方式中,目标实体可以从用户已经交互的该组实体中被选择并移除。在该组实体中的其余实体的矢量表示可以结合来得到该用户的矢量表示。可以使用目标实体作为监督信号来训练深度学习模型。可以使用深度学习模型来确定该用户尚未交互的实体的矢量表示。实体或该用户的嵌入可以基于相应的矢量表示来确定,其可以对应于多维嵌入空间中的点的坐标。该嵌入可以是实体或用户在嵌入空间中的表示。嵌入空间可以包括一个或多个用户嵌入以及多个实体嵌入。这些用户和实体的嵌入可以用于完成任何数量的合适任务。作为实例而并非以限制的方式,社交网络系统可以使用搜索算法来识别用户尚未交互的、所具有的嵌入在嵌入空间中接近用户嵌入的一个或多个实体。社交网络系统可以确定所识别的实体与用户相关。在具体实施方式中,所识别的实体可以作为推荐发送至用户的客户端系统。所识别的实体可以在客户端系统上运行的应用界面上作为建议显示给用户(例如,与该社交网络系统关联的消息发送平台或应用)。用户可以从所识别的实体的组中选择一个或多个实体,并且作为实例而并非以限制的方式,所选择的实体可以将用户链接至由该社交网络系统承载的应用中的另一个页面。在具体实施方式中,实体可以被识别(例如,响应于包括用户的搜索查询)并且可以具有在嵌入空间中接近用户嵌入的嵌入(例如,所识别的实体可以与用户相关)。可以将具有靠近用户的嵌入的对应嵌入的并且用户尚未交互的实体缓存或预缓存。作为实例而并非以限制的方式,所识别的实体可以对于相应的一个或多个用户进行缓存或预缓存(例如,该一个或多个用户具有的嵌入靠近所识别的实体的嵌入并且尚未与所识别的实体交互)。作为实例而并非以限制的方式,缓存或预缓存可以是在服务器侧处或在客户端侧处对于一个或多个特定用户或对于每个用户实现或执行的。缓存或预缓存可以允许实体被更快地访问。作为实例而并非以限制的方式,如果相应的用户请求实体(例如,被确定与用户相关的所识别的实体)、或者如果服务器向用户(例如,向用户的客户端系统)推送推荐(例如,所识别的实体),则这些实体可以被快速访问。通过使用所提出的方法,能够识别与特定用户相关的实体(例如,存储在计算系统(作为实例而并非以限制的方式,社交网络系统)的一个或多个数据库内的数据对象)。所识别的实体可以各自与被相应的用户(即,所识别的实体已经确定与之相关的用户)访问的概率相关联。在具体实施方式中,实体可以基于被特定用户访问的可能性超过一定的最小概率来进行选择。缓存或预缓存这样的实体有效地避免无用的缓存和/或减少数据流量和/或改善访问相应实体的速度或存取时间。在所有可能的实体(例如,数以亿计的实体)之中,这些实体只有一个子集在每次搜索中可以被发现是相关的。通过使用所提出的方法,相关实体的该子集可以被发送至客户端系统或者由客户端系统缓存或预缓存。如本文中所描述的,训练可以得到嵌入空间,与可在没有执行所提出的训练方法的情况下访问的数据相比,该嵌入空间可以被服务器、客户端系统、或任何其他合适的计算设备或平台更快地访问。相关实体(作为实例而并非以限制的方式包括被确定与用户相关(例如,与嵌入空间中接近用户嵌入的嵌入相关联)的实体)可以通过在嵌入空间中执行搜索(例如,距离搜索)来被快速地获得和/或识别。在具体实施方式中,实体的集群可以是基于所使用的相应数据库。换言之,集群可以是特定于数据库的。相关实体的集群可以是基于所提出的方法(作为实例而并非以限制的方式)对于社交网络系统的一个或多个用户来执行的。在具体实施方式中,实体、与实体相关联的信息、或两者可以作为数据对象(作为实例而并非以限制的方式)存储在一个或多个数据库或数据存储装置中。这些数据库或数据存储装置可以(作为实例而并非以限制的方式)位于一个或多个数据中心,该一个或多个数据中心可以是地理位置不同地(例如,在不同的位置、城市、国家和/或洲中)分布的。在具体实施方式中,嵌入空间可以用于预测一个或多个实体相对于社交网络系统的一个或多个特定用户、每个用户、一个或多个用户、或其任何组合的相关性,并且这些用户可以各自位于相应的地理位置内。被预测具有相关性的实体以及对应的信息可以基于所确定的相关性来存储在距离上更靠近该一个或多个用户定位的数据库中。被确定为相关的实体以及相关联的信息也可以被预缓存或缓存(作为实例而并非以限制的方式)在定位成距离上靠近该一个或多个用户或者客户端系统的地理位置的一个或多个客户端系统、一个或多个服务器、或其任何组合上。这样的实施方式有效地减少了在远程数据库和/或数据中心之间的负载和/或数据流量。这些实施方式还可以改善(例如,减少)存取时间(例如,用于访问特定实体)。在具体实施方式中,这些实体可以进一步被聚集或重新聚集。聚集可以导致更快的搜索结果(即,减少搜索时间并由此减少搜索引擎的负载)和/或跨对应的数据网络有更少的数据流量。集群可以基于其在嵌入空间中的位置或地点来跨数据存储装置存储。这种存储方案可以改善数据存取时间和/或搜索时间。作为实例而并非以限制的方式,基于其在嵌入空间中的相应位置跨数据存储装置存储实体的集群可以造成搜索引擎能够访问更少的数据存储装置,以便检索相关的结果。此外,通过聚集嵌入,从嵌入空间检索的搜索结果与从没有执行聚集的嵌入空间检索搜索结果的应用相比可以更加精确/确切,因为搜索结果可以额外地基于实体的属性并且不仅基于整体的高级别分类。客户端系统可以不必继续提交越来越细化的搜索以便为用户得到足够的搜索结果,这意味着在客户端系统与服务器之间的交互的数量和强度可以减小。此外,聚集可以提供更加多样化的搜索结果,因为来自不同集群的搜索结果可以被有意拖入搜索结果中。即便描述了特定实施方式(其中嵌入的确定是由服务器执行的),但这是通过举例的方式而非限制性地,并且客户端系统可以确定嵌入空间中的实体的嵌入的一些或全部。作为实例而并非以限制的方式,实体可以是视觉内容项,并且对视觉内容项的预处理(例如,确定视觉内容项的一个或多个属性)可以是在客户端系统上或由客户端系统执行的。用户然后可以(例如,在客户端系统的界面处)被呈现对应于视觉内容的一个或多个搜索项(例如,每个搜索项是基于视觉内容的一个或多个属性)。用户然后可以被提示来确认搜索项(例如,由客户端系统或服务器发出相应的提示)。本文中公开的实施方式仅是实例,并且本公开的范围不限于此。具体实施方式可以包括本文中公开的实施方式的部件、元件、特征、功能、操作或者步骤的全部、一些、或全无。根据本专利技术的实施方式具体地在涉及方法、存储介质、系统、和计算机程序产品的所附权利要求中公开,其中,在一种权利要本文档来自技高网...

【技术保护点】
1.一种方法,包括:通过一个或多个计算设备访问:社交网络系统的用户已经交互的在所述社交网络系统中的第一组实体,以及在所述社交网络系统中的第二组实体;通过一个或多个计算设备使用深度学习模型来确定所述第一组实体的第一组矢量表示;通过一个或多个计算设备从所述第一组实体中选择目标实体;通过一个或多个计算设备从所述第一组矢量表示中移除所述目标实体的矢量表示;通过一个或多个计算设备将所述第一组矢量表示中的其余矢量表示结合以确定所述用户的矢量表示;通过一个或多个计算设备使用所述深度学习模型来确定所述第二组实体的第二组矢量表示;通过一个或多个计算设备:通过将所述用户的矢量表示与所述目标实体的矢量表示进行对比,计算所述目标实体与所述用户之间的相似性评分,以及通过将所述用户的矢量表示与所述第二组实体中的实体的矢量表示进行对比,计算所述用户与所述第二组实体中的实体之间的相似性评分;并且通过一个或多个计算设备使用所述深度学习模型基于相似性评分来更新所述第二组实体中的一个或多个实体的矢量表示。

【技术特征摘要】
【国外来华专利技术】2015.12.30 US 14/984,9561.一种方法,包括:通过一个或多个计算设备访问:社交网络系统的用户已经交互的在所述社交网络系统中的第一组实体,以及在所述社交网络系统中的第二组实体;通过一个或多个计算设备使用深度学习模型来确定所述第一组实体的第一组矢量表示;通过一个或多个计算设备从所述第一组实体中选择目标实体;通过一个或多个计算设备从所述第一组矢量表示中移除所述目标实体的矢量表示;通过一个或多个计算设备将所述第一组矢量表示中的其余矢量表示结合以确定所述用户的矢量表示;通过一个或多个计算设备使用所述深度学习模型来确定所述第二组实体的第二组矢量表示;通过一个或多个计算设备:通过将所述用户的矢量表示与所述目标实体的矢量表示进行对比,计算所述目标实体与所述用户之间的相似性评分,以及通过将所述用户的矢量表示与所述第二组实体中的实体的矢量表示进行对比,计算所述用户与所述第二组实体中的实体之间的相似性评分;并且通过一个或多个计算设备使用所述深度学习模型基于相似性评分来更新所述第二组实体中的一个或多个实体的矢量表示。2.根据权利要求1所述的方法,进一步包括:通过一个或多个计算设备确定所述用户、所述第一组实体中的每个实体以及所述第二组实体中的每个实体的嵌入,其中:每个嵌入对应于多维嵌入空间中的一个点,所述嵌入空间包括对应于多个实体的多个点;并且每个嵌入是基于使用所述深度学习模型确定的相应矢量表示的。3.根据权利要求1所述的方法,进一步包括通过一个或多个计算设备基于相似性评分将相应排名分配给所述目标实体和所述第二组实体中的每个实体,并且其中,进一步基于所述排名更新所述第二组实体中的所述一个或多个实体的矢量表示。4.根据权利要求3所述的方法,其中,所述第二组实体中的矢量表示被更新的所述一个或多个实体中的每一个实体具有比所述目标实体的相似性评分更大的相似性评分。5.根据权利要求1所述的方法,进一步包括通过对嵌入空间应用搜索算法来将多个实体中的一个或多个实体识别为与所述用户相关,其中,与所识别的实体的一个或多个嵌入对应的点在所述嵌入空间中的与所述用户的嵌入对应的点的阈值距离内。6.根据权利要求5所述的方法,进一步包括将一个或多个所识别的实体发送给所述用户的客户端系统以用于显示给所述用户。7.根据权利要求1所述的方法,其中目标实体是随机选择的。8.根据权利要求1所述的方法,其中,所述用户未与所述社交网络系统中的所述第二组实体交互。9.根据权利要求1所述的方法,其中,所述社交网络系统包括社交图谱,所述社交图谱包括多个节点和连接所述节点的多个边线,在所述节点中的两个节点之间的每一条边线表示所述两个节点之间的单个分离度,所述节点包括:对应于所述用户的第一节点;以及各自对应于相应实体的多个第二节点。10.根据权利要求9所述的方法,其中,所述用户已经通过所述用户的社交网络动作与所述第一组实体交互,其中,所述社交网络动作是关于所述第一节点和与所述第一组实体的相应实体对应的相应第二节点来采取的。11.根据权利要求10所述的方法,其中,所述社交网络动作表示对于实体的亲密度表达。12.根据权利要求1所述的方法,其中,所述实体中的至少一个实体包括由所述社交网络系统承载的页面。13.根据权利要求1所述的方法,其中,所述矢量表示包括d维强度矢量。14.一种或多种计算机可读非暂时性存储介质,承载有软件,所述软件在被执行时能操作为:访问:社交网络系统的用户已经交互的在所述社交网络系统中的第一组实体,以及在所述社交网络系统中的第二组实体;使用深度学习模型确定所述第一组实体的第一组矢量表示;从所述第一组实体中选择目标实体;从所述第一组矢量表示中移除所述目标实体的矢量表示;将所述第一组矢量表示中的其余矢量表示结合以确定所述用户的矢量表示;使用所述深度学习模型确定所述第二组实体的第二组矢量表示;通过将所述用户的矢量表示与所述目标实体的矢量表示进行对比,计算所述目标实体与所述用户之间的相似性评分,以及通过将所述用户的矢量表示与所述第二组实体中的实体的矢量表示进行对比,计算所述用户与所述第二组实体中的实体之间的相似性评分;并且使用所述深度学习模型基于相似性评分更新所述第二组实体中的一个或多个实体的矢量表示。15.根据权利要求14所述的介质,其中,所述软件在被执行时进一步能操作为:确定所述用户、所述第一组实体中的每个实体以及所述第二组实体中的每个实体的嵌入,其中:每个嵌入对应于多维嵌入空间中的一个点,所述嵌入空间包括对应于多个实体的多个点;并且每个嵌入是基于使用所述深度学习模型确定的相应矢量表示的。16.根据权利要求14所述的介质,其中,所述软件在被执行时进一步能操作为:基于相似性评分将相应排名分配给所述目标实体和所述第二组实体中的每个实体,并且其中,进一步基于所述排名更新所述第二组实体中的所述一个或多个实体的矢量表示。17.一种系统,包括:一个或多个处理器;以及耦接至所述处理器的存储器,所述存储器包括能由所述处理器执行的指令,所述处理器在执行所述指令时能操作为:访问:社交网络系统的用户已经交互的在所述社交网络系统中的第一组实体,以及在所述社交网络系统中的第二组实体;使用深度学习模型确定所述第一组实体的第一组矢量表示;从所述第一组实体中选择目标实体;从所述第一组矢量表示中移除所述目标实体的矢量表示;将所述第一组矢量表示中的其余矢量表示结合以确定所述用户的矢量表示;使用所述深度学习模型确定所述第二组实体的第二组矢量表示;通过将所述用户的矢量表示与所述目标实体的矢量表示进行对比,计算所述目标实体与所述用户之间的相似性评分,以及通过将所述用户的矢量表示与所述第二组实体中的实体的矢量表示进行对比,计算所述用户与所述第二组实体中的实体之间的相似性评分;并且使用所述深度学习模型基于相似性评分更新所述第二组实体中的一个或多个实体的矢量表示。18.根据权利要求17所述的系统,其中,所述处理器在执行所述指令时进一步能操作为:确定所述用户、所述第一组实体中的每个实体以及所述第二组实体中的每个实体的嵌入,其中:每个嵌入对应于多维嵌入空间中的一个点,所述嵌入空间包括对应于多个实体的多个点;并且每个嵌入是基于使用所述深度学习模型确定的相应矢量表示的。19.根据权利要求17所述的系统,其中,所述处理器在执行所述指令时进一步能操作为:基于相似性评分将相应排名分配给所述目标实体和所述第二组实体中的每个实体,并且其中,进一步基于所述排名更新所述第二组实体中的所述一个或多个实体的矢量表示。20.一种计算机实现的方法,包括:通过一个或多个计算设备访问:社交网络系统的用户已经交互的在所述社交网络系统中的第一组实体,例如,存储在一个或多个数据存储装置中的第一组数据对象,以及在所述社交网络系统中的第二组实体,例如,存储在一个或多个数据存储装置中的第二...

【专利技术属性】
技术研发人员:詹森·E·韦斯顿基思·亚当斯苏米特·乔普拉
申请(专利权)人:脸谱公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1