使用异构社交网络的图形框架制造技术

技术编号:19878369 阅读:24 留言:0更新日期:2018-12-22 17:58
在示例实施例中,监督机器学习算法被用于基于从社交联网服务成员简档和活动及使用信息提取的特征的第一集合和特征的第二集合来训练通信回复分数模型。当要显示多个成员搜索结果时,对于在多个成员搜索结果中的每一个中标识的成员,解析与该成员相对应的成员简档以从成员简档中提取一个或多个特征的第三集合,解析与成员在社交联网服务上采取的动作有关的活动及使用信息以提取一个或多个特征的第四集合,并且将提取的特征的第三集合和特征的第四集合输入到通信回复分数模型中以生成通信回复分数,可以将所述通信回复分数可视地显示给搜索者。

【技术实现步骤摘要】
【国外来华专利技术】使用异构社交网络的图形框架相关申请的交叉引用本国际申请要求2016年2月23日提交的题为“GRAPHFRAMEWORKUSINGHETEROGENEOUSSOCIALNETWORKS”的美国专利申请序列号15/051,579的优先权,其全部内容通过引用整体并入本文。
本公开总体上涉及用于解决在电子通信中的技术挑战的计算机技术。更具体地,本公开涉及在线网络成员的通信回复分数的计算。
技术介绍
互联网已经引起了两个迥然不同的现象:社交网络的存在和对于大量人可见的其相对应的成员简档在增长,以及在线企业交易在增长。这些在线企业交易不仅包括消费者购买(企业对消费者),而且包括企业购买(企业对企业)。对于企业对企业交易,对涉及那些公司的事件执行准确预测可能具有挑战性。这些问题被称为公司级预测问题。例如,第一企业可以是第二企业的重购客户,但可能难以预测第一企业是否可以选择停止从第二企业购买(称为“流失”)。尽管事实上这些公司级预测问题本质上通常是二元的(即,预测的结果为是或否)。传统上,使用机器学习技术解决公司级预测问题。可以将传统分类器应用于使用公司级特征的决策树。该方法的问题在于结果很大程度上取决于训练数据的数量。如果尝试针对一百万家企业的预测,我们所知道的已经流失(并且可以被标记为“流失者”)的仅一千家企业的数据训练导致不准确的预测。因此,机器学习技术至少在训练数据也不可扩展的范围内是不可扩展的。附加地,在这些技术中使用的特征与被检查的公司无关。这忽略了与其他公司的关系以及雇员之间的关系。附图说明在附图的图中,通过示例而非限制的方式图示出了本技术的一些实施例。图1是图示出根据示例实施例的客户端-服务器系统的框图。图2是示出符合本公开的一些实施例的社交联网服务的功能组件的框图,该社交联网服务包括在本文中被称为搜索引擎的数据处理模块,用于生成和提供搜索查询的搜索结果。图3是更详细地图示出图2的应用服务器模块的框图。图4是图示出根据示例实施例的使用社交网络信息构造异构图以便解决预测问题的方法的流程图。图5是图示出根据示例实施例的针对给定问题创建的示例异构网络的图。图6是图示出根据示例实施例的标签传播算法的流程图。图7是根据示例实施例的示例仅实体图。图8是图示出可与本文所描述的各种硬件架构结合使用的代表性软件架构的框图。图9是图示出根据一些示例实施例的能够从机器可读介质(例如,机器可读存储介质)读取指令并且执行本文讨论的任何一个或多个方法的机器的组件的框图。具体实施方式概述除其他内容外,本公开描述了独立地提供用于加快数据访问的功能性的方法、系统和计算机程序产品。在以下描述中,为了解释的目的,阐述了许多具体细节以便提供对本公开的不同实施例的各种方面的透彻理解。然而,对于本领域技术人员来说将显而易见的是,可以在没有所有具体细节的情况下实践本公开。在示例实施例中,通过首先将实体之间的连接建模为节点的异构网络来计算对实体的预测。节点的异构网络是其中存在多个不同节点类型和多个不同连接类型的异构网络。然后,定义元路径以连接相关实体。计算元路径的权重。然后,组合不同元路径的权重以生成仅实体图。然后,在仅实体图上运行标签传播算法以获得预测结果。图1是图示出根据示例实施例的客户端-服务器系统100的框图。联网系统102经由网络104(例如,互联网或广域网(WAN))向一个或多个客户端提供服务器侧功能性。图1图示出了例如在各个客户端机器110和112上执行的web客户端106(例如,浏览器)和编程客户端108。应用程序接口(API)服务器114和web服务器116被耦合到一个或多个应用服务器118,并分别向一个或多个应用服务器118提供编程接口和web接口。(多个)应用服务器118托管一个或多个应用120。(多个)应用服务器118进而被示为耦合到促进访问一个或多个数据库126的一个或多个数据库服务器124。尽管图1中示出了(多个)应用120形成联网系统102的一部分,但将意识到,在可替代实施例中,(多个)应用120可以形成与联网系统102分开且不同的服务的一部分。此外,尽管图1中示出的客户端-服务器系统100采用客户端-服务器架构,但本公开当然不限于这样的架构,并且例如可以同样很好地在分布式或对等架构系统中找到应用。各种应用120也可以被实现为不一定具有联网能力的单独的软件程序。web客户端106经由web服务器116所支持的web接口来访问各种应用120。类似地,程序客户端108经由API服务器114所提供的编程接口来访问由(多个)应用120所提供的各种服务和功能。图1还将在第三方服务器130上执行的第三方应用128图示为,经由API服务器114所提供的编程接口对联网系统102进行编程访问。例如,第三方应用128可以利用从联网系统102检索的信息来支持由第三方托管的网站上的一个或多个特征或功能。例如,第三方网站可以提供由联网系统102的(多个)相关应用120支持的一个或多个功能。在一些实施例中,本文涉及的任何网站可以包括可在多种设备上显现的在线内容,所述设备包括但不限于台式个人计算机(PC)、膝上型设备和移动设备(例如,平板计算机、智能手机等)。为此,用户可以采用这些设备中的任何设备来使用本公开的特征。在一些实施例中,用户可以使用移动设备(机器110、112和第三方服务器130中的任何一个可以是移动设备)上的移动小应用(app)来访问和浏览在线内容,诸如本文公开的在线内容中的任何一个。移动服务器(例如,API服务器114)可以与移动app和(多个)应用服务器118进行通信,以便使本公开的特征在移动设备上可用。在一些实施例中,联网系统102可以包括社交联网服务的功能组件。图2是示出符合本公开的一些实施例的社交联网服务的功能组件的框图,该社交联网服务包括在本文中被称为搜索引擎216的数据处理模块,用于生成和提供搜索查询的搜索结果。在一些实施例中,搜索引擎216可以驻留在图1中的(多个)应用服务器118上。然而,设想到,其他配置也在本公开的范围内。如图2中所示,前端可以包括用户接口模块(例如web服务器116)212,该用户接口模块接收来自各种客户端计算设备的请求并将适当的响应传送给请求的客户端设备。例如,(多个)用户接口模块212可以接收以超文本传输协议(HTTP)请求或其他基于web的API请求的形式的请求。附加地,可以提供成员交互检测模块213以检测成员与不同应用120、服务和所呈现的内容的各种交互。如图2中所示,在检测到特定交互后,成员交互检测模块213在成员活动和行为数据库222中记入包括交互类型和与交互相关的任何元数据的交互。应用逻辑层可以包括一个或多个各种应用服务器模块214,其与(多个)用户接口模块212结合生成具有从数据层中的各种数据源检索的数据的各种用户接口(例如,web页面)。在一些实施例中,独立的应用服务器模块214被用于实现与由社交联网服务提供的各种应用120和/或服务相关联的功能性。如图2中所示,数据层可以包括若干数据库,诸如用于存储简档数据的简档数据库218,所述简档数据包括各种组织(例如公司、学校等)的简档数据和成员简档数据两者。与一些实施例一致,当一个人初始地注册成为社交联网服务的成员时,本文档来自技高网...

【技术保护点】
1.一种计算机实现的方法,用于使用节点的异构网络来解决预测问题,所述方法包括:获得社交网络信息;至少部分地基于所述社交网络信息构造表示节点的异构网络的图,所述图包括多个不同类型的节点和多个不同类型的节点之间的边;定义多个不同的元路径类型,每个元路径类型包括一种不同类型的节点之间的边;基于所述预测问题确定要比较的一对或多对节点;对于要比较的一对或多对节点中的每一对:向相应对的多个不同元路径类型中的每一个元路径类型指派强度,所述强度基于在所述图中在相应对中的节点之间的相应元路径类型的不同路径的计数;以及将指派给所述相应对的多个不同元路径类型中的每一个元路径类型的强度组合成用于所述相应对的连接的统一强度;构造仅实体图,所述仅实体图的节点仅表示要比较的一对或多对节点中的节点,并且使边各自指派用于所述相应对的连接的统一强度;以及在所述仅实体图上运行标签传播算法以解决所述预测问题,所述标签传播算法将分数指派给所述仅实体图中的每个节点,所述分数指示相应实体对由所述预测问题提出的疑问将具有肯定结果的可能性。

【技术特征摘要】
【国外来华专利技术】2016.02.23 US 15/0515791.一种计算机实现的方法,用于使用节点的异构网络来解决预测问题,所述方法包括:获得社交网络信息;至少部分地基于所述社交网络信息构造表示节点的异构网络的图,所述图包括多个不同类型的节点和多个不同类型的节点之间的边;定义多个不同的元路径类型,每个元路径类型包括一种不同类型的节点之间的边;基于所述预测问题确定要比较的一对或多对节点;对于要比较的一对或多对节点中的每一对:向相应对的多个不同元路径类型中的每一个元路径类型指派强度,所述强度基于在所述图中在相应对中的节点之间的相应元路径类型的不同路径的计数;以及将指派给所述相应对的多个不同元路径类型中的每一个元路径类型的强度组合成用于所述相应对的连接的统一强度;构造仅实体图,所述仅实体图的节点仅表示要比较的一对或多对节点中的节点,并且使边各自指派用于所述相应对的连接的统一强度;以及在所述仅实体图上运行标签传播算法以解决所述预测问题,所述标签传播算法将分数指派给所述仅实体图中的每个节点,所述分数指示相应实体对由所述预测问题提出的疑问将具有肯定结果的可能性。2.根据权利要求1所述的方法,其中所述一对或多对节点仅包含相同类型的节点。3.根据权利要求1所述的方法,其中指派强度包括基于从节点的相应对中的节点中的每一个节点发出的单个边类型的一些边对强度进行归一化。4.根据权利要求1所述的方法,其中所述强度的组合包括基于公式计算所述统一强度其中,其表示N个类型的元路径的N个强度,,其是每种类型的元路径的加权参数,并且其中是预设值。5.根据权利要求1所述的方法,其中标签传播算法的运行包括:将所述仅实体图中的每个节点的分数初始化为0或1;基于指派给直接邻居节点的分数和指派给所述相应节点与每个直接邻居节点之间的连接的统一强度,更新在仅实体图中针对所述预测问题所考虑的每个节点;以及重复所述更新,直到指派给所述仅实体图中的每个节点的分数从一次迭代到下一次迭代地收敛。6.根据权利要求5所述的方法,还包括:基于所述分数对在仅实体图中针对预测问题所考虑的节点进行排序。7.根据权利要求5所述的方法,其中当没有分数从一次迭代到下一次迭代变化超过预设阈值量时,认为所述分数已经收敛。8.一种系统,包括:在其上存储有指令的计算机可读介质,所述指令在由处理器执行时使所述系统执行以下操作:获得社交网络信息;至少部分地基于所述社交网络信息构造表示节点的异构网络的图,所述图包括多个不同类型的节点和多个不同类型的节点之间的边;定义多个不同的元路径类型,每个元路径类型包括一种不同类型的节点之间的边;基于预测问题确定要比较的一对或多对节点;对于要比较的一对或多对节点中的每一对:向相应对的多个不同元路径类型中的每一个元路径类型指派强度,所述强度基于在所述图中在相应对中的节点之间的相应元路径类型的不同路径的计数;将指派给所述相应对的多个不同元路径类型中的每一个元路径类型的强度组合成用于所述相应对的连接的统一强度;构造仅实体图,所述仅实体图的节点仅表示要比较的一对或多对节点中的节点,并且使边各自指派用于所述相应对的连接的统一强度;以及在所述仅实体图上运行标签传播算法以解决所述预测问题,所述标签传播算法将分数指派给所述仅实体图中的每个节点,所述分数指示相应实体对由所述预测问题提出的疑问将具有肯...

【专利技术属性】
技术研发人员:Q朱Q胡
申请(专利权)人:微软技术许可有限责任公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1