当前位置: 首页 > 专利查询>微软公司专利>正文

图群集制造技术

技术编号:6644947 阅读:217 留言:0更新日期:2012-04-11 18:40
各种实施例提供了用于图群集的技术。在一个或多个实施例中,获得表示实体间关系的参与图。基于参与图来构造辅助图。构造辅助图使得辅助图没有参与图密集,从而在计算上较不复杂以便于分析。通过对为辅助图定义的目标函数求解来确定辅助图中的集群。为辅助图确定的集群然后可用于确定参与图中的集群,参与图中的集群对为参与图定义的相关目标函数求解。

【技术实现步骤摘要】
图群集
本专利技术涉及图,尤其涉及图的群集。
技术介绍
图(G)通常是包括一组顶点(V)和用于表示顶点之间关系的一组边(E)的结构。例如,参与图可用于基于共同条件、性质、参数、特征、活动、连接等使实体彼此相关。这种图可用于分析在多种场景中的对应数据集。这种场景的一个实例是在对于与来自服务提供者的资源相关的广告空间的在线广告拍卖的背景中。在广告拍卖的背景中,拍卖参与图是包括顶点和边的结构,顶点表示在拍卖中竞争的广告客户,当由两个顶点表示的广告客户通过一同参与拍卖而相关时边连接这两个顶点。拍卖参与图包含具有多个应用程序的大量信息,应用程序包括广告客户栏栅(flighting)、对广告客户的关键字建议、微市场分析等等。通常,这种类型图的分析包括在图中找出有意义的子集或集群。对于示例性拍卖参与图,这可对应于对图进行群集以识别广告客户图中彼此具有相对较少交互的子市场。具体而言,群集可包括识别集群以优化某些目标函数。然而,随着图变得更大(更多顶点)且更密集(顶点之间的更多边),由于群集所涉及的计算量,对图进行群集变得相当困难。因此,用于对图进行直接群集的传统算法可能不能成功地对在某些场景中出现的较大较密集的图执行群集。
技术实现思路
提供本概述是为了以简化的形式介绍将在以下详细描述中进一步描述的一些概念。本概述并不旨在标识出所要求保护的主题的关键特征或必要特征,也不旨在用于限定所要求保护的主题的范围。各种实施例提供了用于图群集的技术。在一个或多个实施例中,获得表示实体间关系的参与图。基于参与图来构造辅助图。构造辅助图使得辅助图没有参与图密集,从而计算上较不复杂以便于分析。通过对为辅助图定义的目标函数求解来确定辅助图中的集群。为辅助图确定的集群然后可用于确定参与图中的集群,参与图中的集群对为参与图定义的相关目标函数求解。附图说明图1示出其中可用图群集的一个或多个实施例的示例操作环境。图2是描述根据一个或多个实施例的示例过程的流程图。图3是描述根据一个或多个实施例的另一示例过程的流程图。图4是描绘根据一个或多个实施例的示例参与图和对应二分图的示图。图5是描绘根据一个或多个实施例的示例辅助图的构造的示图。图6是可用于实现各种实施例的系统的框图。具体实施方式概览各种实施例提供了用于图群集的技术。在一个或多个实施例中,获得表示实体间关系的参与图。基于参与图来构造辅助图。构造辅助图使得辅助图没有参与图密集,从而计算上较不复杂以便于分析。通过对为辅助图定义的目标函数求解来确定辅助图中的集群。为辅助图确定的集群然后可用于确定参与图中的集群,参与图中的集群对为参与图定义的相关目标函数求解。在以下讨论中,题为“操作环境”的章节仅描述其中可采用各实施例的一个环境。接着,题为“图群集过程”的章节描述了根据一个或多个实施例的用于图群集的示例技术。接着,题为“图群集实施细节”的章节描述了根据一个或多个实施例的用于图群集的示例算法和实施。最后,提供了题为“示例系统”的章节并且该章节描述可用于实现一个或多个实施例的示例系统。操作环境图1在100处概括地示出根据一个或多个实施例的操作环境。环境100包括具有一个或多个处理器104、一个或多个计算机可读介质106和存储在计算机可读介质上并可由一个或多个处理器104执行的一个或多个应用程序108的服务提供者102。计算机可读介质106可包括,作为示例而非限制,通常与计算设备相关联的所有形式的易失性和非易失性存储器和/或存储介质。这种介质可包括ROM、RAM、闪存、硬盘、光盘、可移动介质等。计算机可读介质106也被描绘成存储也可由处理器104执行的操作系统110、服务管理器模块112、资源114(如内容、服务和数据)、以及群集工具116。尽管分开示出,但是群集工具116也可被实现为服务管理器模块112的组件。服务提供者102可被实施为任何合适的计算设备或诸如以下设备的组合,例如但不限于:服务器、服务器场、设备的对等网络、台式计算机等。计算设备的一个具体示例在以下关于图6示出并描述。服务提供者102可通信上通过网络118耦合到各种其他实体(如设备、服务器、存储位置、客户机等)。具体来说,服务提供者102被示为通过网络118连接到提供广告122的广告客户120以及客户机124。广告客户120和客户机124可通过网络118与服务提供者102交互来获得对各种资源114的访问。虽然网络118被示为因特网,但是该网络可以采用各种各样的配置。例如,网络118可以包括广域网(WAN)、局域网(LAN)、无线网络、公共电话网和内联网等等。此外,虽然示出了单个网络118,但是网络118可被配置为包括多个网络。服务管理器模块112表示可由服务提供者102操作来管理各种资源114的功能,可使各种资源114可通过网络118被获得。服务管理器模块112可管理对资源114的访问、资源114的性能、用户接口或数据的配置来提供资源114等等。例如,客户机124可形成资源请求126来传送到服务提供者102以获得相应的资源114。响应于接收到这样的请求,服务提供者102可经通过网络118传送的供由一个或多个客户机124输出的网页128和/或其他用户界面来提供各种资源114。资源114可包括内容和/或服务的任何合适的组合,通常由一个或多个服务提供者使这些内容和/或服务通过网络可被获得。内容可包括文本、视频、广告、音频、多媒体流、动画、图像等的各种组合。服务的某些示例包括但不限于:搜索服务、发送和接收电子邮件的电子邮件服务、在客户机之间提供即时消息的即时消息通信服务、以及便于共享共同兴趣和活动的用户组之间的连接和交互的社交网络服务。服务还可包括配置成使得广告客户120投放广告122以连同资源114一起呈现给客户机104的广告服务。例如,至少一些网页128可被配置成包括由广告客户120提供的广告122。通过广告服务使用选择和投递广告的任何合适的技术可选择广告122来包含在网页中。在一个示例中,可对网页128中保留的用于来自广告客户120的广告122的空间进行拍卖。群集工具116被配置成实现此处描述的图群集技术的各方面。群集工具116可被配置成使用可通过服务提供者102收集、存储和/或访问的各种图数据130。虽然图1的示例图数据130被示为存储在服务提供者102的计算机可读介质106上,但是可以构想图数据130可以通过任何合适的设备被编译并被存储在任何合适的本地或网络存储位置上和/或从任何合适的本地或网络存储位置获得。图数据130可表示可用于构造图的各种数据集,接着图可以是群集工具116执行的分析对象。具体而言,拍卖群集工具116表示至少以下功能:使用图数据获得合适的图,将各种群集算法应用于图和/或以其它方式分析图,以及基于对图的分析来确认集群。注意,群集可包括对某些目标函数的优化。因此,也可实施群集工具116以使目标函数被定义。这里描述的群集算法然后可用于测试目标函数。对可通过群集工具116实施的目标函数和图群集技术的进一步讨论可参考以下附图得到。已经考虑了示例操作环境,现在考虑对根据一个或多个实施例的示例图群集技术的讨论。图群集过程下面的讨论描述了可利用上述和下述的环境、系统和/或设备来实现的图群集技术。这些过程中每一过程的各方面可用硬件本文档来自技高网...
图群集

【技术保护点】
1.一种计算机实现的方法,包括:获得表示实体之间的关系的参与图(202);至少通过以下步骤基于所述参与图构造辅助图(204):形成对应于所述参与图的二分图;用有向边替换所述二分图中的无向边;向所述有向边分配方向权重;以及将表示所述实体的顶点连接到任意汇点;通过对为所述辅助图定义的目标函数求解来确定集群(206);以及使用为所述辅助图确定的所述集群来确定对为所述参与图定义的相关目标函数求解的集群(208)。

【技术特征摘要】
2010.03.26 US 12/748,0141.一种用于图群集的计算机实现的方法,包括:获得表示实体之间的关系的参与图(202);至少通过以下步骤基于所述参与图构造辅助图(204):形成对应于所述参与图的无向二分图,所述无向二分图使用表示所述实体的顶点和表示所述关系的顶点之间的无向边将实体与所述实体的关系相连接;用有向边替换所述无向二分图中的所述无向边以形成有向图,所述有向图被配置为促使为所述辅助图定义的目标函数最小化,所述目标函数测量从所述无向二分图中被移除以形成所述有向图的边的总权重;向所述有向边分配方向权重;以及将表示所述有向图中的所述实体的顶点连接到任意汇点以形成所述辅助图;通过对为所述辅助图定义的所述目标函数求解来确定集群(206);以及使用为所述辅助图确定的所述集群来确定对为所述参与图定义的相关目标函数求解的集群(208)。2.如权利要求1所述的方法,其特征在于,通过对为所述辅助图定义的所述目标函数求解来确定集群包括将最小割算法应用于所构造的辅助图。3.如权利要求2所述的方法,其特征在于,应用最小割算法的步骤包括选择所述辅助图的实体中的一个作为目标,并对所述目标使用最小割算法以获得具有位于割中包括目标的一侧的一组顶点的集群。4.如权利要求1所述的方法,其特征在于,所述实体包括在线拍卖的参与者,当参与者在同一拍卖中竞争时所述关系使参与者相关。5.如权利要求1所述的方法,其特征在于,还包括通过转换为参与图定义的所述相关目标函数,导出为辅助图定义的所述目标函数。6.如权利要求1所述的方法,其特征在于,所述辅助图被配置成没有所述参与图密集。7.如权利要求1所述的方法,其特征在于:所述参与图被配置成用对应于所述实体之间关系的边来连接表示所述实体的所述顶点;以及构造辅助图包括,通过在表示所述实体的所述顶点和被引入以表示所述实体间的关系的额外顶点之间引入所述边来将所述参与图转换成对应于所述参与图的无向二分图。8.如权利要求1所述的方法,其特征在于,为所述辅助图定义的所述目标函数被表示为f(H)且具有的形式,其中是测量在构造所述辅助图中从所述...

【专利技术属性】
技术研发人员:D·X·查尔斯D·M·奇克林P·Y·西马德R·M·安德森
申请(专利权)人:微软公司
类型:发明
国别省市:US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1