用于发现作为网络中社区的星形结构的系统及方法技术方案

技术编号:7842488 阅读:173 留言:0更新日期:2012-10-13 00:45
本发明专利技术的各实施例提供了系统、方法、装置及程序产品,所述系统、方法、装置及程序产品提供了用于定义和发现网络环境中的关系的方法。本发明专利技术的各实施例利用关系定义将网络环境关系定义为所关注网络内的星形结构,且自动地发现网络中的这些星形结构。

【技术实现步骤摘要】
【国外来华专利技术】
技术介绍
本文中所描述的主题一般地涉及定义及检测网络环境中节点之间的关系。如本文中所描述,网络、网络环境(及其类似者)可包括(但未必限于)计算机网络、社交网络、化学网络、生物学网络,等等。可认为网络是以某种方式经由边缘所连接的节点的集合。作为一个非限制性实例,可将基于因特网的网络定义为包括经由边缘(例如,连接网页的超链接)所连接的节点(诸如网页)。作为另一非限制性实例,可将生物化学网络定义为包括经由边缘(例如,网络节点之间的已知关系(诸如化学结合或化学反应性))所连接的节点(诸如分子)。作为又一非限制性实例,可将呼叫网络定义为包括经由边缘(例如,呼叫网络中节点之间的联系(诸如已拨电话或已发文字消息)的存在)所连接的节点(诸如电话号码和/或个人)。存在大量关于网络的可用信息。例如,存在关于哪些用户/号码已呼叫给定电信网络内的其它用户/号码的大量呼叫信息。尽管存在描述网络的信息,但利用该信息以实现最大价值通常较为困难(有时是直接由大量的信息所造成)。因此,尽管描述网络内节点的关系的信息具有明显的价值,但发现现有网络数据内的这些关系通常较为困难。
技术实现思路
本专利技术的各实施例提供了系统、方法、装置及程序产品,所述系统、方法、装置及程序产品提供了用于定义及发现网络环境中的关系的方法。本专利技术的各实施例利用关系定义将网络环境关系定义为所关注网络内的星形结构,且自动地发现网络(诸如社交网络、技术网络、生物学网络、化学网络等)中的这些星形结构。这些星形结构很重要(在各原因当中),这是因为所述星形结构的语义及所述星形结构的“轮毂(hub)”及“轮辐(spokes)”在各种网络上下文中所扮演的角色。因此,本专利技术的各实施例(例如)使得用户能够识别电信网络中的有影响力的个人/号码作为联系该网络内的其它节点(轮辐)的轮毂。一旦已识别这些星形结构,则用户可(例如)通过将所述轮毂用作影响遍及该网络的其它节点的联系点或入口点而利用网络信息。概括地,本专利技术的一个方面提供一种方法,所述方法包括存取存储设备中所存储的网络数据;提取所述网络数据内与节点及边缘对应的信息;选择一个或多个候选节点组;计算所述一个或多个候选节点组的星形测量;判定所述一个或多个候选节点组的所述星形测量是否未超过预定阈值;以及响应于所述一个或多个候选节点组的所述星形测量未超过所述预定阈值而定义一个或多个星形结构。本专利技术的另一方面提供一种装置,所述装置包括一个或多个处理器;以及计算机可读存储介质,所述计算机可读存储介质具有以其体现且可由所述一个或多个处理器执行的指令程序,所述指令程序包括配置为存取存储设备中所存储的网络数据的计算机可读程序代码;配置为提取所述网络数据内与节点及边缘对应的信息的计算机可读程序代码;配置为选择一个或多个候选节点组的计算机可读程序代码;配置为计算所述一个或多个候选节点组的星形测量的计算机可读程序代码;配置为判定所述一个或多个候选节点组、的所述星形测量是否未超过预定阈值的计算机可读程序代码;以及配置为响应于所述一个或多个候选节点组的所述星形测量未超过所述预定阈值而定义一个或多个星形结构的计算机可读程序代码。本专利技术的另一方面提供一种计算机程序产品,所述计算机程序产品包括计算机可读存储介质,所述计算机可读存储介质具有以其体现的计算机可读程序代码,所述计算机可读程序代码包括配置为存取存储设备中所存储的网络数据的计算机可读程序代码;配置为提取所述网络数据内与节点及边缘对应的信息的计算机可读程序代码;配置为选择一个或多个候选节点组的计算机可读程序代码;配置为计算所述一个或多个候选节点组的星形测量的计算机可读程序代码;配置为判定所述一个或多个候选节点组的所述星形测量是否未超过预定阈值的计算机可读程序代码;以及配置为响应于所述一个或多个候选节点组的所述星形测量未超过所述预定阈值而定义一个或多个星形结构的计算机可读程序代码。 为了更好地理解本专利技术的示例性实施例以及本专利技术的其它及另外的特征及优点,参考结合附图的以下描述,且将在所附权利要求书中指出本专利技术所要求保护的实施例的范围。附图说明图I例示根据一个实施例的其中具有星形结构的示例性网络;图2例示根据一个实施例的示例性星形结构类型; 图3例示根据一个实施例的示例性星形测量;图4例示根据一个实施例的示例性星形类型;图5例示根据一个实施例的示例性剪除的星形;图6例示根据一个实施例的用于识别星形结构的示例性方法;及图7例示根据一个实施例的示例性计算机系统。具体实施例方式将易于理解,除了所描述的示例性实施例以外,本专利技术的各实施例的组件(如本文中的附图所总体上描述及说明)可以以广泛种类的不同配置来布置和设计。因此,本专利技术的各实施例的以下更详细描述(如附图所表示)并非旨在限制所要求保护的本专利技术的各实施例的范围,而是仅表示本专利技术的示例性实施例。在本说明书中对“一个实施例”(或其类似者)的参考意谓结合该实施例所描述的特定特征、结构或特性包括在本专利技术的至少一个实施例中。因此,在本说明书中各处的短语“在一个实施例中”或其类似者的出现未必均指代同一实施例。此外,可在一个或多个实施例中以任何适当方式组合所描述的特征、结构或特性。在以下描述中,提供众多特定细节以给予对本专利技术的各实施例的透彻理解。然而,本领域技术人员将认识到,可在没有所述特定细节中的一个或多个的情况下或通过其它方法、组件、材料等来实现本专利技术的各种实施例。在其它情况下,未详细地展示或描述公知的结构、材料或操作以避免混淆本专利技术的各方面。应注意的是,附图中的流程图和框图,图示了按照本专利技术各种实施例的系统、装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,所述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。关于节点的网络数据(不管所述节点表示通信网路中的呼叫者、生理学或生物化学系统中的分子、工业反应工艺中的化学品、导致彼此不利的相互作用的医药品或其类似者)可包含有价值的信息。考虑到已存在关于网络中的节点如何相关的大量可用数据,因此识别节点网络内的感兴趣及潜在重要的关系具有实际价值。例如,网络数据可含有关于与网络中的其它人相关/通信的要人的信息,此信息又可用于指向(targeting)遍及网络分布的信息。专利技术者已认识到,在给定现有网络数据的情况下,可能难以识别网络内可能以感·兴趣且重要方式彼此相关的(多个)重要节点。作为一个非限制性实例,可能难以识别正在联系许多其它呼叫者的中心呼叫者(例如,电话推销员(tele-marketer)),即使能够存取所有呼叫信息也是如此。就此而言,可认为电话推销员或中心节点是网络内经由边缘(或在此实例中为所进行的呼叫)连接至许多其它节点(“轮辐”)的星形结构的“轮本文档来自技高网...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】2010.01.30 US 12/697,2381.一种方法,包括 存取存储设备中所存储的网络数据; 提取所述网络数据内与节点及边缘对应的信息; 选择一个或多个候选节点组; 计算所述一个或多个候选节点组的星形测量; 判定所述一个或多个候选节点组的所述星形测量是否未超过预定阈值;以及响应于所述一个或多个候选节点组的所述星形测量未超过所述预定阈值而定义一个或多个星形结构。2.如权利要求I的方法,其中计算所述一个或多个候选节点组的星形测量进一步包 括 识别轮毂节点; 识别一个或多个邻近节点; 确定所述一个或多个邻近节点的边缘的平均数目; 确定所述轮毂节点的边缘的平均数目;以及 将所述星形测量计算为所述一个或多个邻近节点的边缘的所述平均数目除以所述轮毂节点的边缘的所述数目。3.如权利要求I的方法,其中所述一个或多个星形结构包括局部星形结构及全局星形结构中的一个或多个。4.如权利要求3的方法,其中响应于定义一个或多个全局星形结构而识别一个或多个局部星形结构。5.如权利要求I的方法,还包括 响应于判定所述一个或多个候选节点组的所述星形测量超过所述预定阈值,剪除所述一个或多个候选节点组并且重新判定一个或多个修改后的候选节点组的星形测量是否未超过所述预定阈值。6.如权利要求5的方法,其中剪除所述一个或多个候选节点组包括自候选星形结构移除轮毂节点的与其它节点具有最高连接度的邻居。7.如权利要求6的方法,其中响应于判定一个或多个修改后的候选节点组的星形测量未超过所述预定阈值而定义星形结构。8.如权利要求I的方法,其中所述网络数据包括呼叫网络数据、医药品网络数据以及社交因特网Web站点网络数据中的一个或多个。9.如权利要求I的方法,还包括将所述一个或多个星形结构输出至一个或多个显示设备。10.一种装置,包括 一个或多个处理器;以及 计算机可读存储介质,所述计算机可读存储介质具有以其体现且可由所述一个或多个处理器执行的指令程序,所述指令程序包括 配置为存取存储设备中所存储的网络数据的计算机可读程序代码; 配置为提取所述网络数据内与节点及边缘对应的信息的计算机可读程序代码; 配置为选择一个或多个候选节点组的计算机可读程序代码;配置为计算所述一个或多个候选节点组的星形测量的计算机可读程序代码; 配置为判定所述一个或多个候选节点组的所述星形测量是否未超过预定阈值的计算机可读程序代码;以及 配置为响应于所述一个或多个候选节点组的所述星形测量未超过所述预定阈值而定义一个或多个星形结构的计算机可读程序代码。11.如权利要求10的装置,其中配置为计算所述一个或多个...

【专利技术属性】
技术研发人员:S·慕克吉A·A·纳纳瓦蒂U·N·拉加万
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1