当前位置: 首页 > 专利查询>中山大学专利>正文

一种基于投资关系网络的重要节点挖掘方法及装置制造方法及图纸

技术编号:21480073 阅读:31 留言:0更新日期:2019-06-29 05:21
本发明专利技术公开一种基于投资关系网络的重要节点挖掘方法及装置,该装置用于实现本方法,本方法包括建立基于投资行为的投资关系网络;以鲁棒性指标为衡量节点重要性排序的优劣R,定义优劣R;将优劣R中删除节点的当前网络最大连通规模值反向为添加节点的当前网络最大连通规模值,采用反向生成网络法BGN计算该节点i的cost[i]添加入网节点的当前网络最大连通规模值,对优劣R求最小排序,挖掘排序序列前k个节点为重要节点集。本发明专利技术采用反向生成网络算法挖掘重要节点,更具新颖性、高精度性及高效率性。

【技术实现步骤摘要】
一种基于投资关系网络的重要节点挖掘方法及装置
本专利技术涉及数据挖掘领域,特别涉及一种基于投资关系网络的重要节点挖掘方法及装置。
技术介绍
近几年来,随着风险投资机制在全球经济发展中的作用日趋突显,风险投资问题成为资本市场关注的重点,与之相关的研究也随之兴起。由于存在着代理问题和信息不对称问题,我国的上市公司或多或少会存在过度投资或者投资不足。提高企业的投资效率具有重要的意义。投资网络是由网络上的节点与连线构成,在节点与连线的共同作用下,形成了多层次的复杂的网络。每一个节点可作为个体、小组、组织,代表了关系网络中的利益相关者。节点与节点之间的连线,体现了节点的联系。这种联系可呈现出方向性和权重关系,在投资关系网络中可表现为交易关系、信任关系及其程度等。本专利技术所研究的投资关系网络,是狭义上的投资关系网络,仅包括风险投资机构之间存在的关系网络。这种风险投资关系网络可以是风险投资机构之间所固有的,也可以是由关系网络内各个风险投资机构通过各种互动行为所建立起来的。这种关系网络的建立,为网络内部各个风险投资机构进行信息交流、资源共享提供了渠道。风险投资关系网络具有资源配置的功能,使得它在风险投资资本市场中具有不可替代的作用,对于风险投资机构的投资行为有着重要影响。重要节点挖掘是指在大规模网络中寻找一些关键的节点。节点在网络中发挥着不同的作用。例如,在社交网络中一条谣言的传播,一个核心大号的转发可能带来巨大的影响。同样的,在投资关系网络中,我们希望识别出一些可能导致金融风险的或者极具影响力的重要投资人和企业。这对金融领域的投资行为提供了理论上的指导。重要节点挖掘算法已受到多学科的广泛关注,至今已提出可各种各样的方法。如度中心性、k-shell分解、介数中心性、接近中心性、PageRank等。度中心性简单快速,但只考虑了邻居节点的信息,排序精度差。k-shell算法排序过于粗粒度,无法区分在同层的节点的重要性。介数中心性衡量了节点在网络中的信息流的控制能力。接近中心性利用信息在网络中的平均传播时长来确定节点的重要性。虽然这两种方法考虑了全局的信息,但时间复杂度极高,限制了其在大规模网络中的应用。PageRank是谷歌搜索引擎核心算法,算法中的参数c的选取往往需要通过实验获得,并且在不同的应用背景下最优的参数不具有普适性。当前,对所有节点的重要性的较为客观的评价标准极为困难,常用来评价各种排序算法的准则有基于网络鲁棒性以及基于网络传播动力学模型的准则。网络鲁棒性着重考察节点对网络结构的影响,通过排序方法得到的节点序列,按序列依次将节点从网络中移除,网络崩塌的越迅速说明该排序方法越好。传播动力学模型分为SIS模型和SIR模型两种,其主要思想是将排序得到的Top-K个节点作为种子节点集,如果种子节点集传播又快又广,则算法越优。
技术实现思路
本专利技术的主要目的是提出一种基于投资关系网络的重要节点挖掘方法,旨在克服以上问题。为实现上述目的,本专利技术提出的一种基于投资关系网络的重要节点挖掘方法,包括如下步骤:S10将参与投资行为的对象抽象为节点,对对象间存在交易的节点连边,生成投资关系的网络;S20以鲁棒性指标为衡量节点重要性排序的优劣R,定义p为节点的移除节点比,σ为删除预添加入网节点i的当前网络最大连通规模值cost[i],采用反向生成网络法BG设p比例的节点之后当前网络中最大连通集团的规模值,优劣R公式为:其中,n为网络节点个数,为删除比例为的节点之后当前网络的最大连通规模值,以p为横坐标,σ为纵坐标,得优劣R的曲线,鲁棒性指标为该曲线下的面积;S30将反向为N计算该节点i的cost[i],对优劣R求最小排序,挖掘排序序列前k个节点为重要节点集。优选地,所述S30中采用反向生成网络法BGN计算cost[i]的具体步骤为:S301先判断该节点是否为孤立节点,若为孤立节点,则为该节点分配一个新的集团;若不为孤立节点,则访问该节点的邻居点,并将该节点合并至邻居点所在集团,并更新该集团的最大连通规模值;S302若集团的最大连通规模值大于当前网络的最大连通规模值,更新当前最大连通规模值为该集团的最大连通规模值。优选地,所述S30之后还包括S40采用顶堆反向HeapBGN法将该节点的最大规模值的时间复杂度O(n+m)降到O(d),d为节点度,即该节点的所有邻居节点数,则反向生成网络BGN的时间复杂度降为O(n2d),:将候选节点集用堆构建:建堆时间复杂度O(n),调整堆的时间复杂度为O(logn),弹出堆顶节点时间复杂度为O(1),n为节点集的节点总数;判断该节点是否为添中节点的受影响节点,若该节点是受影响的节点则更新该点的cost值,并对其标记已更新放入堆中;若该节点是受影响的节点且cost值已被更新,则弹出该节点的优劣R为最小,该节点为可选添加节点;若该节点是未受影响的节点,该节点为可选添加节点;更新所有受影响节点所需的时间复杂度为O(nmdlogn),m为节点集中受影响的节点数,且受添加节点的影响而动态变化;由于m的平均值通常远小于n,故忽略m,得到顶堆反向HerpBGN的所有受影响节点所需的平均时间复杂度O(nlogn)。优选地,所述S30之前还包括:S50对S20所删除节点按其连通规模值进行最小排序得到初始节点集;S60对初始节点集中连通规模值相等的所删除节点按其重要性进行最小排序得到初始候选节点集。优选地,所述S30之前还包括:S70采用不同的初始化方法通过归一化后再加权求和得到节点重要性,按节点重要性进行最小排序得到初始候选节点集,其中所述的初始化方法有且不限于度中心性、PageRank算法、k-shell算法。本专利技术还公开了一种基于投资关系网络的重要节点挖掘装置,用于实现上述方法,其包括:网络生成模块10,用于将参与投资行为的对象抽象为节点,对对象间存交易的节点连边,生成投资关系的网络;优劣模块20,用于以鲁棒性指标为衡量节点重要性排序的优劣R,定义p为节点的移除节点比,σ为删除预设p比例的节点之后当前网络中最大连通集团的规模值,优劣R公式为:其中,n为网络节点个数,为删除比例为的节点之后当前网络的最大连通规模值,以p为横坐标,σ为纵坐标,得优劣R的曲线,鲁棒性指标为该曲线下的面积;排序模块30,用于将反向为添加入网节点i的当前网络最大连通规模值cost[i],采用反向生成网络法BGN计算该节点i的cost[i],对优劣R求最小排序,挖掘排序序列前k个节点为重要节点集。优选地,所述排序模块30还包括:判断单元301,用于先判断该节点是否为孤立节点,若为孤立节点,则为该节点分配一个新的集团;若不为孤立节点,则访问该节点的邻居点,并将该节点合并至邻居点所在集团,并更新该集团的最大连通规模值;更新单元301,用于若集团的最大连通规模值大于当前网络的最大连通规模值,更新当前最大连通规模值为该集团的最大连通规模值。优选地,还包括:优化模块40,用于采用顶堆反向HeapBGN法将该节点的最大规模值的时间复杂度O(n+m)降到O(d),d为节点度,即该节点的所有邻居节点数,则反向生成网络BGN的时间复杂度降为O(n2d);将候选节点集用堆构建:建堆时间复杂度O(n),调整堆的时间复杂度为O(logn),弹出堆顶节点时间复杂度为本文档来自技高网
...

【技术保护点】
1.一种基于投资关系网络的重要节点挖掘方法,其特征在于,包括如下步骤:S10将参与投资行为的对象抽象为节点,对对象间存在交易的节点连边,生成投资关系的网络;S20以鲁棒性指标为衡量节点重要性排序的优劣R,定义p为节点的移除节点比,σ为删除预设p比例的节点之后当前网络中最大连通集团的规模值,优劣R公式为:

【技术特征摘要】
1.一种基于投资关系网络的重要节点挖掘方法,其特征在于,包括如下步骤:S10将参与投资行为的对象抽象为节点,对对象间存在交易的节点连边,生成投资关系的网络;S20以鲁棒性指标为衡量节点重要性排序的优劣R,定义p为节点的移除节点比,σ为删除预设p比例的节点之后当前网络中最大连通集团的规模值,优劣R公式为:其中,n为网络节点个数,为删除比例为的节点之后当前网络的最大连通规模值,以p为横坐标,σ为纵坐标,得优劣R的曲线,鲁棒性指标为该曲线下的面积;S30将反向为添加入网节点i的当前网络最大连通规模值cost[i],采用反向生成网络BGN算法计算该节点i的cost[i],对优劣R求最小排序,挖掘排序序列前k个节点为重要节点集。2.如权利要求1所述的基于投资关系网络的重要节点挖掘方法,其特征在于,所述S30中采用反向生成网络法BGN计算cost[i]的具体步骤为:S301先判断该节点是否为孤立节点,若为孤立节点,则为该节点分配一个新的集团;若不为孤立节点,则访问该节点的邻居点,并将该节点合并至邻居点所在集团,并更新该集团的最大连通规模值;S302若集团的最大连通规模值大于当前网络的最大连通规模值,更新当前最大连通规模值为该集团的最大连通规模值。3.如权利要求1或2所述的基于投资关系网络的重要节点挖掘方法,其特征在于,所述S30之后还包括S40采用顶堆反向HeapBGN法将该节点的最大规模值的时间复杂度O(n+m)降到O(d),d为节点度,即该节点的所有邻居节点数,则反向生成网络BGN的时间复杂度降为O(n2d),将候选节点集用堆构建:建堆时间复杂度O(n),调整堆的时间复杂度缩进O(logn),弹出堆顶节点时间复杂度为O(1),n为节点集的节点总数;判断该节点是否为添中节点的受影响节点,若该节点是受影响的节点则更新该点的cost值,并对其标记已更新放入堆中;若该节点是受影响的节点且cost值已被更新,则弹出该节点的优劣R为最小,该节点为可选添加节点;若该节点是未受影响的节点,该节点为可选添加节点;更新所有受影响节点所需的时间复杂度为O(nmdlogn),m为节点集中受影响的节点数,且受添加节点的影响而动态变化;由于m的平均值通常远小于n,故忽略m,得到顶堆反向HerpBGN的所有受影响节点所需的平均时间复杂度O(nlogn)。4.如权利要求3所述的基于投资关系网络的重要节点挖掘方法,其特征在于,所述S30之前还包括:S50对S20所删除节点按其连通规模值进行最小排序得到初始节点集;S60对初始节点集中连通规模值相等的所删除节点按其重要性进行最小排序得到初始候选节点集。5.如权利要求3所述的基于投资关系网络的重要节点挖掘方法,其特征在于,所述S30之前还包括:S70采用不同的初始化方法通过归一化后再加权求和得到节点重要性,按节点重要性进行最小排序得到初始候选节点集,其中所述的初始化方法有...

【专利技术属性】
技术研发人员:陈川林志伟郑子彬
申请(专利权)人:中山大学
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1