一种基于关系权重的企业图谱中的社区发现算法制造技术

技术编号:20176928 阅读:45 留言:0更新日期:2019-01-23 00:26
本发明专利技术公开了一种基于关系权重的企业图谱中的社区发现算法,该社区发现算法包括:(1)确定企业图谱中关系的权重;(2)确定企业之间的相似度;(3)运用Modularity评价复杂网络中社区发现结果优劣程度;(4)基于Modularity限定算法收敛;(5)基于LPA算法计算置信概率表。该算法通过发现企业图谱中的社区,将整个企业图谱划分为一个个的子图,划分之后的企业图谱不仅可以根据其社区属性帮助分析行业前景,还可以用于分析金融方面的担保信息、合作信息、投资信息等;并且根据社区属性帮助政府或者有关部门制定政策,及时调整市场。

A Community Discovery Algorithms in Enterprise Map Based on Relational Weight

The invention discloses a community discovery algorithm in enterprise atlas based on relationship weight, which includes: (1) determining the weight of relationship in enterprise atlas; (2) determining the similarity between enterprises; (3) using Modularity to evaluate the quality of community discovery results in complex networks; (4) restricting convergence of algorithm based on Modularity; (5) calculating confidence probability table based on LPA algorithm. The algorithm divides the whole enterprise atlas into sub-graphs by discovering the communities in the enterprise atlas. The enterprise atlas after division can not only help to analyze the industry prospects according to its community attributes, but also can be used to analyze the guarantee information, cooperation information, investment information in the financial field, and help the government or relevant departments formulate policies and adjust them in time according to the community attributes. The whole market.

【技术实现步骤摘要】
一种基于关系权重的企业图谱中的社区发现算法
本专利技术涉及社区发现算法
,更具体的说是涉及一种基于关系权重的企业图谱中的社区发现算法。
技术介绍
企业图谱是一种关于企业以及企业之间关系的复杂网络。复杂网络是具有自组织、自相似、吸引子、小世界、无标度中部分或全部性质的网络。复杂网络是复杂系统的抽象,现实中很多的复杂系统都可以用复杂网络的相关特性进行描述和分析,利用全量企业数据构建的企业图谱即是复杂网络中的一种,可以用于分析有关全国全量企业和个体户所构成的系统。对复杂网络的研究一直是许多研究领域的热点,其中社区发现是复杂网络中的一个普遍特征。首先需要理解什么是社区,复杂网络中的社区并没有一个准确的定义,一种较为大众所接受的描述为社区是网络中一些节点所组成的子图,其中子图内的节点的相互关联程度比与子图外的节点的关联程度高。整个复杂网络是由许多个社区组成的,企业图谱中也具有社区这样的属性,因此企业图谱中的社区发现是一个复杂而极具意义的过程,它对企业图谱的特性研究具有重要作用。针对复杂网络中的社区发现,目前已经有一些传统方法,例如标签传播算法(LPA)以及标签传播算法的改进,如SLPA、本文档来自技高网...

【技术保护点】
1.一种基于关系权重的企业图谱中的社区发现算法,其特征在于,所述社区发现算法包括:(1)确定企业图谱中关系的权重:权重决定着一个节点在更新自己的标签过程中选择哪一个标签,在算法中应该为越紧密的关系分配越高的权重,其中包括任职关系权重和投资关系权重;任职关系为个人节点与企业节点之间的关系,具体的分为是否为法人代表和是否为企业高管,通常来说法人代表是企业中最为重要的人员,其与企业的紧密程度要高于普通的企业高管,因此具有法人代表属性的任职关系权重要高于普通高管的任职关系权重;投资关系中最重要的是投资额属性,而对于一家企业,其向外的投资与接收的投资属于等价的情况,投资关系的权重仅与投资额正相关;(2)...

【技术特征摘要】
1.一种基于关系权重的企业图谱中的社区发现算法,其特征在于,所述社区发现算法包括:(1)确定企业图谱中关系的权重:权重决定着一个节点在更新自己的标签过程中选择哪一个标签,在算法中应该为越紧密的关系分配越高的权重,其中包括任职关系权重和投资关系权重;任职关系为个人节点与企业节点之间的关系,具体的分为是否为法人代表和是否为企业高管,通常来说法人代表是企业中最为重要的人员,其与企业的紧密程度要高于普通的企业高管,因此具有法人代表属性的任职关系权重要高于普通高管的任职关系权重;投资关系中最重要的是投资额属性,而对于一家企业,其向外的投资与接收的投资属于等价的情况,投资关系的权重仅与投资额正相关;(2)确定企业之间的相似度:每一个企业节点都有着自己的经营范围、所在地区等属性,这些属性决定着一家企业的性质;相似的企业节点之间的关系给予的标签贡献比不相似的企业节点之间的关系价值要高;(3)运用Modularity评价复杂网络中社区发现结果优劣程度:通过改进Modularity的计算过程,令Modularity不再仅仅是关系数目的比较,而变成关系数目与权重相结合之后数值的比较;改进之后的Modularity计算公式如下:其中m为整个图中的关系总数,A为加权后的邻接矩阵,Pij表示随机网络中节点i和节点j之间关系数的期望值,δ函数在Ci和Cj属于同一个社区时为1否则为0,ξ函数为节点之间的相似度系数;具体来说,普通的邻接矩阵中1代表两个节点有连接关系,0代表两个节点没有连接关系;加权的邻接矩阵A中如果两个节点有连接关系则用权重表示,如果没有则用0表示;节点i和节点j之间关系数的期望值Pij可以表示为其中ki和kj分别为节点i和节点j的度;(4)基于Modularity限定算法收敛:将所有的节点遍历完一遍为一次迭代,在每次迭代完成之后,通过如下参数判定算法是否已经收敛:1)Modularity的...

【专利技术属性】
技术研发人员:赵亮
申请(专利权)人:元素征信有限责任公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1