基金经理社团划分方法、系统、计算机设备和存储介质技术方案

技术编号:20389720 阅读:12 留言:0更新日期:2019-02-20 02:47
本发明专利技术涉及金融技术领域,尤其涉及一种基金经理社团划分方法、系统、计算机设备和存储介质。该方法包括:从基金知识图谱中提取多个实体,基金知识图谱包括实体和关系;获取两个实体之间的关系,合并成权重W;将每个实体均设置为一个节点,将每个节点设置为一个初始社团,两个节点之间的权重W设置为度,调用快速聚类Fast Newman算法,对节点进行社团划分,得到社团划分结果;将社团划分结果保存入社团划分表中。本发明专利技术通过Fast Newman方法进行社团聚类,找出最优的社区划分状态,作为最终社区划分结果,实现了对人的网络关系的确定和呈现。

【技术实现步骤摘要】
基金经理社团划分方法、系统、计算机设备和存储介质
本专利技术涉及金融
,尤其涉及一种基金经理社团划分方法、系统、计算机设备和存储介质。
技术介绍
知识图谱是一种知识域可视化或知识领域映射地图,它把复杂的知识领域通过数据挖掘、信息处理、知识计量和图形绘制而显示出来,揭示知识领域的动态发展规律,为学科研究提供切实的、有价值的参考。根据覆盖范围而言,知识图谱可分为通用知识图谱和行业知识图谱。通用知识图谱主要应用于智能搜索等领域。行业知识图谱通常需要依靠特定行业的数据来构建。基金知识图谱正是一种金融领域的行业知识图谱,其为投资者们提供了可视化参考工具,但是基金知识图谱仅仅是一种关系的堆叠,并没有对人的网络关系进一步挖掘。
技术实现思路
有鉴于此,有必要针对基金知识图谱缺少对人的网络关系的问题,提供一种基金经理社团划分方法、系统、计算机设备和存储介质。一种基金经理社团划分方法,包括:从基金知识图谱中提取多个实体,所述基金知识图谱采用图谱形式存储在图数据库中,所述基金知识图谱包括实体和关系;获取每两个所述实体之间的关系,合并成权重W;将每个实体均设置为一个节点,将每个所述节点设置为一个初始社团,两个所述节点之间的权重W设置为度,调用快速聚类FastNewman算法,对所述节点进行社团划分,得到社团划分结果;将所述社团划分结果保存入社团划分表中,所述社团划分表位于所述图数据库中。在其中一个实施例中,所述基金知识图谱的生成过程,包括:从外部信息源中抽取多条基金知识数据,设置为知识元库,所述基金知识数据据包括基金经理、所属公司、毕业院校、导师、管理过的基金公司代码或简称、管理过的基金名称、正在管理的基金类型、正在管理的基金规模、投资风格、投资周期、单位净值和累计净值;将所述知识元库中的基金经理设置为统一标记,如果两条所述基金知识数据具有同一项所述统一标记,则对两条所述基金知识数据进行合并;将所述基金经理设置为实体、所述所属公司、毕业院校、导师、管理过的基金公司代码或简称和管理过的基金名称设置为关系,所述正在管理的基金类型、正在管理的基金规模、投资风格、投资周期、单位净值和累计净值设置为属性,对所述知识元库采用图谱形式存储在图数据库中,生成基金知识图谱。在其中一个实施例中,所述从外部信息源中抽取多条基金知识数据,包括:当所述外部信息源是数据库时,所述数据库中的数据为结构化数据,通过设定规则脚本对所述数据库中的数据进行抽取,得到多条所述基金知识数据;当所述外部信息源是网站时,所述网站中的图表数据为半结构化数据,通过爬虫或正规表达式匹配来进行数据抽取,得到多条所述基金知识数据;当所述外部信息源是基金研报、基金经理简历或社区评论时,所述外部信息源是非结构化的文本数据,通过自然语言处理来进行数据抽取,得到多条所述基金知识数据。在其中一个实施例中,所述每两个所述实体之间的关系,合并成权重W,包括:所述实体与另一实体之间的关系是同一所述所属公司,则所述实体与另一实体之间的所述所属公司的关系对应的权重W=1;所述实体与另一实体之间的关系是毕业于同一所所述毕业院校,则所述实体与另一实体之间的所述毕业院校的关系对应的权重W=1;所述实体与另一实体之间的关系是具有共同的所述导师,则所述实体与另一实体之间的所述导师的关系对应的权重W=2;所述实体与另一实体之间的关系是所述管理过的基金公司代码或简称相同,则所述实体与另一实体之间的所述管理过的基金公司代码或简称的关系对应的权重W=2;所述实体与另一实体之间的关系是所述管理过的基金名称相同,则所述实体与另一实体之间的所述管理过的基金名称的关系对应的权重W=2;对所述实体与另一实体之间的所有关系求和,形成权重W。在其中一个实施例中,所述调用快速聚类FastNewman算法,对所述节点进行社团划分,得到社团划分结果,包括:计算两个所述初始社团结合时的模块度Q值,将Q值增加最大的或者减少最少的两个社团进行合并形成另一社团,重复进行计算和合并,直到所有社团合并成一个大社团时停止,找出合并过程中Q值最大时的社团划分结果。在其中一个实施例中,所述模块度Q值的计算公式,包括:其中,v和w是任一两个节点,两个节点之间共有m个连接关系,当两个节点直接相连时Avw=1,否则Avw=0,kv、kw分别表示节点v、w的度,2m是整个网络的度,δ(cv,cw)判断节点v和w是否在同一个社区内,在同一个社区内δ(cv,cw)=1,否则δ(cv,cw)=0;eij表示一个节点在社区i内,另一个节点在社区j内的边,那么eii就表示在社区i内所有边个数与整个网络所有边的个数一个比值,即一个社区内部的度比上整个网络的度,而ai则表示i社区内的节点的度占整个网络的度的比值。在其中一个实施例中,所述将所述社团划分结果保存入社团划分表中,所述社团划分表位于所述图数据库中后,还包括:通过预设的用户查询界面获得用户输入的某一基金经理社团信息请求;访问所述图数据库,根据所述基金经理查询所述社团划分表;将所述基金经理所在社团的节点和关系进行提取,并以json数据格式发送给数据可视化D3.js软件,所述D3.js软件将所述节点和关系转换为可视化图表后,返回给所述用户查询界面。一种基金经理社团划分系统,包括:提取实体单元,用于从基金知识图谱中提取多个实体,所述基金知识图谱采用图谱形式存储在图数据库中,所述基金知识图谱包括实体和关系;获取权重单元,用于获取每两个所述实体之间的关系,合并成权重W;社团划分单元,用于将每个实体均设置为一个节点,将每个所述节点设置为一个初始社团,两个所述节点之间的权重W设置为度,调用快速聚类FastNewman算法,对所述节点进行社团划分,得到社团划分结果;保存单元,用于将所述社团划分结果保存入社团划分表中,所述社团划分表位于所述图数据库中。一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行上述基金经理社团划分方法的步骤。一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行上述基金经理社团划分方法的步骤。上述基金经理社团划分方法、装置、计算机设备和存储介质,包括从基金知识图谱中提取多个实体,基金知识图谱采用图谱形式存储在图数据库中,基金知识图谱包括实体和关系;获取每两个实体之间的关系,合并成权重W;将每个实体均设置为一个节点,将每个节点设置为一个初始社团,两个节点之间的权重W设置为度,调用快速聚类FastNewman算法,对节点进行社团划分,得到社团划分结果;将社团划分结果保存入社团划分表中,社团划分表位于图数据库中。本专利技术通过FastNewman方法进行社团聚类,将FastNewman算法结合基金经理的实际应用出发,根据基金经理之间的关系不同,权重不同,来找出最优的社区划分状态,作为最终社区划分结果,实现了对人的网络关系的确定和呈现。附图说明通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本专利技术的限制。图1为本专利技术一个实施例中的基金经理社团划分方法的流程图;图2为一个实施例中步骤S1的流程图;本文档来自技高网...

【技术保护点】
1.一种基金经理社团划分方法,其特征在于,包括:从基金知识图谱中提取多个实体,所述基金知识图谱采用图谱形式存储在图数据库中,所述基金知识图谱包括所述实体和关系;获取每两个所述实体之间的关系,合并成权重W;将每个实体均设置为一个节点,将每个所述节点设置为一个初始社团,两个所述节点之间的权重W设置为度,调用快速聚类Fast Newman算法,对所述节点进行社团划分,得到社团划分结果;将所述社团划分结果保存入社团划分表中,所述社团划分表位于所述图数据库中。

【技术特征摘要】
1.一种基金经理社团划分方法,其特征在于,包括:从基金知识图谱中提取多个实体,所述基金知识图谱采用图谱形式存储在图数据库中,所述基金知识图谱包括所述实体和关系;获取每两个所述实体之间的关系,合并成权重W;将每个实体均设置为一个节点,将每个所述节点设置为一个初始社团,两个所述节点之间的权重W设置为度,调用快速聚类FastNewman算法,对所述节点进行社团划分,得到社团划分结果;将所述社团划分结果保存入社团划分表中,所述社团划分表位于所述图数据库中。2.根据权利要求1所述的基金经理社团划分方法,其特征在于,所述基金知识图谱的生成过程,包括:从外部信息源中抽取多条基金知识数据,设置为知识元库,所述基金知识数据据包括基金经理、所属公司、毕业院校、导师、管理过的基金公司代码或简称、管理过的基金名称、正在管理的基金类型、正在管理的基金规模、投资风格、投资周期、单位净值和累计净值;将所述知识元库中的基金经理设置为统一标记,如果两条所述基金知识数据具有同一项所述统一标记,则对两条所述基金知识数据进行合并;将所述基金经理设置为实体、所述所属公司、毕业院校、导师、管理过的基金公司代码或简称和管理过的基金名称设置为关系,所述正在管理的基金类型、正在管理的基金规模、投资风格、投资周期、单位净值和累计净值设置为属性,对所述知识元库采用图谱形式存储在图数据库中,生成基金知识图谱。3.根据权利要求2所述的基金经理社团划分方法,其特征在于,所述从外部信息源中抽取多条基金知识数据,包括:当所述外部信息源是数据库时,所述数据库中的数据为结构化数据,通过设定规则脚本对所述数据库中的数据进行抽取,得到多条所述基金知识数据;当所述外部信息源是网站时,所述网站中的图表数据为半结构化数据,通过爬虫或正规表达式匹配来进行数据抽取,得到多条所述基金知识数据;当所述外部信息源是基金研报、基金经理简历或社区评论时,所述外部信息源是非结构化的文本数据,通过自然语言处理来进行数据抽取,得到多条所述基金知识数据。4.根据权利要求1所述的基金经理社团划分方法,其特征在于,所述每两个所述实体之间的关系,合并成权重W,包括:所述实体与另一实体之间的关系是同一所述所属公司,则所述实体与另一实体之间的所述所属公司的关系对应的权重W=1;所述实体与另一实体之间的关系是毕业于同一所所述毕业院校,则所述实体与另一实体之间的所述毕业院校的关系对应的权重W=1;所述实体与另一实体之间的关系是具有共同的所述导师,则所述实体与另一实体之间的所述导师的关系对应的权重W=2;所述实体与另一实体之间的关系是所述管理过的基金公司代码或简称相同,则所述实体与另一实体之间的所述管理过的基金公司代码或简称的关系对应的权重W=2;所述实体与另一实体之间的关系是所述管理过的基金名称相同,则所述实体与...

【专利技术属性】
技术研发人员:陈泽晖胡逸凡谢云黄鸿顺
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1