当前位置: 首页 > 专利查询>中山大学专利>正文

基于公司知识图谱的关系发现方法、装置及存储介质制造方法及图纸

技术编号:20075032 阅读:15 留言:0更新日期:2019-01-15 00:37
本发明专利技术公开了一种基于公司知识图谱的关系发现方法,包括:根据从设定的数据源获取的实体的名称和基本关系生成公司知识图谱,根据所述公司知识图谱进行关系发现,包括发现目标公司的实际控制人、发现目标公司之间的路径、发现目标公司股东与其他公司的持股关系、发现目标公司的关联公司和关联自然人等。本发明专利技术还公开了一种基于公司知识图谱的关系发现装置和计算机存储介质。本发明专利技术通过根据从设定的数据源中获取的实体的名称和所述基本关系生成公司知识图谱,并基于公司知识图谱进行包括公司、分支机构、政府机构、社会组织、行业门类和自然人之间的关系发现,提供了一种深入挖掘实体隐含关系的方法。

Relation Discovery Method, Device and Storage Media Based on Company Knowledge Map

The invention discloses a method of relationship discovery based on company knowledge atlas, which includes: generating company knowledge atlas according to the names and basic relationships of entities acquired from the set data sources, and discovering relationships according to the company knowledge atlas, including discovering the actual controller of the target company, finding the path between the target company, and discovering the shareholders of the target company and other companies. Equity ownership, the discovery of affiliated companies and associated natural persons of the target company, etc. The invention also discloses a relationship discovery device and a computer storage medium based on the company knowledge map. The invention provides a method for deep mining the implied relationship of entities by generating the company knowledge map according to the name of entities obtained from the set data source and the basic relationship, and discovering the relationship among companies, branches, government agencies, social organizations, industry categories and natural persons based on the company knowledge map.

【技术实现步骤摘要】
基于公司知识图谱的关系发现方法、装置及存储介质
本专利技术涉及计算机
,尤其涉及一种基于公司知识图谱的关系发现方法、基于公司知识图谱的关系发现装置及计算机存储介质。
技术介绍
金融行业利用现代化的数据库和数据仓库系统,存储了大量的高管、股东、持股金额、行业板块等各种信息。但是数据存在着结构与非结构化数据并存的特点,对分析手段提出了新的要求与挑战。这些数据经常是以关系型数据库进行存储的,无法保存数据之间的层级结构,必须通过添加属性来进行标记和外联,低效率的联动匹配操作难以通过数据找到它们内部潜在的关系。在对一家公司进行分析的时候,尤其是针对一家上市公司,希望通过了解这家公司的股权关系,股东结构,实际控制人以及对外投资的情况来获得该公司的风险要素。公司背后的实际控制人是谁,公司、高管、股东之间的相互关系,都可以借助知识图谱来进行分析和挖掘,以获得答案。现有技术中有通过知识图谱来分析公司和组织之间的投资关系,使用的是狄克斯特拉算法(Dijkstra算法)和深度优先算法,功能比较单一,仅展示了公司之间的投资关系,没有考虑到公司和自然人之间的关联,无法深入挖掘潜在的会增加风险的关系。上述内容仅用于辅助理解本专利技术的技术方案,并不代表承认上述内容是现有技术。
技术实现思路
本专利技术的主要目的在于提供一种基于公司知识图谱的关系发现方法、基于公司知识图谱的关系发现装置和计算机存储介质,旨在解决现有技术中在通过知识图谱来分析公司和组织之间的投资关系时,没有考虑到公司和自然人之间的关联,无法深入挖掘潜在的会增加风险的关系的技术问题。为实现上述目的,本专利技术提供一种基于公司知识图谱的关系发现方法,所述基于公司知识图谱的关系发现方法包括如下步骤:从设定数据源中获取实体的名称和各个所述实体之间的基本关系,其中,所述实体包括公司、分支机构、政府机构、社会组织、行业门类和自然人,所述基本关系包括持股关系、任职关系、所属行业关系和拥有分支机构关系;根据所述实体的名称和所述基本关系生成公司知识图谱;根据所述公司知识图谱进行关系发现,包括发现目标公司的实际控制人、发现目标公司之间的路径、发现目标公司股东与其他公司的持股关系、发现目标公司的关联公司和关联自然人、发现目标自然人的关联公司和关联自然人、发现目标自然人之间的路径和发现目标公司的整体架构。优选地,所述根据所述公司知识图谱进行关系发现,发现目标公司的实际控制人的步骤包括:在所述公司知识图谱中确定所述目标公司对应的节点;生成以所述目标公司对应的节点为中心的子图,其中,所述子图中的节点之间均为持股关系的边;计算所述子图中各条边的持股比例;根据所述各条边的持股比例计算所述子图中各个叶子节点对所述目标公司对应的节点的持股比例;将持股比例最高的叶子节点标记为所述目标公司的实际控制人。优选地,所述计算所述子图中各条边的持股比例的步骤包括:确定每条边的持股节点和被持股节点;判断所述被持股节点对应的公司是否存在有效的注册资本;当所述被持股节点对应的公司存在有效的注册资本时,将所述持股节点对应的公司或自然人的应缴金额除以所述注册资本,得到所述持股节点对所述被持股节点的持股比例。优选地,所述根据所述公司知识图谱进行关系发现,发现目标公司之间的路径的步骤包括:确定第一目标公司对应的第一节点和第二目标公司对应的第二节点;采用深度优先算法,在所述公司知识图谱中查找以所述第一节点为起点并以所述第二节点为终点的路径,其中所述路径包含任职关系和/或持股关系。优选地,所述根据所述公司知识图谱进行关系发现,发现目标自然人之间的路径的步骤包括:确定第一目标自然人对应的第一节点和第二目标自然人对应的第二节点;采用深度优先算法,在所述公司知识图谱中查找以所述第一节点为起点并以所述第二节点为终点的路径,其中所述路径包含任职关系。优选地,所述根据所述公司知识图谱进行关系发现,发现目标公司之间的路径的步骤包括:对所述公司知识图谱进行压缩,得到所述公司知识图谱对应的抽象图和所述抽象图中的超点在所述公司知识图谱中对应的原始节点集合;在所述抽象图中确定第一目标公司对应的第一超点和第二目标公司对应的第二超点;采用深度优先算法,在所述抽象图中查找以所述第一超点为起点并以所述第二超点为终点的第一路径,其中所述第一路径仅包含任职关系和/或持股关系;获取所述第一路径中的超点对应的原始节点集合;在所述公司知识图谱中确定第一目标公司对应的第一节点和第二目标公司对应的第二节点;采用深度优先算法,在所述公司知识图谱中根据所述第一路径中的超点对应的原始节点集合查找第二路径,其中,所述第二路径以所述第一节点为起点并以所述第二节点为终点,所述第二路径仅包含任职关系和/或持股关系。优选地,所述对所述公司知识图谱进行压缩,得到所述公司知识图谱对应的抽象图和所述抽象图中的超点在所述公司知识图谱中对应的原始节点集合的步骤包括:随机访问所述公司知识图谱中的一个节点;获取与所述节点的距离在预设距离之内的邻居节点;将所述邻居节点中属性相似的节点合并成为超点;将所述属性相似的节点保存为所述超点在所述公司知识图谱中对应的原始节点集合;返回执行所述随机访问所述公司知识图谱中的一个节点的步骤,直至所述公司知识图谱中的节点都被访问完毕。优选地,所述属性包括:行业类别、业务范围、注册资本、公司注册所属地。此外,为实现上述目的,本专利技术还提供所述基于公司知识图谱的关系发现装置,该装置包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于公司知识图谱的关系发现处理程序,所述基于公司知识图谱的关系发现处理程序被所述处理器执行时实现如上所述的基于公司知识图谱的关系发现方法的步骤。此外,为实现上述目的,本专利技术还提出一种计算机存储介质,其特征在于,所述计算机存储介质上存储有基于公司知识图谱的关系发现的处理程序,所述基于公司知识图谱的关系发现的处理程序被处理器执行时实现如上所述的基于公司知识图谱的关系发现方法的步骤。本专利技术实施例提出的基于公司知识图谱的关系发现方法、基于公司知识图谱的关系发现装置和计算机存储介质,根据从设定的数据源获取的实体的名称和基本关系生成公司知识图谱,根据所述公司知识图谱进行关系发现,包括发现目标公司的实际控制人、发现目标公司之间的路径、发现目标公司股东与其他公司的持股关系、发现目标公司的关联公司和关联自然人等。本专利技术通过根据从设定的数据源中获取的实体的名称和所述基本关系生成公司知识图谱,并基于公司知识图谱进行包括公司、分支机构、政府机构、社会组织、行业门类和自然人之间的关系发现,提供了一种深入挖掘实体隐含关系的方法。附图说明图1是本专利技术实施例方案涉及的硬件运行环境的终端结构示意图;图2为本专利技术基于公司知识图谱的关系发现方法第一实施例的流程示意图;图3为本专利技术基于公司知识图谱的关系发现方法第一实施例的持股比例计算示意图;图4为本专利技术基于公司知识图谱的关系发现方法第二实施例的流程示意图;图5为本专利技术基于公司知识图谱的关系发现方法第二实施例的在原始公司知识图谱二次搜索路径示意图。本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。如图1所示,图1是本专利技术实施例方案本文档来自技高网...

【技术保护点】
1.一种基于公司知识图谱的关系发现方法,其特征在于,所述基于公司知识图谱的关系发现方法包括以下步骤:从设定数据源中获取实体的名称和各个所述实体之间的基本关系,其中,所述实体包括公司、分支机构、政府机构、社会组织、行业门类和自然人,所述基本关系包括持股关系、任职关系、所属行业关系和拥有分支机构关系;根据所述实体的名称和所述基本关系生成公司知识图谱;根据所述公司知识图谱进行关系发现,包括发现目标公司的实际控制人、发现目标公司之间的路径、发现目标公司股东与其他公司的持股关系、发现目标公司的关联公司和关联自然人、发现目标自然人的关联公司和关联自然人、发现目标自然人之间的路径和发现目标公司的整体架构。

【技术特征摘要】
1.一种基于公司知识图谱的关系发现方法,其特征在于,所述基于公司知识图谱的关系发现方法包括以下步骤:从设定数据源中获取实体的名称和各个所述实体之间的基本关系,其中,所述实体包括公司、分支机构、政府机构、社会组织、行业门类和自然人,所述基本关系包括持股关系、任职关系、所属行业关系和拥有分支机构关系;根据所述实体的名称和所述基本关系生成公司知识图谱;根据所述公司知识图谱进行关系发现,包括发现目标公司的实际控制人、发现目标公司之间的路径、发现目标公司股东与其他公司的持股关系、发现目标公司的关联公司和关联自然人、发现目标自然人的关联公司和关联自然人、发现目标自然人之间的路径和发现目标公司的整体架构。2.如权利要求1所述的基于公司知识图谱的关系发现方法,其特征在于,所述根据所述公司知识图谱进行关系发现,发现目标公司的实际控制人的步骤包括:在所述公司知识图谱中确定所述目标公司对应的节点;生成以所述目标公司对应的节点为中心的子图,其中,所述子图中的节点之间均为持股关系的边;计算所述子图中各条边的持股比例;根据所述各条边的持股比例计算所述子图中各个叶子节点对所述目标公司对应的节点的持股比例;将持股比例最高的叶子节点标记为所述目标公司的实际控制人。3.如权利要求2所述的基于公司知识图谱的关系发现方法,其特征在于,所述计算所述子图中各条边的持股比例的步骤包括:确定每条边的持股节点和被持股节点;判断所述被持股节点对应的公司是否存在有效的注册资本;当所述被持股节点对应的公司存在有效的注册资本时,将所述持股节点对应的公司或自然人的应缴金额除以所述注册资本,得到所述持股节点对所述被持股节点的持股比例。4.如权利要求1所述的基于公司知识图谱的关系发现方法,其特征在于,所述根据所述公司知识图谱进行关系发现,发现目标公司之间的路径的步骤包括:确定第一目标公司对应的第一节点和第二目标公司对应的第二节点;采用深度优先算法,在所述公司知识图谱中查找以所述第一节点为起点并以所述第二节点为终点的路径,其中所述路径包含任职关系和/或持股关系。5.如权利要求1所述的基于公司知识图谱的关系发现方法,其特征在于,所述根据所述公司知识图谱进行关系发现,发现目标自然人之间的路径的步骤包括:确定第一目标自然人对应的第一节点和第二目标自然人对应的第二节点;采用深度优先算法,在所述公司知识图谱中查找以所述第一节点为起点并...

【专利技术属性】
技术研发人员:任江涛黎淇徐志康
申请(专利权)人:中山大学
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1