知识图谱构建方法、装置、信息穿透方法和系统制造方法及图纸

技术编号:26031574 阅读:11 留言:0更新日期:2020-10-23 21:09
本发明专利技术提供了一种知识图谱构建方法、装置、信息穿透方法和系统,所述方法包含:获取待分析目标的注册信息数据源和网页数据源,根据所述注册信息数据源和所述网页数据源构建领域本体信息;利用所述领域本体信息构建Karma模型,并通过Karma模型对所述注册信息数据和所述网页数据信息进行数据融合分析获得第一RDF数据;基于所述领域本体信息通过Jena推理引擎对所述第一RDF数据进行补全修正后获得第二RDF数据,根据所述第二RDF数据通过Neo4j图数据库构建获得知识图谱。

【技术实现步骤摘要】
知识图谱构建方法、装置、信息穿透方法和系统
本专利技术涉及知识图谱
,尤其是涉及一种知识图谱构建方法、装置、信息穿透方法和系统。
技术介绍
在大数据时代,为了高效利用海量的互联网数据,国内外互联网公司纷纷以此为基础构建知识图谱,知识图谱以其强大的知识组织能力和语义处理能力在智能问答、语义推荐、舆情分析等众多领域发挥着重要作用。但是目前针对银行大数据应用领域的知识图谱非常匮乏。虽然银行积累了大量的客户信息和企业信息,但银行传统的数据分析和机器学习方式更多的只是将客户和企业作为单独的个体进行分析,许多客户和企业的基础信息仅仅是孤立的存在,没有实现数据之间的互联互通,没有形成统一数据标准并有效整合起来,系统无法在客户群体间和企业群体间进行深层次关系挖掘和穿透。客户经理也无法直观全面了解客户相关的企业法人、企业信息以及企业之间的关联信息,很难深度挖掘出企业最终受益人、深度挖掘和钻取目标客户信息及关联信息等有效的营销信息,无法为客户提供分层次有针对性客户服务和营销管理。基于上述的情况,客户经理只能去各大公开网站手工进行对公客户相关企业信息搜集,对客户相关企业信息进行人工分析挖掘目标客户进行营销,但一个对公客户经理的精力是有限的,无法快速有效的在海量的企业中寻找到优质重点客户。鉴于此,如何打破企业、法人等信息孤点,实现客户企业信息的互联互通,将企业大数据高效的利用起来,进行企业集团信息穿透,解决企业集团信息壁垒问题在当前环境中尤为重要。
技术实现思路
本专利技术目的在于提供一种知识图谱构建方法、装置及信息穿透系统,实现企业数据的互联互通,将异构、多源的数据有效融合予以构建统一的知识图谱,利用该知识图谱予以展现更精准的目标数据。为达上述目的,本专利技术所提供的知识图谱构建方法,所述方法包含:获取待分析目标的注册信息数据源和网页数据源,根据所述注册信息数据源和所述网页数据源构建领域本体信息;利用所述领域本体信息构建Karma模型,并通过Karma模型对所述注册信息数据和所述网页数据信息进行数据融合分析获得第一RDF数据;基于所述领域本体信息通过Jena推理引擎对所述第一RDF数据进行补全修正后获得第二RDF数据,根据所述第二RDF数据通过Neo4j图数据库构建获得知识图谱。在上述知识图谱构建方法中,优选的,获取待分析目标的注册信息数据源和网页数据源,根据所述注册信息数据源和所述网页数据源构建领域本体信息包含:于所述注册信息数据源中获得注册信息数据,将所述网页数据源转化为结构化数据后获得网页数据信息;根据所述注册信息数据和所述网页数据信息分析获得两者各自的数据属性及两者之间的语义关联关系;根据所述数据属性和所述语义关联关系构建领域本体信息。在上述知识图谱构建方法中,优选的,利用所述领域本体信息构建Karma模型包含:根据所述注册信息数据和所述网页信息数据构建多源化结构数据;利用CRF模型学习语义分析所述多源化结构数据与所述领域本体信息之间的映射关系;通过所述领域本体信息和所述映射关系构建Karma模型。在上述知识图谱构建方法中,优选的,通过Jena推理引擎对所述第一RDF数据进行推理补全获得第二RDF数据包含:通过Jena推理引擎分析所述第一RDF数据中各数据之间的层次关系,将所述层次关系补入所述第一RDF数据中,获得第二RDF数据。在上述知识图谱构建方法中,优选的,通过Jena推理引擎对所述第一RDF数据进行推理补全获得第二RDF数据包含:通过OWL推理机分析所述第一RDF数据中各数据的类别信息,将所述类别信息与预定阈值比较,根据比较结果补全所述第一RDF数据中对应数据的类别信息,获得第二RDF数据。在上述知识图谱构建方法中,优选的,基于所述领域本体信息通过Jena推理引擎对所述第一RDF数据进行推理补全获得第二RDF数据还包含:根据所述领域本体信息对所述第一RDF数据进行一致性检测,对不一致数据进行标识。在上述知识图谱构建方法中,优选的,基于所述领域本体信息通过Jena推理引擎对所述第一RDF数据进行推理补全获得第二RDF数据还包含:获取预定的规则语言,通过Jena推理引擎的自定义规则语法将所述规则语言转化为推理规则;在所述领域本体信息约束下,根据所述推理规则分析所述第一RDF数据中各数据之间的关系,获得自定义规则关系;将所述自定义规则关系补入所述第一RDF数据中,获得第二RDF数据。本专利技术还提供一种信息穿透方法,所述方法包含:获取待分析目标的注册信息数据源和网页数据源,根据所述注册信息数据源和所述网页数据源构建领域本体信息;利用所述领域本体信息构建Karma模型,并通过Karma模型对所述注册信息数据和所述网页数据信息进行数据融合分析获得第一RDF数据;基于所述领域本体信息通过Jena推理引擎对所述第一RDF数据进行补全修正后获得第二RDF数据,根据所述第二RDF数据通过Neo4j图数据库构建获得知识图谱;根据接收到的查询请求分析获得查询要素,根据所述查询要素和所述知识图谱获得所述查询请求对应目标的相关信息,将相关信息展示输出。本专利技术还提供一种知识图谱构建装置,所述装置包含知识获取模块、知识融合模块和知识加工模块;所述知识获取模块用于获取待分析目标的注册信息数据源和网页数据源,根据所述注册信息数据源和所述网页数据源构建领域本体信息;所述知识融合模块用于利用所述领域本体信息构建Karma模型,并通过Karma模型对所述注册信息数据和所述网页数据信息进行数据融合分析获得第一RDF数据;所述知识加工模块用于基于所述领域本体信息通过Jena推理引擎对所述第一RDF数据进行补全修正后获得第二RDF数据,根据所述第二RDF数据通过Neo4j图数据库构建获得知识图谱。本专利技术还提供一种包含上述知识图谱构建装置的信息穿透系统,所述系统还包含企业实体查询装置、法人实体查询装置和关系查询装置;所述企业实体查询装置用于根据接收到的企业名称于所述知识图谱中定位获得对应的企业信息,将所述企业信息的一个或多个关联关系通过预设标识标定后展示输出;所述法人实体查询装置用于根据接收到的法人名称于所述知识图谱中定位获得对应的法人信息,根据所述法人信息关联的一个或多个企业信息生成关系图谱并展示输出;所述关系查询装置用于根据接收到的至少两个法人名称于所述知识图谱中获得所述法人名称对应法人之间的关联关系,将所述关联关系展示输出。本专利技术还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法。本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质存储有执行上述方法的计算机程序。本专利技术的有益技术效果在于:利用知识图谱技术以企业法人为核心”将异构、多源的数据组织成一个企业关系网络,将银行孤立的客户、企业基础数据节点融合到统一的企业知识图谱中,帮助银行打破企业、法人等信息孤点,实现客户企业信息的互联互通,将银行的企业大数据高效的利用起来,进行企业集团信息穿透,解决企业集团信息壁垒问题。附图本文档来自技高网...

【技术保护点】
1.一种知识图谱构建方法,其特征在于,所述方法包含:/n获取待分析目标的注册信息数据源和网页数据源,根据所述注册信息数据源和所述网页数据源构建领域本体信息;/n利用所述领域本体信息构建Karma模型,并通过Karma模型对所述注册信息数据和所述网页数据信息进行数据融合分析获得第一RDF数据;/n基于所述领域本体信息通过Jena推理引擎对所述第一RDF数据进行补全修正后获得第二RDF数据,根据所述第二RDF数据通过Neo4j图数据库构建获得知识图谱。/n

【技术特征摘要】
1.一种知识图谱构建方法,其特征在于,所述方法包含:
获取待分析目标的注册信息数据源和网页数据源,根据所述注册信息数据源和所述网页数据源构建领域本体信息;
利用所述领域本体信息构建Karma模型,并通过Karma模型对所述注册信息数据和所述网页数据信息进行数据融合分析获得第一RDF数据;
基于所述领域本体信息通过Jena推理引擎对所述第一RDF数据进行补全修正后获得第二RDF数据,根据所述第二RDF数据通过Neo4j图数据库构建获得知识图谱。


2.根据权利要求1所述的知识图谱构建方法,其特征在于,获取待分析目标的注册信息数据源和网页数据源,根据所述注册信息数据源和所述网页数据源构建领域本体信息包含:
于所述注册信息数据源中获得注册信息数据,将所述网页数据源转化为结构化数据后获得网页数据信息;
根据所述注册信息数据和所述网页数据信息分析获得两者各自的数据属性及两者之间的语义关联关系;
根据所述数据属性和所述语义关联关系构建领域本体信息。


3.根据权利要求2所述的知识图谱构建方法,其特征在于,利用所述领域本体信息构建Karma模型包含:
根据所述注册信息数据和所述网页信息数据构建多源化结构数据;
利用CRF模型学习语义分析所述多源化结构数据与所述领域本体信息之间的映射关系;
通过所述领域本体信息和所述映射关系构建Karma模型。


4.根据权利要求1所述的知识图谱构建方法,其特征在于,通过Jena推理引擎对所述第一RDF数据进行推理补全获得第二RDF数据包含:
通过Jena推理引擎分析所述第一RDF数据中各数据之间的层次关系,将所述层次关系补入所述第一RDF数据中,获得第二RDF数据。


5.根据权利要求1所述的知识图谱构建方法,其特征在于,通过Jena推理引擎对所述第一RDF数据进行推理补全获得第二RDF数据包含:
通过OWL推理机分析所述第一RDF数据中各数据的类别信息,将所述类别信息与预定阈值比较,根据比较结果补全所述第一RDF数据中对应数据的类别信息,获得第二RDF数据。


6.根据权利要求1所述的知识图谱构建方法,其特征在于,基于所述领域本体信息通过Jena推理引擎对所述第一RDF数据进行推理补全获得第二RDF数据还包含:根据所述领域本体信息对所述第一RDF数据进行一致性检测,对不一致数据进行标识。


7.根据权利要求1所述的知识图谱构建方法,其特征在于,基于所述领域本体信息通过Jena推理引擎对所述第一RDF数据进行推理补全获得第二RDF数据还包含:获取预定的规则语言,通过Jena推理引擎的自定义规则...

【专利技术属性】
技术研发人员:叶彩萍洪伙彪何思略刘洋
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1