【技术实现步骤摘要】
知识图谱构建方法、装置、信息穿透方法和系统
本专利技术涉及知识图谱
,尤其是涉及一种知识图谱构建方法、装置、信息穿透方法和系统。
技术介绍
在大数据时代,为了高效利用海量的互联网数据,国内外互联网公司纷纷以此为基础构建知识图谱,知识图谱以其强大的知识组织能力和语义处理能力在智能问答、语义推荐、舆情分析等众多领域发挥着重要作用。但是目前针对银行大数据应用领域的知识图谱非常匮乏。虽然银行积累了大量的客户信息和企业信息,但银行传统的数据分析和机器学习方式更多的只是将客户和企业作为单独的个体进行分析,许多客户和企业的基础信息仅仅是孤立的存在,没有实现数据之间的互联互通,没有形成统一数据标准并有效整合起来,系统无法在客户群体间和企业群体间进行深层次关系挖掘和穿透。客户经理也无法直观全面了解客户相关的企业法人、企业信息以及企业之间的关联信息,很难深度挖掘出企业最终受益人、深度挖掘和钻取目标客户信息及关联信息等有效的营销信息,无法为客户提供分层次有针对性客户服务和营销管理。基于上述的情况,客户经理只能去各大公开网站手工进行对公客户相关企业信息搜集,对客户相关企业信息进行人工分析挖掘目标客户进行营销,但一个对公客户经理的精力是有限的,无法快速有效的在海量的企业中寻找到优质重点客户。鉴于此,如何打破企业、法人等信息孤点,实现客户企业信息的互联互通,将企业大数据高效的利用起来,进行企业集团信息穿透,解决企业集团信息壁垒问题在当前环境中尤为重要。
技术实现思路
本专利技术目的在于提供一种知识图谱构 ...
【技术保护点】
1.一种知识图谱构建方法,其特征在于,所述方法包含:/n获取待分析目标的注册信息数据源和网页数据源,根据所述注册信息数据源和所述网页数据源构建领域本体信息;/n利用所述领域本体信息构建Karma模型,并通过Karma模型对所述注册信息数据和所述网页数据信息进行数据融合分析获得第一RDF数据;/n基于所述领域本体信息通过Jena推理引擎对所述第一RDF数据进行补全修正后获得第二RDF数据,根据所述第二RDF数据通过Neo4j图数据库构建获得知识图谱。/n
【技术特征摘要】
1.一种知识图谱构建方法,其特征在于,所述方法包含:
获取待分析目标的注册信息数据源和网页数据源,根据所述注册信息数据源和所述网页数据源构建领域本体信息;
利用所述领域本体信息构建Karma模型,并通过Karma模型对所述注册信息数据和所述网页数据信息进行数据融合分析获得第一RDF数据;
基于所述领域本体信息通过Jena推理引擎对所述第一RDF数据进行补全修正后获得第二RDF数据,根据所述第二RDF数据通过Neo4j图数据库构建获得知识图谱。
2.根据权利要求1所述的知识图谱构建方法,其特征在于,获取待分析目标的注册信息数据源和网页数据源,根据所述注册信息数据源和所述网页数据源构建领域本体信息包含:
于所述注册信息数据源中获得注册信息数据,将所述网页数据源转化为结构化数据后获得网页数据信息;
根据所述注册信息数据和所述网页数据信息分析获得两者各自的数据属性及两者之间的语义关联关系;
根据所述数据属性和所述语义关联关系构建领域本体信息。
3.根据权利要求2所述的知识图谱构建方法,其特征在于,利用所述领域本体信息构建Karma模型包含:
根据所述注册信息数据和所述网页信息数据构建多源化结构数据;
利用CRF模型学习语义分析所述多源化结构数据与所述领域本体信息之间的映射关系;
通过所述领域本体信息和所述映射关系构建Karma模型。
4.根据权利要求1所述的知识图谱构建方法,其特征在于,通过Jena推理引擎对所述第一RDF数据进行推理补全获得第二RDF数据包含:
通过Jena推理引擎分析所述第一RDF数据中各数据之间的层次关系,将所述层次关系补入所述第一RDF数据中,获得第二RDF数据。
5.根据权利要求1所述的知识图谱构建方法,其特征在于,通过Jena推理引擎对所述第一RDF数据进行推理补全获得第二RDF数据包含:
通过OWL推理机分析所述第一RDF数据中各数据的类别信息,将所述类别信息与预定阈值比较,根据比较结果补全所述第一RDF数据中对应数据的类别信息,获得第二RDF数据。
6.根据权利要求1所述的知识图谱构建方法,其特征在于,基于所述领域本体信息通过Jena推理引擎对所述第一RDF数据进行推理补全获得第二RDF数据还包含:根据所述领域本体信息对所述第一RDF数据进行一致性检测,对不一致数据进行标识。
7.根据权利要求1所述的知识图谱构建方法,其特征在于,基于所述领域本体信息通过Jena推理引擎对所述第一RDF数据进行推理补全获得第二RDF数据还包含:获取预定的规则语言,通过Jena推理引擎的自定义规则...
【专利技术属性】
技术研发人员:叶彩萍,洪伙彪,何思略,刘洋,
申请(专利权)人:中国工商银行股份有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。