一种构建知识图谱的方法、装置、计算机存储介质及终端制造方法及图纸

技术编号:24409933 阅读:28 留言:0更新日期:2020-06-06 08:44
一种构建知识图谱的方法、装置、计算机存储介质及终端,包括:将一种或一种以上源数据,根据主题整理为主题域数据;根据整理获得的主题域数据构建主题域图谱;从构建的主题域图谱中获取对应于各应用的图数据库数据,并根据获取的图数据库数据构建各应用的应用知识图谱;其中,所述主题域数据包括:关系主题域数据和实体主题域数据。本发明专利技术实施例降低了源数据与构建的知识图谱的耦合性,提升了应用知识图谱的构建效率。

A method, device, computer storage medium and terminal for building knowledge map

【技术实现步骤摘要】
一种构建知识图谱的方法、装置、计算机存储介质及终端
本文涉及但不限于知识图谱技术,尤指一种构建知识图谱的方法、装置、计算机存储介质及终端。
技术介绍
随着数字化转型,包括银行、保险和证券等大中型金融机构基本已经完成了数据仓库和数据集市的建设。主流的数据仓库实施方案中,将来自不同业务源的数据打散后,根据主题重新进行组织;以银行业为例,使用的主题包括:当事人、产品、协议、事件、资产、财务、机构、地域、营销及渠道等。数据仓库的结构稳定,但缺乏灵活性。为了灵活应对各种业务场景的应用任务,在数据仓库之上还要开发数据集市,直接面向应用。然而,在一些需要对数据之间的关联关系做深层挖掘的应用场景中,上述数据仓库和数据集市的查询效率很低;比如查询信用卡客户三度以上的人脉关系、查询对公客户三度以上的股权关系(一度公司为A公司、则二度公司为A公司投资的B公司、三度公司为B公司控股的C公司)等;在做深层次关联查询时,该方法查询效率低;假设数据库里有A:姓名-身份证对应表、B:配偶关系表和C:父母关系表三张表,每张表都有100万行;则查张三的丈母娘是谁时,需要A本文档来自技高网...

【技术保护点】
1.一种构建知识图谱的方法,包括:/n将一种或一种以上源数据,根据主题整理为主题域数据;/n根据整理获得的主题域数据构建主题域图谱;/n从构建的主题域图谱中获取对应于各应用的图数据库数据,并根据获取的图数据库数据构建各应用的应用知识图谱;/n其中,所述主题域数据包括:关系主题域数据和实体主题域数据。/n

【技术特征摘要】
1.一种构建知识图谱的方法,包括:
将一种或一种以上源数据,根据主题整理为主题域数据;
根据整理获得的主题域数据构建主题域图谱;
从构建的主题域图谱中获取对应于各应用的图数据库数据,并根据获取的图数据库数据构建各应用的应用知识图谱;
其中,所述主题域数据包括:关系主题域数据和实体主题域数据。


2.根据权利要求1所述的方法,其特征在于,所述根据主题整理为主题域数据,包括:
将所述源数据根据主题进行拆分;
将根据主题拆分获得的数据进行汇总处理后,获得所述主题域数据;
其中,所述主题包括根据以下一项或任意组合的因素拆分的主题:人物、事件、地点、物体及组织。


3.根据权利要求1所述的方法,其特征在于,所述根据整理获得的主题域数据构建主题域图谱,包括:
将所述主题域数据按照预设的三元组结构进行存储;
根据按照三元组结构存储的数据,构建所述主题域图谱;
其中,所述三元组结构包括:根据业务关联关系设置的数据结构。


4.根据权利要求3所述的方法,其特征在于,所述三元组结构中包括:第一参数、第二参数及关系实体;
其中,所述第一参数和第二参数包括:根据所述业务关联关系从所述实体主题域数据中获得的实体,所述关系实体包括:根据所述业务关联关系从所述关系主题域数据中获得的实体。


5.根据权利要求1~4任一项所述的方法,其特征在于,所述从构建的主题域图谱中获取对应于各应用的图数据库数据,包括:
根据应用所涉及主题,从构建的所述主题域图谱中各应用所涉及...

【专利技术属性】
技术研发人员:张杰袁杰邓礼志于皓吴信东
申请(专利权)人:北京明略软件系统有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1