一种面向银行业的全栈式金融知识图谱平台制造技术

技术编号:32835777 阅读:15 留言:0更新日期:2022-03-26 20:55
本发明专利技术涉及一种面向银行业的全栈式金融知识图谱平台,包括:图谱构建层,被配置为,进行源数据管理、创建逻辑图本体、生产图谱、进行图谱治理和进行任务调度;图仓管理层,被配置为,针对具体业务场景存储不同领域的图谱;服务应用层,被配置为,进行图谱可视化搜索、图谱数据挖掘、图谱查询和图谱模型应用;应用接口层,被配置为,为平台提供金融知识图谱服务访问能力。与现有技术相比,本发明专利技术实现了知识获取、知识表示、知识存储、知识融合、知识建模、知识计算、知识应用的图谱管理关键环节,支持知识原料到智慧数据转化的全过程,提供了全栈式图谱生产与应用服务能力,提高了图谱构建与生产效率。产效率。产效率。

【技术实现步骤摘要】
一种面向银行业的全栈式金融知识图谱平台


[0001]本专利技术涉及银行业的知识图谱领域,尤其是涉及一种面向银行业的全栈式金融知识图谱平台。

技术介绍

[0002]随着银行业务快速增长和客户服务水平的不断提高,数据以一种新的经济资产类别形式呈现出来,银行业迈入一个崭新的大数据信息时代,传统的数据库技术已难以支撑大数据处理需求,需要建立新型的创新机制,为基于大数据的业务模式创新提供条件与保障。近年来,国内各大银行业机构纷纷搭建大数据平台、数据仓库这类系统,但是海量数据内部的深层次关联关系仍然没有被构建出来,无法为风险管控、客户营销和全行级知识管理等领域提供全方位数据支持。
[0003]数据是基础,关系是关键,知识图谱作为一种实现数据和关系有效整合的新技术应运而生。知识图谱是用图的形式去存储和表示知识,是数据和关系最直观有效的表示方式。基于银行业务知识构建金融知识图谱,提供关联关系查询探索,支持业务规则挖掘分析。知识图谱作为一项新技术,其技术发展尚不够成熟,配套基础设施尚不够完善,难以满足不断增长的银行业图谱应用需求。因此,如何构建面向银行业的企业级知识图谱平台,是金融知识图谱技术应用推广的首要任务。
[0004]近年来,国内各大银行陆续对知识图谱技术展开探索与研究,并在获客营销、风险管控等业务场景进行实践应用,银行业内知识图谱技术的应用发展大致分为三个阶段。第一阶段是针对具体业务场景,构建业务领域图谱,提供关联关系查询和分析,并通过接口形式向应用系统提供服务。第二阶段是将知识图谱与机器学习技术相结合,构建基于知识图谱的机器学习模型,通过图算法抽取图特征,输入机器学习模型训练,提升模型预测的准确率,对金融图谱的可解释性规则进行挖掘,实现机器对信息的认知与感知。第三阶段是构建全域知识体系,快速实现生态内图智能应用,推动银行业务图谱服务向主动化、智慧化、个性化发展。目前国内银行机构对金融知识图谱技术的应用主要处于前两个阶段,伴随应用规模的拓展,其管理弊端逐渐凸显,存在以下三大痛点:
[0005]1、图谱应用以特定业务领域知识需求为导向,各自构建的图谱异质且分散,难以集成与复用。目前交行已构建对公、零售、风险、人资等领域图谱,分别运用于风险监测、授信管理、零售反欺诈、营销拓客、员工画像等业务场景,不同的领域图谱存储介质和本体结构均有所差异,难以实现图谱融合并对应用提供统一的图谱服务。
[0006]2、构建适配自身业务且落地支持应用的知识图谱,技术门槛较高,对非专业技术人员不友好。知识图谱的构建包括本体设计、schema建立、数据导入、图查询算法编写等步骤,其中涉及不同的本体设计工具、数据处理语言和图数据库产品,操作方法与编程语法呈现多样化特征,大多数银行业务人员难以全面掌握。
[0007]3、图谱构建与生产的不同环节交互复杂、协同效应差,图谱应用总体效率难以突破。从图谱数据导入到图谱构建,从图谱生产到图谱可视化展现,从图谱挖掘到图谱分析,
图谱构建与生产的不同环节存在数据与服务的交互需求,目前主要通过批量文件传输与联机接口实现交互,没有统一的规范与标准,导致图谱应用技术复杂、效率低下。
[0008]现有技术中有如下技术方案:
[0009]现有技术一:全线下手工处理图谱生产各环节是现有技术方案之一。结合业务知识手动创建实体关系三元组集合,采用Visio或者PPT绘制图谱模式。从业务系统获取源数据,手动完成图谱点边关系数据加工处理,生成点边关系文件导入图数据库,结合图数据库语言手动编写查询,为各类应用场景提供图谱查询服务。
[0010]现有技术一的缺点为:该技术方案中图谱生产工作主要依赖人工进行,包括数据收集、数据清洗、数据处理到图谱构建、图谱应用等整个流程,自动化程度低,导致图谱生产效率低下,无法快速响应银行日益增长的图谱应用需求。此外,图谱模式的构建工作高度依赖于业务专家的知识输入,具备较强的行业属性,通用性差,阻碍了图谱技术的规模化应用。
[0011]现有技术二:借助工具实现半自动化图谱生产是现有技术方案之二。依赖已有工具实现图谱生产的部分环节,包括源数据加工、图谱建模、图谱构建及图谱应用等环节,一定程度上提升了图谱生产效率。例如,常见的本体设计工具Protege提供处理图数据模型的创建、读取、更新和导出操作;商业化图数据库产品TigerGraph和Neo4j支持以节点、边和属性的原生图格式存储和查询数据,并提供类SQL语言用于图查询;Hadoop大数据生态下Spark组件内置高性能分布式图计算引擎GraphX,支持各类图指标计算与分析;前端页面可视化工具Cytoscape支持对节点与关系网络的可视化展示与探索。
[0012]现有技术二的缺点为:
[0013]第一,未涉及图谱治理。不同业务场景构建的领域图谱异质且分散,图谱治理难度大,无法形成银行业全域图谱,难以满足企业级图谱应用需求。该技术方案亟需一套统一的图谱治理框架,指导用户进行规范化的图谱生产,实现与外部数据源的高效融合,为开放银行的建设打造坚实的数据底座。
[0014]第二,缺少弹性的图数据共享架构。针对不同业务场景的图谱运营需求,该技术方案需由业务人员与技术人员分别提供领域模型与设计模式,共同协作完成图谱生产,实际应用中存在团队沟通成本高、图谱研发周期长、数据安全不可控、复用率低等问题。亟待提出一套平台化实现架构,由平台层提供图谱生产流水线、数据权限管理、图谱模式共享等公共服务,面向业务域提供自服务的图谱生产组件,快速适配不同业务场景需求,获得灵活可扩展的图数据共享能力。

技术实现思路

[0015]本专利技术的目的就是为了克服上述现有技术存在图谱构建和生产效率低、图谱异质分散难以复用、技术门槛高的缺陷而提供一种面向银行业的全栈式金融知识图谱平台。
[0016]本专利技术的目的可以通过以下技术方案来实现:
[0017]一种面向银行业的全栈式金融知识图谱平台,包括:
[0018]图谱构建层,被配置为,进行源数据管理、创建逻辑图本体、生产图谱、进行图谱治理和进行任务调度;
[0019]图仓管理层,被配置为,针对具体业务场景存储不同领域的图谱;
[0020]服务应用层,被配置为,进行图谱可视化搜索、图谱数据挖掘、图谱查询和图谱模型应用;
[0021]应用接口层,被配置为,为平台提供金融知识图谱服务访问能力。
[0022]进一步地,所述全栈式金融知识图谱平台还包括:
[0023]基础设施层,被配置为,为图谱构建层提供平台源数据。
[0024]进一步地,所述基础设施层包括Paas云平台、大数据平台和AI能力平台中的一个或多个。
[0025]进一步地,所述图谱构建层包括源数据管理模块、建模中心、图谱生产中心、图谱治理中心和调度中心。
[0026]进一步地,所述源数据管理模块包括:
[0027]数据源同步子模块,被配置为,通过文件系统、实时接入数据和/或关系型数据库接入数据源;同步展示数据源内数据表名及中文描述信本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种面向银行业的全栈式金融知识图谱平台,其特征在于,包括:图谱构建层,被配置为,进行源数据管理、创建逻辑图本体、生产图谱、进行图谱治理和进行任务调度;图仓管理层,被配置为,针对具体业务场景存储不同领域的图谱;服务应用层,被配置为,进行图谱可视化搜索、图谱数据挖掘、图谱查询和图谱模型应用;应用接口层,被配置为,为平台提供金融知识图谱服务访问能力。2.根据权利要求1所述的一种面向银行业的全栈式金融知识图谱平台,其特征在于,所述全栈式金融知识图谱平台还包括:基础设施层,被配置为,为图谱构建层提供平台源数据。3.根据权利要求2所述的一种面向银行业的全栈式金融知识图谱平台,其特征在于,所述基础设施层包括Paas云平台、大数据平台和AI能力平台中的一个或多个。4.根据权利要求1所述的一种面向银行业的全栈式金融知识图谱平台,其特征在于,所述图谱构建层包括源数据管理模块、建模中心、图谱生产中心、图谱治理中心和调度中心。5.根据权利要求4所述的一种面向银行业的全栈式金融知识图谱平台,其特征在于,所述源数据管理模块包括:数据源同步子模块,被配置为,通过文件系统、实时接入数据和/或关系型数据库接入数据源;同步展示数据源内数据表名及中文描述信息;提供数据源同步过滤器,支持按增量、时间窗口、字段数值大小和/或表达式过滤;支持定时、按任务依赖关系调度;逻辑表映射子模块,被配置为,提供表格和图形化两类逻辑表数据映射方式,逐层实现实体/关系对象与数据表、实体/关系属性与表字段之间的映射关系,支持交互式数据查询、搜索与筛选。6.根据权利要求4所述的一种面向银行业的全栈式金融知识图谱平台,其特征在于,所述建模中心包括:本体创建子模块,被配置为,支持图形化和列表两种可视化创建本体,内置系统本体与系统属性可供继承设计,创建的本体提供一键引入作为项目逻辑图的本体的功能;本体管理子模块,被配置为,按本体类型区分为私有本体和共享本体,私有本体仅对创建该本体的用户可见,共享本体可分享给其他用户;提供本体版本管理功能,支持本体历史版本的查看与回溯。7.根据权利要求4所述的一种面向银行业的全栈式金融知识图谱平台,其特征在于,所述图谱生产中心包括:图谱构建子模块,被配置为,支持用户配置数据生产任务并将生产的点边数据发布至图数据库,提供覆盖数据读取、数据清洗、数据映射、图数据库导入的算子,用于不同的图谱生产任务;图谱存储子模块,被配置为,支持...

【专利技术属性】
技术研发人员:汪娜沈稚源仇钧付韶兴涂文斌
申请(专利权)人:交通银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1