一种面向金融领域的大规模知识图谱构建方法技术

技术编号:39837597 阅读:6 留言:0更新日期:2023-12-29 16:23
本发明专利技术公开一种面向金融领域的大规模知识图谱构建方法,涉及知识图谱技术领域,拟解决大规模领域知识的异构性和独立性带来的多元化大规模知识图谱构建问题;本发明专利技术包括

【技术实现步骤摘要】
一种面向金融领域的大规模知识图谱构建方法


[0001]本专利技术涉及知识图谱
,具体涉及一种面向金融领域的大规模知识图谱构建方法


技术介绍

[0002]大规模知识图谱构建技术在金融领域具有重要的应用价值,它可以将海量的金融数据和知识整合为一个结构化的图谱,帮助金融机构更好地理解和利用数据,支持决策和风险管理

其中多类型知识的表示与自动获取

整合金融领域多源异构数据

海量知识的高效推理计算

提高知识质量与时效性计算是当前金融领域大规模知识图谱构建亟待解决的关键问题


技术实现思路

[0003]为了解决上述现有技术中存在的问题,本专利技术提供了一种面向金融领域的大规模知识图谱构建方法,拟解决大规模领域知识的异构性和独立性带来的多元化大规模知识图谱构建问题

[0004]一种面向金融领域的大规模知识图谱构建方法,包括:
[0005]S1
:从开放知识库获取金融和经济数据,进行概念抽取和知识抽取然后构建大规模知识图谱;
[0006]S2
:在大规模知识图谱的基础上构建常识知识库;
[0007]S3
:利用大规模知识图谱对常识知识库进行知识扩充;
[0008]S4
:利用图表示学习模块进行常识知识库

大规模知识图谱联合表示学习

[0009]优选的,
S1
中所述知识抽取包括实体识别和关系抽取,所述知识抽取过程包括:
[0010]采用基于卷积深层神经网络解决知识获取过程中的文本语义表示问题,减少传统方法对自然语言处理工具的过分依赖以及误差累积问题;
[0011]采用基于强化学习的端到端知识库问答与推理方法将传统基于符号表示的问答

推理过程转变成基于语义数值计算的可学习问题,以此进行实体间的相关性计算和知识推理

[0012]优选的,
S2
中所述常识知识库包括实例库

规则库和关联库,其中实例库包括常识实例表示和常识知识获取;规则库包括构建金融领域词汇本体和制定规则;关联库包括计算目标相似矩阵

[0013]优选的,
S3
中所述知识扩充包括正向推理和反向推理,其中正向推理利用知识图谱中已存在的事实,如关系三元组,去匹配规则的前提条件部分,当规则的前提条件满足后,则将其结论部分的事实添加到常识知识库中进行扩充;反向推理则先假定一个目标,接着寻找一个规则的结论部分能够匹配目标的规则,接着递归地证明该规则的前提条件都是成立的,当证明成立后将其结论部分的事实添加到常识知识库

[0014]优选的,所述图表示学习模块包括转化层

模型层和接口层,其中转化层将原始的
知识图谱转化为标准图并获得其邻接矩阵表示,同时提供便于查询顶点表示的查询表;模型层将邻接矩阵作为输入通过图表示学习模型获得各个顶点的低维向量表示构成的向量表示矩阵;接口层根据实际任务需要通过查询表获得分类标签的向量表示并将其转化为概率分布并进一步将其转化为图关联矩阵作为深度学习模块分类结果的偏置以指示学习过程,起到加速收敛的效果

[0015]优选的,所述转化层用于将知识图谱进行预处理转化为标准图便于后续输入图表示学习模型,包括:给定知识图谱
(H,R,T)
,其中
H
为头实体集合,
R
为尾实体集合,
T
为关系集合,知识推理规则中涉及的所有谓词构成集合
U
,其中推理规则表示为
((Hi,Rp,Tj)),Uf,((Hi,Rq,Tj))
,用以表示实体关系之间的推理过程

[0016]优选的,所述模型层包括图表示学习模型,应用图表示学习模型的过程包括:第一

通过无监督学习的方式重构每个顶点的邻域结构来保留局部特性;第二

采用拉普拉斯映射通过监督学习的方式将一阶相似性作为监督信息进一步学习图的全局特性

[0017]优选的,所述接口层通过计算关系矩阵

构建关联图和构建范围界定的方式将图表示转化为下游任务可应用的形式

[0018]优选的,还包括基于分布式计算技术
Spark

Flink
构建大规模计算引擎,对海量图谱知识根据业务需要进行分层级处理,对不同知识进行实时

近实时和离线计算,提升计算速度,从而对大规模图谱动态实时更新

[0019]本专利技术的有益效果包括:
[0020]本专利技术集成金融领域的多个数据源和多种类型知识,解决金融领域关键知识库存在的数据分散

冗余和不一致的问题,提供更全面和一致的知识视图,实现大规模数据的共享和交互,使金融知识的查询

推理变得更高效

另外,本专利技术中自动化和半自动化
(
自动化指的是运用脚本自动获取金融数据,其中获取数据的规则可以根据需求进行指定;半自动化指的是图谱在基于深度学习算法进行图谱实体抽取及关联时,以及图谱在基于常识知识进行扩充时引入专家进行二次扩充和修正
)
的知识抽取

关联过程有效减少人工处理的工作量,提高图谱构建效率,定期更新和维护知识图谱可随数据的增长和领域的拓展而壮大,具备较强的可扩展性和适应性

此外,大规模金融知识图谱的构建在诸如用户全景画像和关系挖掘

风险评估

供应链金融等领域有着广泛的应用前景

附图说明
[0021]图1为实施例1一种面向金融领域的大规模知识图谱构建方法的架构图

[0022]图2为实施例1大规模知识图谱构建详细流程图

[0023]图3为实施例1常用知识图谱构建技术路线图

[0024]图4为实施例1常识知识库结构技术路线图

[0025]图5为实施例1基于常识知识库的知识扩充方法

[0026]图6为实施例1知识图谱表示学习模块技术路线图
具体实施方式
[0027]为使本申请实施例的目的

技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚

完整地描述,显然,所描述的实施例仅是
本申请一部分实施例,而不是全部的实施例

因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例

基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种面向金融领域的大规模知识图谱构建方法,其特征在于,包括:
S1
:从开放知识库获取金融和经济数据,进行概念抽取和知识抽取然后构建大规模知识图谱;
S2
:在大规模知识图谱的基础上构建常识知识库;
S3
:利用大规模知识图谱对常识知识库进行知识扩充;
S4
:利用图表示学习模块进行常识知识库

大规模知识图谱联合表示学习
。2.
根据权利要求1所述的一种面向金融领域的大规模知识图谱构建方法,其特征在于,
S1
中所述知识抽取包括实体识别和关系抽取,所述知识抽取过程包括:采用基于卷积深层神经网络解决知识获取过程中的文本语义表示问题,减少传统方法对自然语言处理工具的过分依赖以及误差累积问题;采用基于强化学习的端到端知识库问答与推理方法将传统基于符号表示的问答

推理过程转变成基于语义数值计算的可学习问题,以此进行实体间的相关性计算和知识推理
。3.
根据权利要求1所述的一种面向金融领域的大规模知识图谱构建方法,其特征在于,
S2
中所述常识知识库包括实例库

规则库和关联库,其中实例库包括常识实例表示和常识知识获取;规则库包括构建金融领域词汇本体和制定规则;关联库包括计算目标相似矩阵
。4.
根据权利要求1所述的一种面向金融领域的大规模知识图谱构建方法,其特征在于,
S3
中所述知识扩充包括正向推理和反向推理,其中正向推理利用知识图谱中已存在的事实去匹配规则的前提条件部分,当规则的前提条件满足后,则将其结论部分的事实添加到常识知识库中进行扩充,所述已存在的事实包括关系三元组;反向推理则先假定一个目标,寻找一个规则的结论部分能够匹配目标的规则,递归地证明该规则的前提条件都是成立的,当证明成立后将其结论部分的事实添加到常识知识库
。5.
根据权利要求1所述的一种面向金融领域的大规模知识图谱构建方法,其特征在于,所述图表示学习模块包括转化层

模型层和接口层,其中转化层将原始的知识图谱转化为标准图并获得其邻接矩阵表示,同时提供便于查询顶点表示的查询表...

【专利技术属性】
技术研发人员:曾俊涛陈波毛艳玲邓媛丹陈圩钦
申请(专利权)人:宜宾电子科技大学研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1