【技术实现步骤摘要】
一种面向金融领域的大规模知识图谱构建方法
[0001]本专利技术涉及知识图谱
,具体涉及一种面向金融领域的大规模知识图谱构建方法
。
技术介绍
[0002]大规模知识图谱构建技术在金融领域具有重要的应用价值,它可以将海量的金融数据和知识整合为一个结构化的图谱,帮助金融机构更好地理解和利用数据,支持决策和风险管理
。
其中多类型知识的表示与自动获取
、
整合金融领域多源异构数据
、
海量知识的高效推理计算
、
提高知识质量与时效性计算是当前金融领域大规模知识图谱构建亟待解决的关键问题
。
技术实现思路
[0003]为了解决上述现有技术中存在的问题,本专利技术提供了一种面向金融领域的大规模知识图谱构建方法,拟解决大规模领域知识的异构性和独立性带来的多元化大规模知识图谱构建问题
。
[0004]一种面向金融领域的大规模知识图谱构建方法,包括:
[0005]S1
:从开放知识库获取金融和经济数据,进行概念抽取和知识抽取然后构建大规模知识图谱;
[0006]S2
:在大规模知识图谱的基础上构建常识知识库;
[0007]S3
:利用大规模知识图谱对常识知识库进行知识扩充;
[0008]S4
:利用图表示学习模块进行常识知识库
‑
大规模知识图谱联合表示学习
。
[0009]优选的,
S1
中所述知识抽取 ...
【技术保护点】
【技术特征摘要】
1.
一种面向金融领域的大规模知识图谱构建方法,其特征在于,包括:
S1
:从开放知识库获取金融和经济数据,进行概念抽取和知识抽取然后构建大规模知识图谱;
S2
:在大规模知识图谱的基础上构建常识知识库;
S3
:利用大规模知识图谱对常识知识库进行知识扩充;
S4
:利用图表示学习模块进行常识知识库
‑
大规模知识图谱联合表示学习
。2.
根据权利要求1所述的一种面向金融领域的大规模知识图谱构建方法,其特征在于,
S1
中所述知识抽取包括实体识别和关系抽取,所述知识抽取过程包括:采用基于卷积深层神经网络解决知识获取过程中的文本语义表示问题,减少传统方法对自然语言处理工具的过分依赖以及误差累积问题;采用基于强化学习的端到端知识库问答与推理方法将传统基于符号表示的问答
、
推理过程转变成基于语义数值计算的可学习问题,以此进行实体间的相关性计算和知识推理
。3.
根据权利要求1所述的一种面向金融领域的大规模知识图谱构建方法,其特征在于,
S2
中所述常识知识库包括实例库
、
规则库和关联库,其中实例库包括常识实例表示和常识知识获取;规则库包括构建金融领域词汇本体和制定规则;关联库包括计算目标相似矩阵
。4.
根据权利要求1所述的一种面向金融领域的大规模知识图谱构建方法,其特征在于,
S3
中所述知识扩充包括正向推理和反向推理,其中正向推理利用知识图谱中已存在的事实去匹配规则的前提条件部分,当规则的前提条件满足后,则将其结论部分的事实添加到常识知识库中进行扩充,所述已存在的事实包括关系三元组;反向推理则先假定一个目标,寻找一个规则的结论部分能够匹配目标的规则,递归地证明该规则的前提条件都是成立的,当证明成立后将其结论部分的事实添加到常识知识库
。5.
根据权利要求1所述的一种面向金融领域的大规模知识图谱构建方法,其特征在于,所述图表示学习模块包括转化层
、
模型层和接口层,其中转化层将原始的知识图谱转化为标准图并获得其邻接矩阵表示,同时提供便于查询顶点表示的查询表...
【专利技术属性】
技术研发人员:曾俊涛,陈波,毛艳玲,邓媛丹,陈圩钦,
申请(专利权)人:宜宾电子科技大学研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。