一种数据融合方法、系统、计算机设备及存储介质技术方案

技术编号:38631797 阅读:13 留言:0更新日期:2023-08-31 18:30
本申请公开了一种数据融合方法、系统、计算机设备及存储介质,该方法包括:对数据源中的数据进行标准化处理,得到标准表示的知识,所述数据源至少包括第一数据源以及第二数据源;所述标准表示的知识通过采用关系抽取,得到预设形式表示的知识;基于所述预设形式表示的知识、知识图谱框架得到融合知识图谱。通过对不同数据源中数据进行标准化处理,并且通过关系抽取使之能够与已知的知识一起融合到知识图谱框架中,并得到融合知识图谱,使得数据源中的资源可以有机融合,提高科研成果利用率。率。率。

【技术实现步骤摘要】
一种数据融合方法、系统、计算机设备及存储介质


[0001]本申请涉及知识图谱
,特别是涉及一种数据融合方法、系统、计算机设备及存储介质。

技术介绍

[0002]科研数据资源蕴含着组织、个人在科研、基建或生产、管理活动中的研究智慧,是公司重要战略资源,为提高科研整体水平和效率,促进科技人才培养,实现科研数字化跨越式发展,科研数据资源的精益管理和高效利用是当前环境下科研数字化转型中重要的内容之一。
[0003]目前,科研信息分散在各级科技管理部门,海量的科研成果未能及时面向公司系统各单位开放共享,各级科研机构的研究内容存在重复和交叉、科研成果利用率低等现象。

技术实现思路

[0004]基于上述问题,本申请提供了一种数据融合方法、系统、设备及存储介质,旨在提高科研成果利用率。
[0005]本申请实施例公开了如下技术方案:
[0006]第一方面,本申请实施例提供一种数据融合方法,所述方法包括:
[0007]对数据源中的数据进行标准化处理,得到标准表示的知识,所述数据源至少包括第一数据源以及第二数据源;
[0008]所述标准表示的知识通过采用关系抽取,得到预设形式表示的知识;
[0009]基于所述预设形式表示的知识、知识图谱框架得到融合知识图谱。
[0010]可选地,所述数据源中的数据包括结构化数据、半结构化数据以及非结构化数据,所述对数据源中的数据进行标准化处理,得到标准表示的知识,包括:
[0011]对结构化数据、半结构化数据以及非结构化数据进行知识抽取,得到初步表示的知识;
[0012]所述初步表示的知识通过统一资源模型,得到标准表示的知识。
[0013]可选地,基于所述预设形式表示的知识、知识图谱框架得到融合知识图谱之前,所述方法还包括:
[0014]对所述预设形式表示的知识进行数据消歧,得到无歧义的知识。
[0015]可选地,所述基于所述预设形式表示的知识、知识图谱框架得到融合知识图谱,包括:
[0016]将所述预设形式表示的知识放入知识图谱框架之中,得到初步融合知识图谱;
[0017]将已知的知识放入所述初步融合知识图谱中,得到融合知识图谱。
[0018]可选地,所述知识抽取包括实体抽取、属性抽取以及关系抽取。
[0019]可选地,所述数据消歧包括实体消歧以及共指消歧。
[0020]第二方面,本申请提供一种数据融合系统,所述系统包括:标准化模块、关系抽取
模块以及融合模块;
[0021]所述标准化模块,用于对数据源中的数据进行标准化处理,得到标准表示的知识,所述数据源至少包括第一数据源以及第二数据源;
[0022]所述关系抽取模块,用于所述标准表示的知识通过采用关系抽取,得到预设形式表示的知识;
[0023]所述融合模块,用于基于所述预设形式表示的知识、知识图谱框架得到融合知识图谱。
[0024]可选地,所述数据源中的数据包括结构化数据、半结构化数据以及非结构化数据,所述标准化模块,具体用于:
[0025]对结构化数据、半结构化数据以及非结构化数据进行知识抽取,得到初步表示的知识;
[0026]所述初步表示的知识通过统一资源模型,得到标准表示的知识。
[0027]可选地,基于所述预设形式表示的知识、知识图谱框架得到融合知识图谱之前,所述装置还包括:消歧模块;
[0028]所述消歧模块,用于对所述预设形式表示的知识进行数据消歧,得到无歧义的知识。
[0029]可选地,所述融合模块,具体用于:
[0030]将所述预设形式表示的知识放入知识图谱框架之中,得到初步融合知识图谱;
[0031]将已知的知识放入所述初步融合知识图谱中,得到融合知识图谱。
[0032]可选地,所述知识抽取包括实体抽取、属性抽取以及关系抽取。
[0033]可选地,所述数据消歧包括实体消歧以及共指消歧。
[0034]第三方面,本申请提供一种计算机设备,包括:存储器,处理器,及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如第一方面任一项所述的数据融合方法。
[0035]第四方面,本申请提供一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有指令,当所述指令在终端设备上运行时,使得所述终端设备执行如第一方面任一项所述的数据融合方法。
[0036]本申请提供一种数据融合方法,首先,对数据源中的数据进行标准化处理,得到标准表示的知识,数据源至少包括第一数据源以及第二数据源;然后,标准表示的知识通过采用关系抽取,得到预设形式表示的知识;最后,基于预设形式表示的知识、知识图谱框架得到融合知识图谱。本申请通过对不同数据源中数据进行标准化处理,并且通过关系抽取使之能够与已知的知识一起融合到知识图谱框架中,并得到融合知识图谱。使得数据源中的资源可以有机融合,提高科研成果利用率。
附图说明
[0037]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0038]图1为本申请实施例提供的一种数据融合方法的流程图;
[0039]图2为本申请实施例提供的另一种数据融合方法的实现框图;
[0040]图3为本申请实施例提供的一种数据融合系统所对应的结构示意图;
[0041]图4为本申请实施例提供的一种计算机设备的结构示意图。
具体实施方式
[0042]正如前文描述,目前科研信息分散在各级科技管理部门,海量的科研成果未能及时面向公司系统各单位开放共享,各级科研机构的研究内容存在重复和交叉、科研成果利用率低等现象。
[0043]有鉴于此,本申请提供一种数据融合方法,首先,对数据源中的数据进行标准化处理,得到标准表示的知识,数据源至少包括第一数据源以及第二数据源;然后,标准表示的知识通过采用关系抽取,得到预设形式表示的知识;最后,基于预设形式表示的知识、知识图谱框架得到融合知识图谱。
[0044]为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0045]如图1所示,本申请实施例提供一种数据融合方法的流程图。
[0046]参见图1,该方法包括:
[0047]S101:对数据源中的数据进行标准化处理,得到标准表示的知识,所述数据源至少包括第一数据源以及第二数据源。
[0048]作为示例,数据源中的数据可本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据融合方法,其特征在于,所述方法包括:对数据源中的数据进行标准化处理,得到标准表示的知识,所述数据源至少包括第一数据源以及第二数据源;所述标准表示的知识通过采用关系抽取,得到预设形式表示的知识;基于所述预设形式表示的知识、知识图谱框架得到融合知识图谱。2.如权利要求1所述的方法,其特征在于,所述数据源中的数据包括结构化数据、半结构化数据以及非结构化数据,所述对数据源中的数据进行标准化处理,得到标准表示的知识,包括:对结构化数据、半结构化数据以及非结构化数据进行知识抽取,得到初步表示的知识;所述初步表示的知识通过统一资源模型,得到标准表示的知识。3.如权利要求1所述的方法,其特征在于,基于所述预设形式表示的知识、知识图谱框架得到融合知识图谱之前,所述方法还包括:对所述预设形式表示的知识进行数据消歧,得到无歧义的知识。4.如权利要求1所述的方法,其特征在于,所述基于所述预设形式表示的知识、知识图谱框架得到融合知识图谱,包括:将所述预设形式表示的知识放入知识图谱框架之中,得到初步融合知识图谱;将已知的知识放入所述初步融合知识图谱中,得到融合知识图谱。5.如权利要求2所述的方法,其特征在于,所述知识抽取包括实体抽取、属性抽取以及关系抽取。6.如权...

【专利技术属性】
技术研发人员:毛航银陈晓刚张帆赖晓翰张烨华江樱张益群曹莹舒鹏李为陈铁义李乃一夏红鑫黄佳斌
申请(专利权)人:国网浙江省电力有限公司信息通信分公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1