基于知识图谱技术的全景多元异构数据融合方法技术

技术编号：41268083 阅读：6 留言：0更新日期：2024-05-11 09:23

本发明专利技术涉及一种基于知识图谱技术的全景多元异构数据融合方法，包括：选取某城市物联网数据，获取大量关于环境的全景多元异构数据，对其建立数据库；对建立的数据库中的数据进行分类处理与预处理，得到初始处理的数据；进行归一化处理，为每个种类分配一个PCLA模型，输入数据后对数据进行知识抽取，获得各个数据的向量表达；将获得的各个数据的向量表达输入到MIFA模型中，对输入的数据向量进行分析，再将得到的参数输入到基于ELM的多层神经网络中，最终得到所需要的融合数据信息；构建知识图谱，使用获得的数据融合信息对知识图谱的内容进行填充和扩展。本申请能够实现全景多元异构数据的融合，利用知识图谱技术对其进行整合与输出。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种基于知识图谱技术的全景多元异构数据融合方法。

技术介绍

1、近年来，随着信息技术和网络技术的发展，大数据时代已经到来，物联网技术的飞速发展，城市传感技术依托于此也得到了突破，大量的数据在各种数据类型上为物联网技术的应用和发展奠定了坚实的基础。在数据感知方面，随着智能手机、智能物联网、移动社交网络、云计算等各种智能终端和技术的出现，数据出现了爆炸式增长。随着大数据技术的快速发展，基于机器学习理论，以感知数据为支撑的数据融合已经成为一个热门的研究领域。知识融合是一种解决知识多源性、异质性和不确定性等问题的知识获取和利用方法，在知识库建设和知识图谱建设过程中发挥着重要作用。通过知识融合，可以从多源异构、社交互动性、突发性和实时性、动态性和高度干性的网络大数据中提取重要的知识元素，挖掘其背后隐含的复杂关联，将“碎片化的知识单元”融合为用户需求的新的领域知识地图。知识融合作为知识管理和知识工程的重要组成部分，受到了计算机科学、知识工程和信息科学等领域学者的广泛关注，并逐渐在医疗保健、金融和图书馆智能化等领域得到应用和拓展。

2、知识融合的实现路径通常包括知识融合算法、技术等，它们主导着知识融合的研究过程。大多数传统的知识融合算法来源于信息融合，并与应用研究交叉，在特定领域的应用中实现。现有的技术方案有使用k-means聚类算法、构建字典法、利用机器学习算法等，使用深度学习方法进行数据融合的模型也有很多，但是多是应用于同源或者同构数据下，针对全景、多元、异构数据的数据融合算法还未有进展，而对于大量不同来源、不同

3、由于全景多元异构数据过于复杂、传统数据融合方法存在的共同问题就是无法解决全面的数据融合，多停留在同构或同源数据的数据融合，无法有效的利用所有的数据，现有的大部分数据融合算法仍停留在传统的字典或者聚类算法，无法处理复杂而异构的大量数据，缺乏对于数据的全面考虑。难以实现大数据背景下的物联网的应用。

技术实现思路

1、有鉴于此，有必要提供一种基于知识图谱技术的全景多元异构数据融合方法。

2、本专利技术提供一种基于知识图谱技术的全景多元异构数据融合方法，该方法包括如下步骤：a.选取某城市物联网数据，从物联网中获取大量关于环境的全景多元异构数据，然后对其建立数据库；b.对建立的数据库中的数据进行分类处理与预处理，得到初始处理的数据；c.将初始处理后的数据进行归一化处理，再为每个种类分配一个pcla模型，输入数据后，pcla模型对数据进行知识抽取，获得各个数据的向量表达；d.将获得的各个数据的向量表达输入到mifa模型中，通过三个子模型对输入的数据向量进行分析，再将得到的参数输入到基于elm的多层神经网络中，最终得到所需要的融合数据信息；e.根据环境预测的需要，构建知识图谱，其中节点代表环境预测指标的概念，边则代表环境预测指标之间的语义关系，使用步骤d中获得的数据融合信息对知识图谱的内容进行填充和扩展。

3、具体地，所述关于环境的全景多元异构数据，包括来自各种来源、各种结构、全面的环境数据。

4、具体地，所述步骤b包括：

5、使用k-means聚类方法，对原始数据进行聚类，将其分为不同的类别。

6、具体地，所述步骤c包括：

7、将处理后的数据进行归一化处理，再为每个种类分配一个pcla模型，输入数据后，pcla模型对数据进行知识抽取，获得各个数据的向量表达。

8、具体地，所述三个子模型包括：时间分类器、空间分类器与图像分类器子模型。

9、具体地，所述步骤d包括：

10、将步骤c中获得的各个数据的向量表达输入到mifa模型中，通过三个子模型：时间分类器、空间分类器与图像分类器对输入的数据向量进行分析，再将得到的参数输入到基于elm的多层神经网络中，最终得到所需要的融合数据信息。

11、具体地，所述步骤e包括：

12、步骤51，设计环境预测领域顶层本体；

13、步骤52，构建环境预测领域基础词库和语义网络，作为环境预测知识图谱的骨架；

14、步骤53，通过数据预处理、转换和装载程序，将已有数据导入知识图谱中；

15、步骤54，使用知识融合技术，不断将抽取出的知识填充至知识图谱中。

16、本申请对于不同来源、不同结构、全方面的数据，提出了一种结合词汇注意机制的知识抽取模型pcla，对数据进行知识抽取与分析；为了对分析后的数据进行数据融合，提出了一种模型集成的多源异构数据融合算法mifa，对进行知识抽取后的数据进一步处理与分类；最后将数据融合模型与知识图谱技术相结合，实现复杂数据的语义提取一体化，并形成可以解决具体领域问题的知识图谱。

本文档来自技高网...

【技术保护点】

1.一种基于知识图谱技术的全景多元异构数据融合方法，其特征在于，该方法包括如下步骤：

2.如权利要求1所述的基于知识图谱技术的全景多元异构数据融合方法，其特征在于，所述关于环境的全景多元异构数据，包括来自各种来源、各种结构、全面的环境数据。

3.如权利要求2所述的基于知识图谱技术的全景多元异构数据融合方法，其特征在于，所述步骤b包括：

4.如权利要求3所述的基于知识图谱技术的全景多元异构数据融合方法，其特征在于，所述步骤c包括：

5.如权利要求4所述的基于知识图谱技术的全景多元异构数据融合方法，其特征在于，所述三个子模型包括：时间分类器、空间分类器与图像分类器子模型。

6.如权利要求5所述的基于知识图谱技术的全景多元异构数据融合方法，其特征在于，所述步骤d包括：

7.如权利要求6所述的基于知识图谱技术的全景多元异构数据融合方法，其特征在于，所述步骤e包括：

8.如权利要求7所述的基于知识图谱技术的全景多元异构数据融合方法，其特征在于，所述知识图谱中节点代表环境预测指标的概念，边代表环境预测指标之间的语义关系。

...

【技术特征摘要】

1.一种基于知识图谱技术的全景多元异构数据融合方法，其特征在于，该方法包括如下步骤：

3.如权利要求2所述的基于知识图谱技术的全景多元异构数据融合方法，其特征在于，所述步骤b包括：

4.如权利要求3所述的基于知识图谱技术的全景多元异构数据融合方法，其特征在于，所述步骤c包括：

5.如权利要求4所述的...

【专利技术属性】
技术研发人员：洪慧君，王嘉延，索智鑫，卢有飞，邹时容，陆慧，张雨，王译萱，
申请(专利权)人：广东电网有限责任公司广州供电局，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人