一种基于数据融合的知识图谱构建方法及系统技术方案

技术编号：36394350 阅读：12 留言：0更新日期：2023-01-18 09:59

本发明专利技术公开了一种基于数据融合的知识图谱构建方法，包括如下步骤：S1.构建传统数据库和图数据库以及深度学习环境；S2.根据传统数据库获取对象；S3.筛选对象以获取第一数据和第二数据，并分别储存；S4.根据公众号关键信息获取第三数据；S5.处理第二数据和第三数据，以生成第四数据和第五数据；S6.处理第四数据和第五数据，以生成第六数据并储存；S7.处理第六数据和第一数据，以生成知识图谱；S8.重复步骤S2至步骤S7直至完善知识图谱。该方法融合了传统数据库、图数据库和公众号数据构建了不断更新的知识图谱，且在构建过程中，通过筛选掉错误或无关信息，三次处理提高数据精度，精确且数据量庞大的知识图谱可以为访问者提供精确有效、崭新的相关知识。崭新的相关知识。崭新的相关知识。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于数据融合的知识图谱构建方法及系统

[0001]本专利技术涉及数据处理的
，特别是涉及一种基于数据融合的知识图谱构建方法及系统。

技术介绍

[0002]信息搜集获取的时效性、分析处理的准确性、分发应用的实效性等，直接影响国家战略规划和国防军事体系效能发挥。当前，国际互联网与政治、经济、社会、军事等领域高度融合，各国政府部门、组织机构、专家智库等发布的战略规划、研究报告、对策建议等，及门户网站、社交软件、网络媒体等任何人都可公开访问的开源信息，已经成为各国信息的重要来源。目前，仅仅是百科数据和相关网络公众号数据已经包含了大量某一领域相关的知识。这些开源信息的搜集获取、筛选处理、订阅分发等可以采用自动化方法高效完成，但其针对特定用户或特定应用场景的专题式挖掘分析仍主要依靠人工完成，其信息数据中存在的或强或弱的关联关系极易被分析人员所忽视，直接导致从开源信息中分析得到的信息价值不高、使用效益受限。如何利用开源数据构建一个高度结构化的知识图谱就成为了迫切需要研究的内容。
[0003]以往进行知识图谱构建中，往往直接只提取了其中的结构化数据中，而忽略了大量非结构化数据中的信息。而现在的知识图谱构建往往直接利用相关技术进行信息抽取，而没有考虑到已有的结构化数据，容易导致构建的知识图谱中存在大量错误或者相互矛盾的信息。
[0004]因此，提供一种可以有效解决知识图谱构建过程中，数据量有限、准确度较低、数据过时失真的基于数据融合的知识图谱构建方法及系统是本领域技术人员亟待解决的问题。

技术实现思路

【技术保护点】

【技术特征摘要】
1.一种基于数据融合的知识图谱构建方法，其特征在于，包括如下步骤：S1.构建传统数据库和图数据库以及深度学习环境；S2.根据所述传统数据库获取对象；S3.筛选所述对象以获取第一数据和第二数据，并分别储存；S4.根据公众号关键信息获取第三数据；S5.处理所述第二数据和所述第三数据，以生成第四数据和第五数据；S6.处理所述第四数据和所述第五数据，以生成第六数据并储存；S7.处理所述第六数据和所述第一数据，以生成知识图谱；S8.重复步骤S2至步骤S7直至完善所述知识图谱。2.如权利要求1所述的基于数据融合的知识图谱构建方法，其特征在于，所述步骤S2具体为：根据预设关键词过滤所述传统数据库以获取所述对象。3.如权利要求2所述的基于数据融合的知识图谱构建方法，其特征在于，所述步骤S3包括如下步骤：根据编程语言筛选所述对象以获取所述第一数据和所述第二数据；将所述第一数据以第一格式存入所述图数据库中；将所述第二数据存入所述传统数据库中。4.如权利要求2所述的基于数据融合的知识图谱构建方法，其特征在于，所述步骤S4具体为：获取公众号关键信息；根据所述公众号信息以及所述预设关键词过滤各公众号以获取所述第三数据。5.如权利要求1所述的基于数据融合的知识图谱构建方法，其特征在于，在所述步骤S5之前，还包括：分别定义实体类型、实体关系和实体属性。6.如权利要求5所述的基于数据融合的知识图谱构建方法，其特征在于，所述步骤S5具体为：根据已定义的所述实体类型、所述实体关系和所述实体属性，对所述第二数据和所述第三数据进行标注以生成所述第四数据和所述第五数据；其中，所述第四数据为已标注数据集，所述第五数据为未标注数据集。7.如权利要求6所述的基于数据融合的知识图谱构建方法，其特征在于，所述步骤S6包括...

【专利技术属性】
技术研发人员：王俊辉，王彦锋，隋兵才，郑重，孙彩霞，冯权友，王永文，
申请(专利权)人：中国人民解放军国防科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人