一种大数据知识图谱构建方法、系统、设备及存储介质技术方案

技术编号:37774432 阅读:25 留言:0更新日期:2023-06-06 13:41
本发明专利技术提供一种大数据知识图谱构建方法、系统、设备及存储介质,包括如下步骤:S1.获取政府治理大数据的结构化数据、半结构化数据和非结构化数据,确定政府治理大数据知识图谱的整体层次结构;S2.分别对政府治理大数据的结构化数据、半结构化数据和非结构化数据进行抽取;S3.提取政府治理大数据知识的三元组,包括具体政府治理大数据具体实体、实体间的具体关系和构建政府治理大数据知识图谱;S4.完成政府治理大数据知识问答系统的环境搭建、需求分析、整体模块设计、功能实现。本发明专利技术构建了动态管理数据库,为构建更科学、更完整的政府治理大数据知识图谱提供了理论基础与技术保障。大数据知识图谱提供了理论基础与技术保障。大数据知识图谱提供了理论基础与技术保障。

【技术实现步骤摘要】
一种大数据知识图谱构建方法、系统、设备及存储介质


[0001]本专利技术涉及知识图谱与大数据
,尤其涉及一种大数据知识图谱构建方法、系统、设备及存储介质。

技术介绍

[0002]利用大数据以及数据分析预测来提高政府治理能力,一直是政府治理领域研究的热门。然而当前政府部门对于数据的进一步的整合与分析的能力依旧很缺乏,目前并没有成熟的政府大数据治理系统,实现政府治理数据的可视化,并且分析与预测政府与城市的未来发展,并且提出相应意见,知识图谱在政府大数据治理领域的应用和技术体系依旧很缺乏。
[0003]在如今信息化的社会背景下,“互联网+”成为社会发展的新潮,大数据被视为一种积极的治理资源,政府要善于利用大数据,只有利用好大数据资源,才能做出更科学和更精准的决策,通过大数据分析提升政府与公众的联系,通过政府与公众在城市建设,医疗卫生服务,生态环境等方面的齐心合作,共同建设更好的城市与社会。因此“数据到知识”的转换能力显得更加重要,政府治理大数据知识图谱的构建与应用,从数据收集到知识整合与存储,以及图谱的生成与应用,实现了各类治理数据与规本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种大数据知识图谱构建方法,用于政府治理对大数据进行分析,其特征在于,包括以下步骤:S1.获取政府治理大数据的结构化数据、半结构化数据和非结构化数据,确定政府治理大数据知识图谱的整体层次结构;S2.分别对政府治理大数据的结构化数据、半结构化数据和非结构化数据进行实体关系抽取;S3.提取政府治理大数据知识三元组(x,R,y),其中x,y表示具体政府治理大数据具体实体,R表示实体间的具体关系,构建政府治理大数据知识图谱;S4.完成政府治理大数据知识问答系统的环境搭建、需求分析、整体模块设计、功能实现。2.根据权利要求1所述的一种大数据知识图谱构建方法,其特征在于,所述获取政府治理大数据的结构化数据、半结构化数据和非结构化数据包括:使用Python爬虫技术对官网权威网站获取政府治理文件,整理政府文件数据,通过数据预处理,筛选出政府文件中结构化、半结构化以及非结构化数据,其中,结构化数据指关系型数据库表形式管理的数据,具有明显的层次结构,半结构化以及非结构化数据指没有固定结构模式的数据。3.根据权利要求1所述的一种大数据知识图谱构建方法,其特征在于,所述分别对政府治理大数据的结构化数据、半结构化数据和非结构化数据进行实体关系抽取包括:利用数据预处理、规则模板定义和融合加性注意力机制和传统实体关系抽取模型相结合的方式分别对政府治理大数据的结构化数据、半结构化数据和非结构化数据进行实体关系抽取;若数据为结构化数据或半结构化数据,通过构建规则模板,利用规则模板提取知识三元组;若数据为非结构化数据,利用加性实体关系提取知识三元组。4.根据权利要求3所述的一种大数据知识图谱构建方法,其特征在于,所述利用规则模板提取知识三元组包括:提取构建规则模板所需的关键词,构建关键词集;利用关键词集匹配结构化或半结构化数据中对应的标志词;利用所述标志词与所述关键词的关系,构建规则模板,利用正则表达式提取上述结构化或半结构化数据中,适配所构建规则模板的数据,以提取结构化与半结构化数据的知识三元组。5.根据权利要求3所述的一种大数据知识图谱构建方法,其特征在于,所述若数据为非结构化数据,利用加性实体关系提取知识三元组包括以下步骤:将非结构化数据...

【专利技术属性】
技术研发人员:吴珺李天意郑欣丽袁子健董佳明
申请(专利权)人:湖北工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1