GIS学科知识图谱的构建方法及GIS知识问答系统技术方案

技术编号:42543695 阅读:25 留言:0更新日期:2024-08-27 19:46
本发明专利技术提供了一种GIS学科知识图谱的构建方法及GIS知识问答系统,包括以下步骤:收集地理信息系统GIS数据,提取GIS数据中的专业术语,对专业术语进行处理后得到类,根据类和预设的类间关系构建GIS学科知识图谱的本体,根据本体对部分GIS数据中的实体和关系进行标注,得到训练数据;建立实体关系联合抽取模型,利用训练数据对实体关系联合抽取模型进行训练,将剩余GIS数据输入训练后的模型得到实体关系三元组,将实体关系三元组存储在Excel中,连接到Neo4j数据库,实现GIS学科知识图谱的存储和可视化。

【技术实现步骤摘要】

本专利技术涉及专业教学智能问答领域,具体涉及一种gis学科知识图谱的构建方法及gis知识问答系统。


技术介绍

1、现有的专业教学问答系统基本都面向计算机科学、医学、生命科学、物理学等热门或基础学科,尚未涵盖专门针对gis专业的问答系统,缺乏对gis学科知识的充分覆盖,导致现有问答系统无法满足gis学习者对专业知识进行深入探索的需求。此外,专业教学问答系统的语料数据大多来源于文献资料,没有考虑到文献中可能涉及的高度专业化术语和概念对于初学者来说过于复杂和晦涩,使得系统对于初学者来说,适用性相对较低。因此现有技术常采用知识图谱作为自动问答方面的知识库,支持系统在回答问题时从知识库中检索相关信息。

2、数据处理和本体构建是构建知识图谱的基础。传统的数据处理方法通常只采用ocr技术或自然语言处理技术中的一种,当数据量较大时,可能需要额外耗费大量的人力资源来对数据进行更深入的处理,这极大地限制了数据的处理效率和质量。现有的本体构建中的类的提取步骤,通常以提取出的关键词来替代专业术语,并直接使用专业术语中的重要专业概念作为本体的类。但其他知识图谱中对于关键本文档来自技高网...

【技术保护点】

1.一种GIS学科知识图谱的构建方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种GIS学科知识图谱的构建方法,其特征在于:步骤S1中提取所述GIS数据中的专业术语的方法包括:采用多个停用词表,运用TF-IDF算法、TextRank算法和词频统计方法分别对所述GIS数据进行抽取,对抽取得到的数据进行归一化和加权处理,筛选并删除其中与GIS学科无关的词语,得到GIS学科的专业术语。

3.根据权利要求1所述的一种GIS学科知识图谱的构建方法,其特征在于:步骤S1中对专业术语进行处理得到类的方法包括:筛选所述专业术语中的重点概念直接作为类;总结归纳所述专业术...

【技术特征摘要】

1.一种gis学科知识图谱的构建方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种gis学科知识图谱的构建方法,其特征在于:步骤s1中提取所述gis数据中的专业术语的方法包括:采用多个停用词表,运用tf-idf算法、textrank算法和词频统计方法分别对所述gis数据进行抽取,对抽取得到的数据进行归一化和加权处理,筛选并删除其中与gis学科无关的词语,得到gis学科的专业术语。

3.根据权利要求1所述的一种gis学科知识图谱的构建方法,其特征在于:步骤s1中对专业术语进行处理得到类的方法包括:筛选所述专业术语中的重点概念直接作为类;总结归纳所述专业术语中的实体或实例得到类。

4.根据权利要求1所述的一种gis学科知识图谱的构建方法,其特征在于:步骤s1中所述类间关系包括:产生、影响、处理分析、包含、相等和具有。

5.根据权利要求1所述的一种gis学科知识图谱的构建方法,其特征在于:步骤s2中通过建立辅助函数储存实体关系三元组,并重写其中的hash和eq函数。

6.根据权利要求5所述的一种gis学科知识图谱的构建方法,其特征在于:重写hash函数,将每个三元组的主语作为键,将其值存储为一个列表,将...

【专利技术属性】
技术研发人员:张晓盼李昱瑶刘韦函王雅茹
申请(专利权)人:武汉理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1