【技术实现步骤摘要】
矿区地理实体关联网络构建方法及设备
[0001]本专利技术实施例涉及信息管理
,尤其涉及一种矿区地理实体关联网络构建方法及设备。
技术介绍
[0002]实体关联网络是一个结构化、关联化的知识表示形式,通过清晰直观的图结构来表达客观世界中的事物及其关联关系,为领域知识组织与管理提供了新的思路。因此,基于实体关联网络自动获取并关联整合矿产领域的信息与知识,成为相关科研机构和政府部门所共同关注的课题。然而,矿产领域积累了比较多的成果资料文本数据,存在数量规模大、概念模式复杂、文本信息挖掘不足、数据关联程度低等问题,给矿产资源领域地理实体关联网络的构建带来诸多挑战。这些挑战主要集中在两方面:一是如何有效组织、表达与关联各类复杂的矿区矿产信息;二是如何从非结构化领域文本资料中抽取出矿产资源相关的实体属性信息。因此,开发一种矿区地理实体关联网络构建方法及设备,可以有效面对上述相关技术中的挑战,就成为业界亟待解决的技术问题。
技术实现思路
[0003]针对现有技术存在的上述问题,本专利技术实施例提供了一种矿区地理实体关联网络构建方法及设备。
[0004]第一方面,本专利技术的实施例提供了一种矿区地理实体关联网络构建方法,包括:步骤1、从地理实体的特征表达与地理实体的关系表达两个层面建立面向矿产领域的矿区矿产资源地理实体表达框架;步骤2、基于互联网获取矿产资源资料文本数据,进行数据预处理和标注,获得标注数据集,利用标注数据集,对改进的BiLSTM
‑
CRF模型进行训练,得到矿区实体识别 ...
【技术保护点】
【技术特征摘要】
1.一种矿区地理实体关联网络构建方法,其特征在于,包括:步骤1、从地理实体的特征表达与地理实体的关系表达两个层面建立面向矿产领域的矿区矿产资源地理实体表达框架;步骤2、基于互联网获取矿产资源资料文本数据,进行数据预处理和标注,获得标注数据集,利用标注数据集,对改进的BiLSTM
‑
CRF模型进行训练,得到矿区实体识别模型,并基于矿区实体识别模型对未标注矿产资源资料文本中的实体要素进行识别和抽取;步骤3、基于Neo4j图形数据库,依据步骤1中的地理实体的特征表达对步骤2中抽取得到的实体信息进行存储,依据步骤1中的地理实体的关系表达分别构建矿区地理实体之间的空间、资源、项目和地质关联,形成矿区地理实体关联网络。2.根据权利要求1所述的矿区地理实体关联网络构建方法,其特征在于,所述特征表达包括:语义特征、空间特征、资源特征、项目特征、地质特征五个维度。3.根据权利要求2所述的矿区地理实体关联网络构建方法,其特征在于,所述关联关系包括:空间关联、资源关联、项目关联、地质关联四个方面。4.根据权利要求3所述的矿区地理实体关联网络构建方法,其特征在于,步骤1中,建立面向矿产领域的矿区矿产资源地理实体表达框架,具体包括:建立地理实体特征表达体系,定义语义特征由矿区名称OreName,矿区标识码OreID,矿区类型OreType和矿区类型码OreTypeID组成;定义空间特征由行政区划名称RegName、空间等级SpaLev、具体地域SpeReg、行政区划代码RegCode和为地理经纬度LonLat组成;定义资源特征由矿种名称MineSpeName,矿种类型MineSpeType,矿种储量规模MineSpeSca,矿种品位MineSpeQua组成;定义项目特征由项目名称ProName、形成单位FormUnit、工作程度WorkDegree,项目建设的开始和结束时间StaEndTime组成;定义地质特征由矿体特征OreBodyFea、矿石特征OreFea、成因类型GenType、其他地质特征OthFea组成;建立地理实体关系表达体系,定义空间关联关系依据拓扑层级关系和方位相对位置建立,关系类型包括隶属、位于,参考知识为行政区划层级集合;定义资源关联关系依据矿产资源类型中的上下位关系建立,关系类型包括包含、矿种属于,参考知识为矿种类型划分集合;定义项目关联关系依据项目形成单位、工作程度的一致性建立,关系类型包括形成单位属于、工作程度属于,参考知识为工作程度集合、形成单位集合;定义地质关联关系构成特点、成分特点、成因类型的一致性建立,关系类型包括矿体数量一致、成分类型属于和成因属于。5.根据权利要求4所述的矿区地理实体关联网络构建方法,其特征在于,步骤2中,利用标注数据集,对改进的BiLSTM
‑
CRF模型进行训练,得到矿区实体识别模型,具体包括:基于爬虫技术获取互联网地质信息平台上的公开数据,定义无关文档的关键词列表,进行数据预处理,删除与矿区矿产描述无关及不符合要求的数据;选用部分原始数据...
【专利技术属性】
技术研发人员:李江,李锐,李强,郑丽娜,李芳芳,凌朝阳,
申请(专利权)人:湖北省自然资源厅信息中心,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。