一种融合MKD和KG的甲骨学知识图谱构建方法技术

技术编号:23315214 阅读:33 留言:0更新日期:2020-02-11 17:50
本发明专利技术公开了一种融合MKD和KG的甲骨学知识图谱构建方法及系统,构建方法包括以下步骤:S1、分别对甲骨文文献、甲骨文数据库、甲骨文文本、甲骨文语料库提取实体以及实体之间的关系;S2、对甲骨文文献、甲骨文数据库、甲骨文文本、甲骨文语料库、甲骨文本体库进行实体对齐和关系融合,构成融合图谱;S3、挖掘获取隐含语义关系;S4、将隐含语义关系扩充到融合图谱中,最终构成甲骨学知识图谱。本发明专利技术中MKD以甲骨文文献为主要研究对象,KG以甲骨文语料为主要研究对象,将MKD和KG两类知识图谱相结合,通过实体对齐和关系融合,并结合隐含语义构建甲骨学知识图谱,从而发现显式的实体和关系背后隐藏的潜在实体和关系,知识关联强。

A construction method of knowledge map of Oracle with MKD and kg

【技术实现步骤摘要】
一种融合MKD和KG的甲骨学知识图谱构建方法
本专利技术属于甲骨文信息处理
,具体涉及一种融合MKD和KG的甲骨学知识图谱构建方法。
技术介绍
甲骨文是现今已发现的成体系的最早文字,是中华民族传统文化的瑰宝,具有极高的文物价值、史料价值和研究价值。针对甲骨文的研究崭然成为一门举世瞩目的国际性显学—甲骨学。近年来,从事甲骨学研究的学者越来越多,尤其是2017年11月甲骨文成功入选《世界记忆名录》后,甲骨学成为研究热点。但是甲骨学研究面临着许多问题,如学习难度大、学习周期长、知识关联性弱、知识共享程度低等问题,本专利拟通过构建甲骨学知识图谱来解决这些问题。构建甲骨学知识图谱的关键是实现各类数据源中实体发现和关系抽取。由于甲骨文的古籍特性,使得甲骨文的研究必须依赖大量的文献资料,而科学知识图谱(MappingKnowledgeDomains,简称MKD)在文献挖掘方面极具优势。但是,MKD的分析关系大多是直接或间接关联关系,且存在的语义解释性不佳的问题,无法表达甲骨学知识中深层次的语义关系,如甲骨文著录与甲骨片的关系、甲骨片与甲骨片的关本文档来自技高网...

【技术保护点】
1.一种融合MKD和KG的甲骨学知识图谱构建方法,其特征在于,包括以下步骤:/nS1、分别对甲骨文文献、甲骨文数据库、甲骨文文本、甲骨文语料库提取实体以及实体之间的关系;/nS2、对步骤S1中提取的实体以及实体之间的关系进行实体对齐和关系融合,构成融合图谱;/nS3、基于本体推理和规则推理,挖掘获取隐含语义关系;/nS4、将隐含语义关系扩充到融合图谱中,最终构成甲骨学知识图谱。/n

【技术特征摘要】
1.一种融合MKD和KG的甲骨学知识图谱构建方法,其特征在于,包括以下步骤:
S1、分别对甲骨文文献、甲骨文数据库、甲骨文文本、甲骨文语料库提取实体以及实体之间的关系;
S2、对步骤S1中提取的实体以及实体之间的关系进行实体对齐和关系融合,构成融合图谱;
S3、基于本体推理和规则推理,挖掘获取隐含语义关系;
S4、将隐含语义关系扩充到融合图谱中,最终构成甲骨学知识图谱。


2.根据权利要求1所述的融合MKD和KG的甲骨学知识图谱构建方法,其特征在于,步骤S1中甲骨文文献为甲骨学科学知识图谱的构建提供文献元数据信息,甲骨文文献模块利用甲骨学科学知识图谱显示甲骨文知识关联、知识演化及知识群结构;实体为研究机构、学者、地点、人物、事件中的一种或多种;实体之间的关系为合作、被引、共现、为…提供依据、主体、分期、类组、材质、祭祀对象、继承中的一种或多种;采用共引、共词、聚类分析中的一种或多种方法提取实体以及实体之间的关系。


3.根据权利要求1所述的融合MKD和KG的甲骨学知识图谱构建方法,其特征在于,甲骨文本体库包括甲骨文文献本体、甲骨文内容本体和甲骨文常识本体;规则推理采用的是Drools开源规则引擎。


4.根据权利要求1所述的融合MKD和KG的甲骨学知识图谱构建方法,其特征在于,关系融合为确定两个实体的关系是否表达同一种关系,或者是否是包含关系。


5.根据权利要求1所述的融合MKD和KG的甲骨学知识图谱构建方法,其特征在于,
步骤S1中针对甲骨文文献,通过构建MKD,利用共引、共词和聚类分析方法提取实体及实体之间的关系;
其中共词方法采用Cosine函数法:



其中,Di=(d1i,d2i,...dni)T和Dj=(d1j,,d2j,,...dnj)T均是关键词集合;
针对甲骨文数据库,通过...

【专利技术属性】
技术研发人员:熊晶翟雪高峰焦清局刘永革张世科史小松李邦郭安
申请(专利权)人:安阳师范学院
类型:发明
国别省市:河南;41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1