基于知识图谱的文献实体关系发现方法及系统技术方案

技术编号:22000101 阅读:53 留言:0更新日期:2019-08-31 05:22
本发明专利技术公开了一种基于知识图谱的文献实体关系发现方法及系统,其根据文献内容中的实体以及实体之间的关系进行构建知识图谱;提取所述知识图谱中的RDF数据,并对所述RDF数据进行向量化处理,得到向量数据;根据所述向量数据的关联关系,得到原生实体关系向量组和未连接的实体关系向量组;对所述未连接的实体关系向量组进行向量匹配度的计算,并筛选出向量匹配度大于预设阈值的未连接的实体关系向量组,或者,根据计算得到的向量匹配度对所述未连接的实体关系向量组进行排序;本发明专利技术通过以文献内容中的实体为粒度进行构建知识图谱,并基于该知识图谱通过向量计算进行实体关系的匹配,能够深度挖掘文献内容之间的潜在的实体关系,从而提供了一种革新的研究方法来发现人类尚未发现的潜在的知识,加速人类科学发展进程。

Method and system of document entity relationship discovery based on Knowledge Map

【技术实现步骤摘要】
基于知识图谱的文献实体关系发现方法及系统
本专利技术涉及信息科学与知识工程
,特别是一种基于知识图谱的文献实体关系发现方法及其应用该方法的系统。
技术介绍
学术领域里的瀚海中有很多埋藏在文献里的尚未被挖掘的潜在知识关系或者知识内容,这也是学者们通过大量的文献查阅寻找灵感的工作内容,这就是知识发现的过程。基于文献的知识发现,更确切的术语是“基于非相关文献的知识发现”,它是1986年由Swanson教授首先提出,其含义是指:"从公开发表的非相关文献中发现某些知识片段间的隐含联系,并在此基础上提出科学假设或猜想,一道科研人员进行攻关或实验,从而发现新知识”。Swanson提出的知识发现方法首先在生物医学中得到应用。1986年,他发现,雷诺氏病是一种病因和治疗方法均未知的血液循环紊乱疾病。有的文献记载了部分雷诺氏病患者血液中有些异常(如血液黏度偏高),又有一些文献记载了食用鱼油能纠正这些异常(如它可降低血液黏度)。Swanson将34篇论述血液变化可导致雷诺氏病的生物医学文献分为一组(A),而降25篇论述食用鱼油可引起血液某种变化的生物医学文献分为另一组(C),通过雷诺氏病主题词(B)本文档来自技高网...

【技术保护点】
1.一种基于知识图谱的文献实体关系发现方法,其特征在于,包括以下步骤:a.根据文献内容中的实体以及实体之间的关系进行构建知识图谱;b.提取所述知识图谱中的RDF数据,并对所述RDF数据进行向量化处理,得到向量数据;c.根据所述向量数据的关联关系,得到原生实体关系向量组和未连接的实体关系向量组;d.对所述未连接的实体关系向量组进行向量匹配度的计算,并筛选出向量匹配度大于预设阈值的未连接的实体关系向量组,或者,根据计算得到的向量匹配度对所述未连接的实体关系向量组进行排序。

【技术特征摘要】
1.一种基于知识图谱的文献实体关系发现方法,其特征在于,包括以下步骤:a.根据文献内容中的实体以及实体之间的关系进行构建知识图谱;b.提取所述知识图谱中的RDF数据,并对所述RDF数据进行向量化处理,得到向量数据;c.根据所述向量数据的关联关系,得到原生实体关系向量组和未连接的实体关系向量组;d.对所述未连接的实体关系向量组进行向量匹配度的计算,并筛选出向量匹配度大于预设阈值的未连接的实体关系向量组,或者,根据计算得到的向量匹配度对所述未连接的实体关系向量组进行排序。2.根据权利要1所述的一种基于知识图谱的文献实体关系发现方法,其特征在于:所述的步骤a中,是通过对所述文献内容进行数据结构化处理,并根据得到的结构化数据进行构建知识图谱;其中,所述文献内容包括:文献标题、文献关键词、文献文摘和文献正文,或者,所述文献内容是指文献正文。3.根据权利要求2所述的一种基于知识图谱的文献实体关系发现方法,其特征在于:对所述文献内容进行数据结构化处理,进一步包括以下步骤:信息抽取:根据RDF框架对所述文献内容进行实体抽取、关系抽取、属性抽取,得到所述文献内容的章节内容和章节知识点;信息融合:通过自然语义解析技术引入第三方知识库对抽取的实体进行共指解析和实体消歧,得到初步RDF数据;质量评估:通过机器评估和/或专家人工评估的方法对所述RDF数据进行监督和调试,得到清洁的结构化的RDF数据。4.根据权利要求1所述的一种基于知识图谱的文献实体关系发现方法,其特征在于:所述的步骤b中,所述RDF数据包括以下任一项或者两项以上的表现形式的RDF三元组内容:文献内容、文献的实体文本标注的形式表示、RDF三元组向量化表示、一阶逻辑表示。5.根据权利要求1所述的一种基于知识图谱的文献实体关系发现方法,其特征在于:所述的步骤d中,还预先对所述未连接的实体关系向量组进行降噪处理,通过对所述未连接的实体关系向量组进行欧式距离或余弦距离加权求和的计算,去除计算...

【专利技术属性】
技术研发人员:刘源
申请(专利权)人:厦门无常师教育科技有限公司
类型:发明
国别省市:福建,35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1