一种基于Neo4j的智慧农业知识图谱构建方法及系统技术方案

技术编号:35408901 阅读:19 留言:0更新日期:2022-11-03 11:04
本发明专利技术公开了一种基于Neo4j的智慧农业知识图谱构建方法及系统,包括以下步骤:根据农业实体属性的异同对实体类型进行划分,对各层次实体类型关系给定约束定义;利用Lattice

【技术实现步骤摘要】
一种基于Neo4j的智慧农业知识图谱构建方法及系统


[0001]本专利技术涉及农业领域,更具体的说是涉及一种基于Neo4j的智慧农业知识图谱构建方法及系统。

技术介绍

[0002]2012年,Google公司基于语义网与大数据技术提出“知识图谱(Knowledge Graph)”概念,希望借助“实体、关系、属性”三元组来表示现实生活中的事物及其之间关系。“知识图谱”技术具体包含:从万维网或应用领域中提取知识,以节点和边的形式整合关联的实体与概念,以图的形式构建实体关系网络,方便研究者从“实体

关系”的视角出发分析和解决问题。
[0003]知识图谱体系中一般存有具备动态(Velocity)、多源(Variety)、海量(Volume)、异构(Variability)等4V特征的大规模知识数据。传统的SQL或NoSQL数据库以数据表为存储方式,难以实现高性能、可扩展存储、查询等操作,严重限制了知识图谱技术的应用潜力和性能。而与“表”数据库相比,Neo4j图数据库以图结构为存储单元,不仅支持复杂的非结构、半结构化数据图模型存储,且能高效处理海量实体数据的复杂“关系”以及实现多种图算法的快速遍历,可以较好地满足知识图谱的各种需求。
[0004]知识图谱技术是对语义网标准与技术的一次扬弃与升华,从提出至今,其热度有增无减,有逐渐发展和演进为智能机器的大脑知识库之趋势。目前,知识图谱已经在电商、金融、矿业、媒体、医药、教育等众多垂直领域得到广泛应用,但在智慧农业领域的应用尚处于萌芽状态,个别学者单单关注运用知识图谱概念对农业文献进行可视化分析,并未通过建立领域数据库的方式来实现智慧农业知识图谱的系统构建。
[0005]近年来,以自动化、大型化、智能化为核心的农业机械化建设取得了长足进展,以物联网、云计算、电子商务等为代表的新时代信息技术在农业发展中得到广泛应用,使农业产业得到提升,农业用户可以更加高效、便捷地进行生产劳作与经营管理。但是我国智慧农业仍处于探索阶段,存在以下主要问题制约智慧农业的发展:
[0006]现代农业信息技术及设施装备是解决现代农业发展中问题的“利器”,随着物联网、云计算、大数据、第五代移动通信网络和人工智能等现代化信息技术的迅猛发展和日益普及,基于传统机械化的生产模式已经无法满足现代农业发展需求。智慧农业的概念于2014年提出,通过数字信息化技术与农业领域的融合应用,逐步引领我国迈入“农业4.0”时代,即智慧农业发展的新阶段。
[0007]针对新型智慧农业领域存在的劳动力人口及结构劣化、劳动从业人员文化水平偏低、专业技术人才匮乏、建设和运行管理主体不明确、信息化技术融合应用和数据挖掘能力不足等问题,本专利技术提出一种利用Neo4j图数据库构建智慧农业知识图谱系统的新方法。基于网络文献和语料,通过对涉农领域相关数据的采集、抽取、存储和共享利用,将现代农业领域碎片化的半结构化和非结构化数据进行有机整合,建立起具备产、销、学、研完整结构的农业知识库。本专利技术对于推动我国智慧农业长远发展和加快新一代信息技术为农业服务
的步伐具有重要意义。

技术实现思路

[0008]有鉴于此,本专利技术提供了一种基于Neo4j的智慧农业知识图谱构建方法及系统。
[0009]为了实现上述目的,本专利技术采用如下技术方案:
[0010]一种基于Neo4j的智慧农业知识图谱构建方法,包括以下步骤:
[0011]根据农业实体属性的异同对实体类型进行划分,对各层次实体类型关系给定约束定义;
[0012]其中,对各层次实体类型关系约束定义,发生在知识库逻辑层设计构建中,目的是确保知识库的模式规范化管理,具体指对划分的实体概念类给定明确的范围和条件,以及对不同概念类实体与实体相互之间具备的逻辑关系进行明确阐述和解析。
[0013]利用Lattice

LSTM修正模型对农业领域信息进行命名实体和实体关系抽取;
[0014]将抽取到的农业领域信息以图结构存放到Neo4j开放型数据库中,实现农业领域大规模知识存储;
[0015]在Neo4j开放型数据库中,基于Spark的并行朴素贝叶斯分类算法进行查询问题分类,完成农业领域知识图谱的构建。
[0016]可选的,利用Lattice

LSTM修正模型对农业领域信息进行命名实体和实体关系抽取,具体包括以下步骤:
[0017]对农业领域信息进行预处理,划分、切割、清洗得到的农业领域语料数据;
[0018]对农业领域语料数据进行数据集特征序列标注和词向量网络预训练;
[0019]利用Lattice

LSTM修正模型实现命名实体和实体关系抽取。
[0020]可选的,Neo4j开放型数据库将知识实体存储为节点,用节点标签表示所属实体类,通过同时赋予多个标签来表示交叉类型的知识实体。
[0021]可选的,Spark的并行朴素贝叶斯分类算法还包括对贝叶斯公式进行改进,改进后的贝叶斯公式为:
[0022][0023]式中Q表示训练样本集,a
i
表示分类项的第i个特征,Labels为分类数,L为分类类别标签,λ值为常数。
[0024]可选的,基于Spark的朴素贝叶斯分类算法可以表述为:
[0025][0026]a
j
表示分类项的第j个特征,L
i
为分类类别标签,表示第i个分类类别。
[0027]一种基于Neo4j的智慧农业知识图谱构建系统,包括:
[0028]实体类型划分模块:用于根据农业实体属性的异同对农业实体类型进行划分,对各层次实体类型关系给定约束定义;
[0029]Lattice

LSTM模型模块:用于利用Lattice

LSTM修正模型对农业领域信息进行命名实体和实体关系抽取;
[0030]Neo4j开放型数据库模块:用于将抽取到的农业领域信息以图结构存放到Neo4j开放型数据库中,优化设计适用于农业用户和农科体系的知识融合、知识推论规则;
[0031]农业领域知识图谱构建模块:用于在Neo4j开放型数据库中,基于Spark的并行朴素贝叶斯分类算法进行查询问题分类,完成农业领域知识图谱的构建。
[0032]经由上述的技术方案可知,与现有技术相比,本专利技术公开提供了一种基于Neo4j的智慧农业知识图谱构建方法及系统,具有以下有益效果:
[0033]1、将知识图谱技术创造性地应用到智慧农业建设研究之中,提出适用于行业背景的农业知识图谱构建策略与应用方法,可以将先进的农业生产管理技术与信息便捷地传递到农民和农科类学生手中,同时对于农业生产者了解市场需求和把握市场发展动向提供指导帮助;
[0034]2、提出基于Neo4j图数据库的智慧农业知识图谱构建技术,将互联网上多源、海量、动态的半结构化和非结构化数据以图结构存储到农业知识库中。相比于其他类型数据本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于Neo4j的智慧农业知识图谱构建方法,其特征在于,包括以下步骤:根据农业实体属性的异同对实体类型进行划分,对各层次实体类型关系给定约束定义;利用Lattice

LSTM修正模型对农业领域信息进行命名实体和实体关系抽取;将抽取到的农业领域信息以图结构存放到Neo4j开放型数据库中,实现农业领域大规模知识存储;在Neo4j开放型数据库中,基于Spark的并行朴素贝叶斯分类算法进行查询问题分类,完成农业领域知识图谱的构建。2.根据权利要求1所述的一种基于Neo4j的智慧农业知识图谱构建方法,其特征在于,利用Lattice

LSTM修正模型对农业领域信息进行命名实体和实体关系抽取,具体包括以下步骤:对农业领域信息进行预处理,划分、切割、清洗得到的农业领域语料数据;对农业领域语料数据进行数据集特征序列标注和词向量网络预训练;利用Lattice

LSTM修正模型实现命名实体和实体关系抽取。3.根据权利要求1所述的一种基于Neo4j的智慧农业知识图谱构建方法,其特征在于,Neo4j开放型数据库将知识实体存储为节点,用节点标签表示所属实体类,通过同时赋予多个标签来表示交叉类型的知识实体。4.根据权利要求1所述的一种基于Neo4j的智慧农业知识图...

【专利技术属性】
技术研发人员:张斌斌张永新沈家全徐国梁朱海龙
申请(专利权)人:洛阳师范学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1