本发明专利技术公开了一种面向农业气象领域的知识图谱构建方法。该构建方法采用自顶向下的方式,包括步骤如下:对农业气象数据预处理,然后是基于专家经验的核心农业气象知识构建知识图谱的本体层;其次是信息抽取,包括根据不同模式层的类型对实体、关系、属性以及事件的抽取;之后是农业气象知识融合,对该些问题进行完实体对齐、模式匹配等操作后存入知识库,为之后的下游应用任务作辅助;然后是知识体系构建,对融合后的知识进行体系构建;接着是知识验证,对后加入验证步骤,即在原知识图上加入新外源知识后,验查与原图中的一致性;最后是知识推理,对知识图谱进行补全。最终解决了知识图谱与农业气象背景结合不紧密的问题。识图谱与农业气象背景结合不紧密的问题。识图谱与农业气象背景结合不紧密的问题。
【技术实现步骤摘要】
一种面向农业气象领域的知识图谱构建方法
[0001]本专利技术属于知识图谱
,具体涉及一种面向农业气象领域的知识图谱构建方法。
技术介绍
[0002]知识图谱是关系里最有效的表示方式,是将所有不同种类的信息连接在一起形成一个关系网络。迄今为止,知识图谱的实际应用在发达国家已经逐步拓展并取得了较好的效果,但它在我国仍属研究的起步阶段。近年来,随着信息化和智能化技术的发展,农业生产经营得到显着提升。由于农作物产值与农业气象、农业地理环境和作物本身习性相互影响机制复杂,需要对其整体海量数据进行分析和挖掘,其在各个下游中的应用都起着至关重要的作用。事实上,农业气象作为影响国家农业产业的重要部分,建设智慧农业系统对国家和个人都有着巨大的影响。在我国经济飞速发展,人民物质生活极大丰富的今天,基于知识图谱的智慧农业的构建是一个亟待科研人员解决的问题。
技术实现思路
[0003]本专利技术的目的在于:提供一种面向农业气象领域的知识图谱构建方法,以解决现有技术的问题。
[0004]为实现上述目的,本专利技术提供如下技术方案:一种面向农业气象领域的知识图谱构建方法,包括如下步骤:
[0005]S1、收集农业气象数据,对该农业气象数据进行预处理;
[0006]S2、基于农业气象领域所涉及的预设概念、同时基于农业气象实例,以及根据农业气象数据的关系,通过上下位关系构建农业气象本体;
[0007]S3、通过建立参数化模型进行农业气象知识抽取,获得预处理数据与农业气象本体之间的映射关系,获得与本体相关的头实体、尾实体、以及头尾实体关系三元组;
[0008]S4、通过计算实体间相似度,对各个实体进行融合时通过实体链接方法消除实体间的歧义,获得更新的三元组;
[0009]S5、将三元组构成农业气象知识图谱,按照预设实体关系对农业气象知识图谱包含的三元组进行验证,删除虚假实体关系三元组;
[0010]S6、根据农业知识图谱所包含的三元组之间的关系,推理新的三元组,并更新农业气象知识图谱。
[0011]进一步地,前述的步骤S1中,从中国农业气象网站、农业气象书籍、国家农业气象专业教材、国家农作物操作手册以及农业气象案例中去收集农业气象数据;所述农业气象数据包括半结构化数据和非结构化数据。
[0012]进一步地,前述的对农业气象数据预处理具体为:利用爬虫技术搜集关于中国农业气象的网站,并按照信任度对搜集的网站进行排序,选取大于预设信任度的网址;利用OCR工具,将纸质农业气象书籍、以及农业气象教材转为电子版文件。
[0013]进一步地,前述的步骤S2中,农业气象领域所涉及的预设概念包括中国地理、农作物、以及气象学。
[0014]进一步地,前述的步骤S3包括如下子步骤:通过双向长短期记忆
‑
条件随机场法对预处理后的农业气象数据中词向量进行端到端的方式输出新的词向量;然后通过CRF层输出实体;将预处理后的农业气象数据中句子向量分为词嵌入、位置嵌入,通过分段卷积神经网络输出实体之间的关系。
[0015]进一步地,前述的步骤S4包括:使用基于实体链接方法的消歧方法来解决实体的歧义问题,首先根据过滤大部分指称项不可能指向的实体,保留少量链接实体候选,然后根据预设指称项m及其链接实体候选E=e1,e2,...,e
n
,其中通过选择与预设指称项具有最高一致性打分的实体作为目标实体。
[0016]进一步地,前述的步骤S5具体为:将农业气象实体建立(E1,R,E2)三元组写入csv文件,并将三元组构成的知识体系存入Neo4j图数据库,其中,E1代表实体,R代表实体间关系,E2代表实体。
[0017]相较于现有技术,本专利技术的有益效果如下:本专利技术提供的一种面向农业气象领域的知识图谱的构建方法,农业气象数据主要来源于中国农业气象网站、出版的农业气象相关书籍、国家农业气象专业教材、国家农作物操作手册以及农业气象案例,这些数据特点是半结构化数据和非结构化数据共存。因此本专利技术提出的一种面向农业气象领域知识图谱的构建方法中对于数据的处理方法为两种基于深度学习的方法进行知识抽取,一种为BiLSTM+CRF的方法进行实体抽取,另一种为PCNN的方法进行关系抽取。此外,由于本专利技术采用的是自顶向下的方法,因此本专利技术对于本体概念层的构建方法为:通过领域专家所提供的知识和规则构建本体。最后,由于本专利技术为半自动更新知识图谱,新的知识(三元组)会随着迭代加入,进行融合与验证的步骤以完成对农业气象知识图谱的维护与构建。
附图说明
[0018]图1为本专利技术一种面向农业气象领域的知识图谱构建方法的流程图。
[0019]图2为农业气象数据处理流程图。
[0020]图3为农业气象知识抽取与知识体系构建流程图。
[0021]图4位PCNN模型图。
[0022]图5为构建农业气象知识图谱流程图。
[0023]图6为农业气象知识图谱部分效果展示图。
具体实施方式
[0024]为了更了解本专利技术的
技术实现思路
,特举具体实施例并配合所附图式说明如下。
[0025]在本专利技术中参照附图来描述本专利技术的各方面,附图中示出了许多说明性实施例。本专利技术的实施例不局限于附图所述。应当理解,本专利技术通过上面介绍的多种构思和实施例,以及下面详细描述的构思和实施方式中的任意一种来实现,这是因为本专利技术所公开的构思和实施例并不限于任何实施方式。另外,本专利技术公开的一些方面可以单独使用,或者与本专利技术公开的其他方面的任何适当组合来使用。
[0026]如图1所示,本专利技术提供的一种面向农业气象领域的知识图谱构建方法,包括以下
步骤:
[0027]S1、收集农业气象数据,对该农业气象数据进行预处理;
[0028]S2、基于农业气象领域所涉及的预设概念、同时基于农业气象实例,以及根据农业气象数据的关系,通过上下位关系构建农业气象本体;
[0029]S3、通过建立参数化模型进行农业气象知识抽取,获得预处理数据与农业气象本体之间的映射关系,获得与本体相关的头实体、尾实体、以及头尾实体关系三元组;
[0030]S4、通过计算实体间相似度,对各个实体进行融合时;通过实体链接方法消除实体间的歧义,获得更新的三元组;
[0031]S5、将三元组构成农业气象知识图谱,按照预设实体关系对农业气象知识图谱包含的三元组进行验证,删除虚假实体关系三元组;
[0032]S6、根据农业知识图谱所包含的三元组之间的关系,推理新的三元组,并更新农业气象知识图谱。
[0033]细节流程图如图5所示:
[0034]步骤S1、收集农业气象数据,对该农业气象数据进行预处理,流程见图2。农业气象知识图谱中包含的农业气象数据来源于中国农业气象网站、出版的农业气象相关书籍、国家农业气象专业教材、国家农作物操作手册以及农业气象案例;这些农业气象数据包含半结构化数据和非结构化数据,按照数据类型筛选、获取、清洗以及存储。提取相关农业气象新本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种面向农业气象领域的知识图谱构建方法,其特征在于,包括如下步骤:S1、收集农业气象数据,对该农业气象数据进行预处理;S2、基于农业气象领域所涉及的预设概念、同时基于农业气象实例,以及根据农业气象数据的关系,通过上下位关系构建农业气象本体;S3、通过建立参数化模型进行农业气象知识抽取,获得预处理数据与农业气象本体之间的映射关系,获得与本体相关的头实体、尾实体、以及头尾实体关系三元组;S4、通过计算实体间相似度,对各个实体进行融合时通过实体链接方法消除实体间的歧义,获得更新的三元组;S5、将三元组构成农业气象知识图谱,按照预设实体关系对农业气象知识图谱包含的三元组进行验证,删除虚假实体关系三元组;S6、根据农业知识图谱所包含的三元组之间的关系,推理新的三元组,并更新农业气象知识图谱。2.根据权利要求1所述的一种面向农业气象领域的知识图谱构建方法,其特征在于,步骤S1中,从中国农业气象网站、农业气象书籍、国家农业气象专业教材、国家农作物操作手册以及农业气象案例中去收集农业气象数据;所述农业气象数据包括半结构化数据和非结构化数据。3.根据权利要求1所述的一种面向农业气象领域的知识图谱构建方法,其特征在于,对农业气象数据预处理具体为:利用爬虫技术搜集关于中国农业气象的网站,并按照信任度对搜集的网站进行排序,选取大于预设信任度的网址;利用OCR工具,将纸质...
【专利技术属性】
技术研发人员:马廷淮,苏昱铭,王宇博,
申请(专利权)人:南京信息工程大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。