农业知识图谱构建装置、方法及计算机可读存储介质制造方法及图纸

技术编号:22055341 阅读:40 留言:0更新日期:2019-09-07 15:17
一种农业知识图谱构建方法,包括:获取一目标区域的农业领域数据,并基于获取的农业领域数据构建语料库;对所述语料库中的语料进行分词与词性标注处理,以识别出多个实体概念;根据预设筛选规则对识别出的实体概念进行筛选得到多个农业实体;对所述语料库中的语料进行解析与关系提取,得到多个所述农业实体之间的关联关系;及根据每一所述农业实体以及每一所述农业实体之间的关联关系,建立农业知识图谱。本发明专利技术还提供一种农业知识图谱构建装置及计算机可读存储介质。上述农业知识图谱构建装置、方法及计算机可读存储介质,可实现针对农业领域构建农业知识图谱,提升农业领域数据管理效率及数据使用的便捷性。

Construction Device, Method and Computer Readable Storage Medium of Agricultural Knowledge Map

【技术实现步骤摘要】
农业知识图谱构建装置、方法及计算机可读存储介质
本专利技术涉及数据处理
,尤其涉及一种农业知识图谱构建装置、方法及计算机可读存储介质。
技术介绍
知识图谱具有强大的数据描述能力,为智能化信息应用提供了技术基础,其通过推理实现概念检索,同时可以以图形化的方式向用户呈现结构化知识。知识图谱在多个领域均有应用,比如医疗、金融、教育、投资等具有关系存在的行业。但目前还尚未有成熟的农业知识图谱构建方式。
技术实现思路
有鉴于此,有必要提供一种农业知识图谱构建装置、方法及计算机可读存储介质,其可实现针对农业领域构建农业知识图谱,提升农业领域数据管理效率及数据使用的便捷性。本专利技术一实施方式提供一种农业知识图谱构建方法,所述方法包括:获取一目标区域的农业领域数据,并基于获取的农业领域数据构建语料库;对所述语料库中的语料进行分词与词性标注处理,以识别出多个实体概念;根据预设筛选规则对识别出的实体概念进行筛选得到多个农业实体;对所述语料库中的语料进行解析与关系提取,得到多个所述农业实体之间的关联关系;根据每一所述农业实体以及每一所述农业实体之间的关联关系,建立农业知识图谱;从网络上爬取得到每一所述本文档来自技高网...

【技术保护点】
1.一种农业知识图谱构建方法,其特征在于,所述方法包括:获取一目标区域的农业领域数据,并基于获取的农业领域数据构建语料库;对所述语料库中的语料进行分词与词性标注处理,以识别出多个实体概念;根据预设筛选规则对识别出的实体概念进行筛选得到多个农业实体;对所述语料库中的语料进行解析与关系提取,得到多个所述农业实体之间的关联关系;根据每一所述农业实体以及每一所述农业实体之间的关联关系,建立农业知识图谱;从网络上爬取得到每一所述农业实体的百科信息;基于预设提取规则对爬取得到的百科页面内容进行提取,并将提取得到的内容添加至所述语料库和/或所述农业知识图谱;对爬取得到的百科页面内容进行相似度分析,得到每一所...

【技术特征摘要】
1.一种农业知识图谱构建方法,其特征在于,所述方法包括:获取一目标区域的农业领域数据,并基于获取的农业领域数据构建语料库;对所述语料库中的语料进行分词与词性标注处理,以识别出多个实体概念;根据预设筛选规则对识别出的实体概念进行筛选得到多个农业实体;对所述语料库中的语料进行解析与关系提取,得到多个所述农业实体之间的关联关系;根据每一所述农业实体以及每一所述农业实体之间的关联关系,建立农业知识图谱;从网络上爬取得到每一所述农业实体的百科信息;基于预设提取规则对爬取得到的百科页面内容进行提取,并将提取得到的内容添加至所述语料库和/或所述农业知识图谱;对爬取得到的百科页面内容进行相似度分析,得到每一所述农业实体的分类信息;及将每一所述农业实体的分类信息添加至所述农业知识图谱;其中,所述对爬取得到的百科页面内容进行相似度分析的步骤包括:提取每一所述百科页面内容中的多个指定特征;利用KNN算法计算得到任意两个百科页面内容之间的每一特征组的相似度;及对计算得到的多个特征组的相似度进行加权运算得到所述任意两个百科页面内容的综合相似度。2.如权利要求1所述的方法,其特征在于,所述农业领域数据包括非结构化的农业领域数据及半结构化的农业领域数据。3.如权利要求1或2所述的方法,其特征在于,所述对所述语料库中的语料进行分...

【专利技术属性】
技术研发人员:吴良顺
申请(专利权)人:卓尔智联武汉研究院有限公司
类型:发明
国别省市:湖北,42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1