一种基于NLP的知识图谱构建方法技术

技术编号：24206652 阅读：45 留言：0更新日期：2020-05-20 14:57

本发明专利技术公开了一种基于NLP的知识图谱构建方法，要解决的是现有素材整理中存在的问题。本发明专利技术具体步骤如下：步骤一，通过人工及编写爬虫脚本采集素材，素材包括结构化数据、半结构化数据和非结构化数据；步骤二，对半结构化数据和结构化数据采用NLP方法进行迭代训练，直至结果的loss不再往下降；步骤三，对非结构化数据进行知识抽取，通过实体与实体的关系，构建知识图谱，并把实体和关系存入图数据库，即得到知识图谱。本发明专利技术利用NLP技术来做素材的实体及关系抽取，构建知识图谱，然后基于知识图谱做知识检索及知识问答，最终建立智能云，保护革命数字遗产。

A knowledge map construction method based on NLP

全部详细技术资料下载

【技术实现步骤摘要】
一种基于NLP的知识图谱构建方法
本专利技术涉及知识图谱建立领域，具体是一种基于NLP的知识图谱构建方法。
技术介绍
随着近年来人们对于精神的越来越重视，相关知识也广泛在群众中流传。随着智能化技术的流传，人们也开始探索知识的智能化建立。现有的方式需要从网站、书籍、影视作品中收集大量文本素材，这些素材是非结构化的，需要做结构化的实体抽取来构建知识图谱，比如在人物的介绍中，需要提取出人物的姓名、出生日期、逝世日期、籍贯、重要生平事迹等；在景点素材中，需要提取景点名称、地点、重要事件、人物等，虽然抽取这些信息非常简单，但是面对成千上万的素材整理，将是非常巨大的工作量，人们也在进行相关方面的探索。
技术实现思路
本专利技术实施例的目的在于提供一种基于NLP的知识图谱构建方法，以解决上述
技术介绍
中提出的问题。为实现上述目的，本专利技术实施例提供如下技术方案：一种基于NLP的知识图谱构建方法，具体步骤如下：步骤一，通过人工及编写爬虫脚本采集素材，素材包括结构化数据、半结构化数据和非结构化数据；步骤二，对半结构化数据和结构化数据采用NLP(NaturalLanguageProcessing，自然语言处理)方法进行迭代训练，直至结果的loss不再往下降；步骤三，对非结构化数据进行知识抽取，通过实体与实体的关系，构建知识图谱，并把实体和关系存入图数据库，即得到知识图谱。作为本专利技术实施例进一步的方案：步骤二中还包括评估结果的效果，如果结果的效果不好，继续新增...

【技术保护点】
1.一种基于NLP的知识图谱构建方法，其特征在于，具体步骤如下：/n步骤一，通过人工及编写爬虫脚本采集素材，素材包括结构化数据、半结构化数据和非结构化数据；/n步骤二，对半结构化数据和结构化数据采用NLP方法进行迭代训练，直至结果的loss不再往下降；/n步骤三，对非结构化数据进行知识抽取，通过实体与实体的关系，构建知识图谱，并把实体和关系存入图数据库，即得到知识图谱。/n

【技术特征摘要】
1.一种基于NLP的知识图谱构建方法，其特征在于，具体步骤如下：
步骤一，通过人工及编写爬虫脚本采集素材，素材包括结构化数据、半结构化数据和非结构化数据；
步骤二，对半结构化数据和结构化数据采用NLP方法进行迭代训练，直至结果的loss不再往下降；
步骤三，对非结构化数据进行知识抽取，通过实体与实体的关系，构建知识图谱，并把实体和关系存入图数据库，即得到知识图谱。

2.根据权利要求1所述的基于NLP的知识图谱构建方法，其特征在于，所述步骤二中还包括评估结果的效果，如果结果的效果不好，继续新增训练样本，优化模型参数，重复步骤一和步骤二，直至评估结果的效果好。

3.根据权利要求1所述的基于NLP的知识图谱构建方法，其特征在于，所述步骤一中素材来自网站、百度百科、书籍和影视作品。

<...

【专利技术属性】
技术研发人员：王奇锋，林朝福，
申请(专利权)人：赣州市智能产业创新研究院，
类型：发明
国别省市：江西;36

全部详细技术资料下载我是这个专利的主人