【技术实现步骤摘要】
一种基于云计算的知识图谱架构实现方法及系统
本专利技术涉及云计算的
,尤其涉及一种基于云计算的知识图谱架构实现方法及系统。
技术介绍
近年来,随着人工智能技术的发展,知识图谱的重要性逐渐凸显出来,尤其人工智能中自然语言识别与人机对话,更是离不开知识图谱,知识图谱能够用来将自然界中存在的实体以及概念,通过关系的形式关联起来。而现有的计算机领域没有一个系统的方法或者架构,将具体的知识图谱的实现方法描述以及实现,较多的存在于概念,也没有系统的实现从数据挖掘到实体关联、图谱展示的整个过程。
技术实现思路
本部分的目的在于概述本专利技术的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本申请的说明书摘要和专利技术名称中可能会做些简化或省略以避免使本部分、说明书摘要和专利技术名称的目的模糊,而这种简化或省略不能用于限制本专利技术的范围。鉴于上述现有存在的问题,提出了本专利技术。因此,本专利技术解决的一个技术问题是:提供一种基于云计算的知识图谱架构实现方法,结合爬虫服务、实体抽取关 ...
【技术保护点】
1.一种基于云计算的知识图谱架构实现方法,其特征在于:包括以下步骤,/n数据获取模块(100)获取数据资源并存储;/n实体抽取模块(200)从数据资源中进行实体抽取,得到实体信息;/n将实体信息传输至知识存储模块(400),并进行存储;/n实体关联模块(300)从数据资源中进行实体关系抽取;/n将建立的实体关系传输至知识存储模块(400),并进行存储;/n图谱展示模块(500)根据知识存储模块(400)存储内容进行数据展示。/n
【技术特征摘要】
1.一种基于云计算的知识图谱架构实现方法,其特征在于:包括以下步骤,
数据获取模块(100)获取数据资源并存储;
实体抽取模块(200)从数据资源中进行实体抽取,得到实体信息;
将实体信息传输至知识存储模块(400),并进行存储;
实体关联模块(300)从数据资源中进行实体关系抽取;
将建立的实体关系传输至知识存储模块(400),并进行存储;
图谱展示模块(500)根据知识存储模块(400)存储内容进行数据展示。
2.如权利要求1所述的基于云计算的知识图谱架构实现方法,其特征在于:所述数据获取模块(100)通过解析网页来获取数据资源。
3.如权利要求2所述的基于云计算的知识图谱架构实现方法,其特征在于:所述解析网页还包括以下步骤,
通过http请求获取网页,并将获取到的网页进行解析,从而得到网页中所有的链接地址;
将得到的所有的url放入消息队列中;
读取存放url的消息队列从而获取url,根据url请求网页内容,获取到网页的内容数据,将得到的数据信息存储在数据库中;
从消息队列中依次取网页的url链接地址,并重复以上步骤。
4.如权利要求2或3所述的基于云计算的知识图谱架构实现方法,其特征在于:所述实体抽取模块(200)进行实体抽取还包括以下步骤,
将接收到的数据资源进行转化为HtmlDocument格式;
从Document对象中提取对应的实体信息。
5.如权利要求4所述的基于云计算的知识图谱架构实现方法,其特征在于:所述实体信息包括实体名称以...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。