一种基于众包的知识图谱构建方法及系统技术方案

技术编号:24169093 阅读:36 留言:0更新日期:2020-05-16 02:22
本发明专利技术公开了一种基于众包的知识图谱构建方法及系统,所述方法包括如下步骤:步骤S1、创建图空间;步骤S2、创建用户模式并进行模式匹配和融合;步骤S3、上传资源;步骤S4、图谱构建。所述系统包括图空间模块、用户模式模块、资源模块、图谱构建模块、图数据库容器集群管理模块。本发明专利技术采用基于众包的知识获取方法,用户可以根据自己的需求提供资源,添加到知识图谱中,解决知识图谱的资源获取问题。本发明专利技术提出一种基于OWL的模式,对异构资源进行描述,从元模型上控制其异构性,使得通过该方法构建的知识图谱可以更容易地进行融合。本发明专利技术实现知识应用的操作接口,所述操作接口提供对知识图谱的搜索能力和推理能力。

A knowledge map construction method and system based on crowdsourcing

【技术实现步骤摘要】
一种基于众包的知识图谱构建方法及系统
本专利技术属于计算机
,涉及一种知识图谱构建方法及系统,具体涉及一种基于众包的知识图谱构建方法及系统。
技术介绍
知识图谱是将知识结构化形成的知识系统,其中包含了基本事实、通用规则和其他有关信息,常用于人工智能领域的知识抽取、存储与推理等任务。随着智能技术的不断发展,作为人工智能支柱的知识图谱以其强大的知识表示和推理能力受到了学术界和产业界的广泛关注。近年来,知识图谱在语义搜索、问答、知识管理等领域得到了广泛的应用,为了改进信息服务质量,国内外互联网公司纷纷推出知识图谱产品,如谷歌知识图谱、微软BingSatori、百度知心及搜狗知立方等。各个语音助理背后,知识图谱也扮演着重要角色。在大数据的背景下,现有的知识图谱技术有以下能力:一是覆盖能力,能够覆盖多领域的大规模数据;二是包容能力,能够包含大量异构的数据,包容知识的不同表达形式,从而保证应用和用户个性化需求得到满足;三是表示能力,能够对知识的语义信息进行表示。而在当前知识图谱构建领域,多数研究方法通过抽取实体与实体之间的关系来构建知识图谱,本文档来自技高网...

【技术保护点】
1.一种基于众包的知识图谱构建方法,其特征在于所述方法包括如下步骤:/n步骤S1、创建图空间:/n所述图空间为面向用户应用的命名空间,包含一个图数据库容器、一个RDF数据库和一个或多个Trans模型;/n步骤S2、创建用户模式并进行模式匹配和融合:/n创建用户模式,描述实体类、属性和关系;将用户模式存入步骤S1中创建的图空间所对应的RDF数据库;将用户模式和系统默认模式进行匹配和融合,生成模式匹配表,存入数据库;/n步骤S3、上传资源:/n用户根据用户模式描述的数据格式上传资源,利用步骤S2所述用户模式和模式匹配表对资源进行正确性校验,并对资源进行统一描述,将资源加入到资源入库队列中;/n步骤...

【技术特征摘要】
1.一种基于众包的知识图谱构建方法,其特征在于所述方法包括如下步骤:
步骤S1、创建图空间:
所述图空间为面向用户应用的命名空间,包含一个图数据库容器、一个RDF数据库和一个或多个Trans模型;
步骤S2、创建用户模式并进行模式匹配和融合:
创建用户模式,描述实体类、属性和关系;将用户模式存入步骤S1中创建的图空间所对应的RDF数据库;将用户模式和系统默认模式进行匹配和融合,生成模式匹配表,存入数据库;
步骤S3、上传资源:
用户根据用户模式描述的数据格式上传资源,利用步骤S2所述用户模式和模式匹配表对资源进行正确性校验,并对资源进行统一描述,将资源加入到资源入库队列中;
步骤S4、图谱构建:
从步骤S3所述资源入库队列中取出资源,与知识图谱中的资源进行对齐与融合,新资源加入到知识图谱中,利用Trans系列算法对知识图谱进行训练,得到知识表示学习模型。


2.根据权利要求1所述的基于众包的知识图谱构建方法,其特征在于所述步骤一中,用户从图数据库容器集群分配图数据库容器,分配RDF数据库存储空间,分配Trans模型存储空间。


3.根据权利要求1所述的基于众包的知识图谱构建方法,其特征在于所述步骤S2的具体步骤如下:
步骤S21、在前端新建用户模式,定义实体类,定义类继承关系,定义类属性,定义类属性取值范围,定义关系,定义关系取值范围,定义完成后保存提交,用户模式将保存到RDF数据库中;
步骤S22、模式匹配:
步骤S21所述用户模式O1与系统默认模式O2进行匹配,输出为模式匹配表T,匹配表项为模式中定义的类、属性或关系;匹配方法结合文本相似性算法和结构相似性算法,计算用户模式O1中每一项与系统默认模式O2中每一项的文本和结构相似性,将两种相似性组合后得到相似性值,若大于阈值,则认为对应项是匹配的,加入模式匹配表T中;
步骤S23、模式融合:
输入为步骤S21所述用户模式O1、步骤S22所述系统默认模式O2与步骤S22所述模式匹配表T,输出为新的默认模式NewO2;
根据模式匹配表T,将用户模式O1与系统默认模式O2连接,若模式匹配表T中的匹配项为1:null,即用户模式O1中的实体在系统默认模式O2中不存在,为系统默认模式O2创建相同的实体;若模式匹配表T中的匹配项为1:1,则跳过;
根据模式匹配表T,对系统默认模式O2进行约束补全,包括上下位关系补全,定义域值域补全与属性约束补全;上下文关系补全遍历用户模式O1中类和属性的父类和父属性,根据模式匹配表T,补充到系统默认模式O2对应项中;定义域值域补全遍历用户模式O1中属性和关系,根据模式匹配表T,补充到系统默认模式O2对应项中;属性约束补全遍历用户模式O1中属性约束,根据模式匹配表T,补充到系统默认模式O2对应项中。


4.根据权利要求1所述的基于众包的知识图谱构建方法,其特征在于所述步骤S4的具体步骤如下:
步骤S41、从步骤S3所述资源入库队列中取出待入库资源e1,计算待...

【专利技术属性】
技术研发人员:涂志莹刘星焜王忠杰徐晓飞
申请(专利权)人:哈尔滨工业大学
类型:发明
国别省市:黑龙;23

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1