本体构建辅助装置制造方法及图纸

技术编号:22334417 阅读:39 留言:0更新日期:2019-10-19 13:05
检索部(13)从本体数据库(11)检索与所提供的单词相似的节点集合。模板制作部(14)根据检索到的节点集合中包含的各节点具有的共同的属性和节点来制作模板。追加信息决定部(15)制作将模板与具有所提供的单词作为名称的节点连接起来的三元组,将该三元组作为显示数据,并且在被提供了三元组的情况下,将该三元组登记到本体数据库(11)中。

Auxiliary device for ontology construction

【技术实现步骤摘要】
【国外来华专利技术】本体构建辅助装置
本专利技术涉及辅助构建以本体记述语言记述的本体的本体构建辅助装置。
技术介绍
随着近年来信息处理技术的发展,知识库或知识数据库大规模化,特别是在利用分散在网络上的知识库系统或知识数据库系统的情况下,要求有效地处理大量的数据。这种知识库或知识数据库系统是按照各个系统的构建规则而构建的。这样,为了利用分散在网络上的知识库系统或知识数据库系统的数据,如果将这些数据按照一定的基准进行分类并分层,则会很方便。作为其有力的方法,本体备受关注。本体包含针对与域相关的概念或用语而明确定义概念本身或用语本身、概念间或用语间的关系的信息,并使用本体记述语言进行记述。作为本体记述语言的例子,首先可列举作为用于系统地表示WEB中存在的词汇或知识以及它们之间的关系的技术的、在TheWorldWideWebConsortium(W3C)中建议的WebOntologyLanguage(OWL)。OWL通过由ResourceDescriptionFramework(RDF)中的作为相当于“谁的”的要素的主语、相当于“什么”的谓语、相当于“什么样的值”的宾语构成的被称作三元组(triple)的集合,表现词汇的可推论的等级体系。这里,主语、宾语被称作节点,谓语被称作属性。以下,设该三元组为以本体记述语言记述的三元组进行说明。构建独自的本体的作业大多数情况下是由人工进行的。但是,为了构建高精度的本体,需要精通本体,因而存在如下问题:一部分专家以外的人很难构建本体。进而存在如下问题:构成数据的数据项目数越多,则选择与各数据项目对应的属性需要越多的劳力和时间。因此,以往,例如如专利文献1所示,存在现有的进行本体间对应的本体构建辅助装置。现有技术文献专利文献专利文献1:日本特开2009-70133号公报
技术实现思路
专利技术要解决的课题但是,在上述以往的本体构建辅助装置中,需要用于将数据项目与现有的本体对应起来的、作为特用于本体对应的事先知识的元数据,有时未必能够降低本体构建作业的负荷。本专利技术正是为了解决该问题而完成的,其目的在于,得到能够降低本体构建作业的负荷的本体构建辅助装置。用于解决课题的手段本专利技术的本体构建辅助装置具有:检索部,其从本体数据库检索与所提供的单词相似的节点集合,在该本体数据库中登记有以本体记述语言记述的三元组;模板制作部,其根据由检索部检索到的节点集合中包含的各节点具有的共同的属性和节点来制作模板,该模板用于制作包含新追加的节点的三元组;以及追加信息决定部,其制作将由模板制作部制作出的模板与具有所提供的单词作为名称的节点连接起来的三元组,将该三元组作为显示数据,并且在被提供了三元组的情况下,将该三元组登记到本体数据库中。专利技术效果在本专利技术的本体构建辅助装置中,根据与所提供的单词相似的节点集合中包含的各节点具有的共同的属性和节点来制作模板,该模板用于制作包含新追加的节点的三元组,制作将该模板与具有所提供的单词作为名称的节点连接起来的三元组,将该三元组作为显示数据,并且在针对该显示数据提供了实施修正等后的三元组的情况下,将该三元组登记到本体数据库中。由此,能够降低本体构建作业的负荷。附图说明图1是本专利技术的实施方式1的本体构建辅助装置的结构图。图2是本专利技术的实施方式1的本体构建辅助装置的硬件结构图。图3是示出本专利技术的实施方式1的本体构建辅助装置中的检索部的动作的流程图。图4是本专利技术的实施方式1的本体构建辅助装置中的检索部的相似度计算的说明图。图5是示出本专利技术的实施方式1的本体构建辅助装置中的模板制作部的动作的流程图。图6A和图6B是本专利技术的实施方式1的本体构建辅助装置中的模板制作的说明图。图7是示出本专利技术的实施方式1的本体构建辅助装置中的追加信息决定部的动作的流程图。图8是示出本专利技术的实施方式1的本体构建辅助装置中的向用户提示的GUI显示例的说明图。具体实施方式以下,为了更详细地说明本专利技术,根据附图对用于实施本专利技术的方式进行说明。实施方式1图1是示出本实施方式的本体构建辅助装置的结构图。如图所示,本体构建辅助装置1具有本体数据库11、单词向量数据库12、检索部13、模板制作部14以及追加信息决定部15。本体数据库11是登记有以本体记述语言记述的三元组的集合的数据库。单词向量数据库12是登记有检索部13在检索相似节点集合时利用的单词向量的集合的数据库。该单词向量数据库12例如可以使用在文献:TomasMikolov,KaiChen,GregCorrado,andJeffreyDean,EfficientEstimationofWordRepresentationsinVectorSpace,ICLR2013.中记载的技术来构成。检索部13是从存储在本体数据库11中的现有的本体中检索具有与从输入装置2输入的单词相似的名称的节点集合的处理部。模板制作部14是制作模板的处理部,该模板用于制作新追加由检索部13输出的检索结果的各节点具有的共同属性的三元组。追加信息决定部15是如下处理部:制作将由模板制作部14制作出的模板与具有所提供的单词作为名称的节点连接起来的三元组并将其作为显示数据而输出到显示装置3,并且在从输入装置2针对该显示数据提供了实施修正等后的三元组的情况下,将该三元组登记到本体数据库11中。图2是用于实现图1所示的本体构建辅助装置的硬件结构图。如图所示,实现本体构建辅助装置的硬件具有处理器101、存储器102、鼠标103、键盘104、显示装置105以及辅助存储装置106。处理器101是用于通过执行与检索部13、模板制作部14以及追加信息决定部15对应的程序来实现这些功能部的处理器。存储器102是保持处理器101执行程序时的程序并且构成处理器101的作业区域的存储部。鼠标103和键盘104是相当于输入装置2的外围设备,该输入装置2用于供用户进行操作而进行数据输入。显示装置105是显示来自本体构建辅助装置1的输出数据的显示器这样的外围设备,相当于图1所示的显示装置3。辅助存储装置106是用于保持本体数据库11和单词向量数据库12并且存储与检索部13~追加信息决定部15对应的程序的存储装置。但是,辅助存储装置106未必必须存在于装置内部,也可以经由通信接口来利用存在于云上的存储装置。接着,对实施方式1的本体构建辅助装置的动作进行说明。检索部13使用单词向量数据库12从本体数据库11中检索与用户输入的单词相似的节点名称。图3的流程图表示检索部13的具体动作。首先,检索部13从输入装置2取得用户通过输入装置2输入的单词(步骤ST11)。接着,检索部13检索单词向量数据库12,取得所输入的单词的向量(步骤ST12)。接下来,检索部13使用在步骤ST12中取得的所输入的单词的向量来检索本体数据库11。在检索中使用向量彼此的相似度。在计算向量彼此的相似度时,考虑使用式(1)所示的欧几里德距离、式(2)所示的余弦相似度(步骤ST13)。其中,说明步骤ST13的相似度计算的例子。对于某个特定的节点,在多个不同名称的节点以同一属性连接而构成三元组的情况下,将多个不同名称的节点定义为节点集合。当检索部13检索本体数据库11时,使用在计算相似度时预先计算出的节点集合中包含的各节点的平均向量。图4示出相似度计算的例子。当在步骤ST1本文档来自技高网
...

【技术保护点】
1.一种本体构建辅助装置,其特征在于,该本体构建辅助装置具有:检索部,其从本体数据库检索与所提供的单词相似的节点集合,在该本体数据库中登记有以本体记述语言记述的三元组;模板制作部,其根据由所述检索部检索到的节点集合中包含的各节点具有的共同的属性和节点来制作模板,该模板用于制作包含新追加的节点的三元组;以及追加信息决定部,其制作将由所述模板制作部制作出的模板与具有所述所提供的单词作为名称的节点连接起来的三元组,将该三元组作为显示数据,并且在被提供了三元组的情况下,将该三元组登记到所述本体数据库中。

【技术特征摘要】
【国外来华专利技术】1.一种本体构建辅助装置,其特征在于,该本体构建辅助装置具有:检索部,其从本体数据库检索与所提供的单词相似的节点集合,在该本体数据库中登记有以本体记述语言记述的三元组;模板制作部,其根据由所述检索部检索到的节点集合中包含的各节点具有的共同的属性和节点来制作模板,该模板用于制作包含新追加的节点的三元组;以及追加信息决定部,其制作将由所述模板制作部制作出的模板与具有所述所提供的单词作为名称的节点连接起来的三元组,将该三元组作为显示数据,并且在被提供了三元组的情况下,...

【专利技术属性】
技术研发人员:内出隼人
申请(专利权)人:三菱电机株式会社
类型:发明
国别省市:日本,JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1