一种本体库的数据写入方法及装置制造方法及图纸

技术编号:23343411 阅读:35 留言:0更新日期:2020-02-15 03:54
本申请公开了一种本体库的数据写入方法及装置,其中,该方法包括:基于本体配置信息,将至少一个外部数据源中的本体相关数据导入到列式存储的分布式数据库中,得到一个或多个本体实例的本体数据;其中,在分布式数据库中,来自不同外部数据源的相同本体实例的本体数据基于本体实例标识关联;基于本体实例标识将分布式数据库中存储的同一本体实例的本体数据进行聚合,并写入到本体库中。

A data writing method and device of ontology library

【技术实现步骤摘要】
一种本体库的数据写入方法及装置
本申请涉及计算机
,尤其涉及一种本体库的数据写入方法及装置。
技术介绍
目前,随着互联网的发展,大量的信息涌入人们的视线,如何将这些海量数据存储起来,以方便人们找到所需的信息,是一个需要解决的问题。在相关技术中,解决上述问题的一个方案是将数据存储到关系数据库,关系数据库能够很好地存储结构化数据并存储实体之间的关系,同时支持结构化查询。但是对于关系较为复杂的情况,采用关系数据库进行存储,在设计数据表时的难度比较大,而且容易造成数据冗余。本体是一个源于哲学的概念,知识工程学者借用了这个概念,在开发知识系统时用于领域知识的获取。本体是用于描述一个领域的术语集合,其组织结构是层次结构化的,可以作为一个知识库的骨架和基础。本体是第三代互联网--语义网(SemanticWeb)的基础,也是语义搜索的基础。目前,这一概念已被引进数据库设计和开发,以本体的方式进行数据存储可以沿用之前的自下而上的方式,也可以采用自上而下的方式,即首先确定和设计领域中的概念和实体的构成关系,概念和实体所具体的属性,建立起一个系本文档来自技高网...

【技术保护点】
1.一种本体库的数据写入方法,其特征在于,包括:/n基于本体配置信息,将至少一个外部数据源中的本体相关数据导入到列式存储的分布式数据库中,得到一个或多个本体实例的本体数据;其中,在所述分布式数据库中,来自不同外部数据源的相同本体实例的本体数据基于本体实例标识关联;/n基于本体实例标识将所述分布式数据库中存储的同一本体实例的本体数据进行聚合,并写入到本体库中。/n

【技术特征摘要】
1.一种本体库的数据写入方法,其特征在于,包括:
基于本体配置信息,将至少一个外部数据源中的本体相关数据导入到列式存储的分布式数据库中,得到一个或多个本体实例的本体数据;其中,在所述分布式数据库中,来自不同外部数据源的相同本体实例的本体数据基于本体实例标识关联;
基于本体实例标识将所述分布式数据库中存储的同一本体实例的本体数据进行聚合,并写入到本体库中。


2.根据权利要求1所述的方法,其特征在于,所述本体配置信息包括:所述至少一个外部数据源的标识信息、所述外部数据源中的预设数据字段与定义本体的属性字段的映射关系、以及聚合同一本体实例的本体数据的数据融合规则。


3.根据权利要求2所述的方法,其特征在于,将至少一个外部数据源中的本体相关数据导入到列式存储的分布式数据库中,包括:
根据所述至少一个外部数据源的标识信息,从所述至少一个外部数据源中依次获取各个数据实体的预设数据字段的数据,并根据所述映射关系,将所述数据实体的预设数据字段的数据转换为本体实例的属性字段的数据后导入到所述分布式数据库。


4.根据权利要求2所述的方法,其特征在于,在基于本体配置信息,将至少一个外部数据源中的本体相关数据导入到列式存储的分布式数据库中之前,所述方法还包括:
基于预设的取数逻辑,从所述至少一个所述外部数据源中获取所述预设数据字段;
将所述预设数据字段与定义本体的属性字段进行匹配,得到所述外部数据源中的预设数据字段与定义本体的属性字段的映射关系。


5.根据权利要求1所述的方法,其特征在于,基于本体实例标识将同一本体实例的本体数据进行聚合,并写入到本体库,包括:
基于本体实例标识,将同一本体实例的不同属性字段的本体数据进行聚合,并写入到所述本体库中,其中,对于来自不同外部数据源的同一本体实例的本体数据:
根据预先设置的优先级,确定所述不同外部数据源中的优先级最高的外部数据源,将来自所述优先级最高的外部数据源的本体数据作为所述同一本体实例的本体数据写入到所述本体库中;或者,将来自所述不同数据源的本体数据中相同属性字段的本体数据进行组合,将组合得到的本体数据作为所述同一本体实例的本体数据写入到所述本体库中。


6.根据权利要求1至5任一项所述的方法,其特征在于,所述本体库包括:全文检索引擎和图数据库,其中,所述全文检索引擎存储的本体实例包括:实体类本体实例、事件类本体实例以及文档类本体实例,所述图数据库存储的本体实例包括:关系类本体实例。


7.根据权利要求6所述的方法,其特征在于,在基于本体实例标识将同一本体实例的本体数据进行聚合,并写入到本体库中之后,所述方法还包括:
接收到查询指令,从所述本体库中获取与所述查询指令对应的查询结果;
以图形的形式在画布中显示所述查询结果,其中,所述图形中包括:节点、或者,节点和节点之间的连接关系,所述节点用于表示所述查询结果中的实体类本体实例、事件类本体实例或文档类本体实例,节点之间的连接关系用于表示所述查询结果中的关系类本体实体。


8.根据权利要求7所述的方法,其特征在于,以图形的形式在画布中显示所述查询结果包括:
根据待显示的所述节点大小,计算出各个所述节点之间的间距;
根据待显示的所述节点的数量,计算出节点排列的行数和列数;
根据所述行数、列数和所述间距计算得到第一个所述节点距离画布中心点的坐标差;
根据所述中心点的坐标,得到第一个所述节点的实际坐标;
根据所述行数、列数和所述间距计算得到第二个所述节点距离画布中心点的坐标差,并根据所述中心点的坐标,得到第二个所述节点的实际坐标,如此循环,得到各个所述节点的实际坐标;
按照各个所述节点的实际坐标,显示所述查询结果。


9.根据权利要求7所述的方法,其特征在于,以图形的形式在画布中显示所述查询结果包括:
将待显示的各个所述节点划分为多个子图;
根据预设的子图的显示图标的形状,确定各个所述子图的显示图标的中心点及大小;
按照各个所述子图的中心点,将各个所述子图的显示图标按照网格形式进行排列;
在排列后的各个所述子图的显示图标之间存在重叠的情况下,对各个所述子图的显示图标的排列方式进行调整,直到各个所述子图的显示图标之间不存在重叠,按照当前的排列方式显示各个所述子图的显示图标;
对于任一所述子图中的各个所述节点,获取各个所述节点中与该节点具有一度关系的节点的对应关系,根据所述对应关系,确定该子图的布局层数以及各层布局的节点,再根据节点大小、间距以及层数,确定布局在各层的节点的纵坐标,并按照同层节点从该子图的显示图标的中间均匀向两边分布的原则,确定各层的节点的横坐标,根据该子图的各个所述节点的纵坐标和横坐标显示该子图的各个所述节点。


10.根据权利要求7所述的方法,其特征在于,在以图形的形式在画布中显示所述查询结果之后,所述方法还包括:
接收到输入的扩展指令,其中,所述扩展指令指示对当前选中的节点进行扩展;
从所述本体库中查询并显示与所述当前选中的节点具有一度关系的节点;
响应输入的对显示的所述具有一度关系的节点进行选择的操作,将选择的节点显示在画布上,并显示所述选择的节点与所述当前选中的节点之间的连接关系。


11.根据权利要求7所述的方法,其特征在于,在以图形的形式在画布中显示所述查询结果之后,所述方法还包括:
接收到输入的流分析指令,其中,所述流分析指令指示对当前选中的节点进行流分析;
查询与所述当前选中的节点存在数据传输关系的关系节点;
以动画的方式显示所述当前选中的节点与所述关系节点之间的数据传输。


12.根据权利要求5所述的方法,其特征在于,以图形的形式在画布中显示所述查询结果包括:
按照所述查询结果中各个本体实例涉及的时间属性,将所述查询结果中的各个本体实例的节点显示在时间轴上的对应区域;或者,
对于所述查询结果中两个实体类本体实例涉及的多个事件类本体实例,对所述多个事件类本体实例的节点进行合并显示。


13.根据权利要求5所述的方法,其特征在于,在以图形的形式在画布中显示所述查询结果之后,所述方法还包括:
接收到词云分析指令,其中,所述词云分析指令指示展现文档类本体中的热点词汇;
在所述查询结果中包含文档类本体实例的情况下,从所述文档类本体实例的文档中查询并显示热点词汇。


14.根据权利要求5所述的方法,其特征在于,在以图形的形式在画布中显示所述查询结果之后,所述方法还包括:
按照所述查询结果中各个本体实例的类型以及属性信息,分类显示所述查询结果;或者
检测到从一个所述节点到另一个所述节点的拖动操作,建立所述一个节点与所述另一个节点之间的关系类本体实例,并根据接收到的输入信息,确定建立的所述关系类本体实例的属性信息;或者
接收到对编辑指令,其中,所述编辑指令指示对当前显示的节点对应的本体实例的属性进行编辑;根据接收到的输入信息,修改所述当前显示的节点对应的本体实例的属性信息;或者,
接收到图形搜索指令,其中,所述图形搜索指令指示搜索画布上指定...

【专利技术属性】
技术研发人员:黄伟刘译璟廖锐于帮付苏萌刘钰龚鑫
申请(专利权)人:北京百分点信息科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1