图数据库创建及数据加载方法、设备及介质技术

技术编号:18084107 阅读:49 留言:0更新日期:2018-05-31 12:35
本发明专利技术提供的图数据库创建及数据加载方法、设备及介质,方法为:接收用户输入的结构化数据源文件数据,将源文件数据转化为csv格式或tsv格式;获取在格式转化后的文件数据中选择的节点,并为节点对应选择节点属性;获取在格式转化后的文件数据中选择的边,边中至少包括2个已选择的节点;从边包含的节点中选择2个节点作为边的起始点和终点,并为边选择边属性;将节点和边,节点对应的节点属性和边对应的边属性传输给服务器,创建图数据,存入图数据库。本发明专利技术通过设置的可视化界面,让用户基于常见源文件数据通过简单流程进行图建模并导入图到图数据库,大大简化了原来非常复杂的建立图的过程,实现了简单拖拽完成的便利,提高了处理效率。

【技术实现步骤摘要】
图数据库创建及数据加载方法、设备及介质
本专利技术涉及计算机领域,尤其涉及图数据库创建及数据加载方法、设备及介质领域。
技术介绍
现在图数据库(graphdatabase)越来越受到欢迎,人们主要使用图数据库来支持知识图谱、画像类应用,在图数据库中数据是按照“节点”和“边”的模式存储和操作的,最直接的图的例子就是社交网络,每个人是一个节点,边就是朋友关系。世界三大开源图数据库是Neo4j,Titan,Orientdb。要使用这些图数据库必须先通过某种流程基于非图结构数据源通过数据建模、变换和导入等操作建立图结构数据并导入库。如果数据源是csv文件,那么必须用每个不同的图数据库提供的import方法来加载数据。同时,不仅仅是文件格式需要转化的问题,更重要的是要某种方法告诉目标图数据库这个数据源中的数据哪些要建模成“节点”信息导入,哪些要作为“边”信息导入。现在各个图数据库的导入数据方法都非常复杂,一个不懂得编程或不懂得对应图数据库查询语言或不懂得执行命令行程序的用户很难简单的完成从一般常见数据源如csv文件到图数据库的建模导入,简单的说,不存在一个面向用户无需编写任何代码或脚本的流程完成图的建模和导入。传统的数据库导出文件,或者结构化的数据都是csv或类似的格式,这种数据储存方式和图数据库把数据存成点和点与点之间的边的方式差距非常大。举例来说,csv的每一行包含了除id外的许多字段,他们都存在了同一行里;但是在图数据库里,原来一行的某些列或者字段就会被提取出来专门作为一个点,使得原来的不少列都变为了图中的节点,而他们的边需要由具有建模和丰富编程经验的人设计哪些字段要,哪些不要,哪些算图数据库的节点,哪些算边等等,且这些操作都要实时完成。因此,现有技术中的缺陷是:现有技术中对于图的建模和导入,流程复杂,需要编写代码或脚本完成图的建模和导入。
技术实现思路
针对上述技术问题,本专利技术提供一种图数据库创建及数据加载方法、设备及介质,通过设置的可视化界面,让用户基于常见源文件数据通过简单流程进行图建模并导入图到图数据库,大大简化了原来非常复杂的建立图的过程,实现了简单拖拽完成的便利,提高了处理效率。为解决上述技术问题,本专利技术提供的技术方案是:第一方面,本专利技术提供一种图数据库创建及数据加载方法,包括:步骤S1,接收用户输入的源文件数据,所述源文件数据为结构化数据,将所述源文件数据转化为csv格式或tsv格式,通过可视化界面显示格式转化后的文件数据;步骤S2,获取由所述用户通过可视化界面在所述格式转化后的文件数据中选择的节点,并为所述节点对应选择节点属性;步骤S3,获取由所述用户通过可视化界面在所述格式转化后的文件数据中选择的边,其中,所述边中至少包括2个已选择的节点;步骤S4,从所述边包含的节点中选择2个节点作为所述边的起始点和终点,并为选择起始点和终点后的边选择边属性;步骤S5,将所述节点和边,所述节点对应的节点属性和所述边对应的边属性传输给服务器,创建图数据,存入图数据库。本专利技术提供的一种图数据库创建及数据加载方法,其技术方案为:接收用户输入的源文件数据,所述源文件数据为结构化数据,将所述源文件数据转化为csv格式或tsv格式,通过可视化界面显示格式转化后的文件数据;获取由所述用户通过可视化界面在所述格式转化后的文件数据中选择的节点,并为所述节点对应选择节点属性;获取由所述用户通过可视化界面在所述格式转化后的文件数据中选择的边,其中,所述边中至少包括2个已选择的节点;从所述边包含的节点中选择2个节点作为所述边的起始点和终点,并为选择起始点和终点后的边选择边属性;将所述节点和边,所述节点对应的节点属性和所述边对应的边属性传输给服务器,创建图数据,存入图数据库。本专利技术提供的一种图数据库创建及数据加载方法、设备及介质,通过设置的可视化界面,让用户基于常见源文件数据通过简单流程进行图建模并导入图到图数据库,大大简化了原来非常复杂的建立图的过程,实现了简单拖拽完成的便利,提高了处理效率。优选地,所述步骤S1,具体包括:步骤S11,接收用户输入的源文件数据,所述源文件数据为结构化数据;步骤S12,对所述源文件数据的格式进行判断,当所述源文件数据的格式为csv格式或tsv格式,不作处理,否则,将所述源文件数据的格式转化为csv格式或tsv格式。优选地,所述步骤S11中,还包括:接收用户输入的源文件数据;对所述源文件数据进行判断,如果所述源文件数据是结构化数据,跳转到所述步骤S12,如果所述源文件数据不是结构化数据,重新获取用户输入的源文件数据。优选地,所述步骤S2,具体包括:将所述格式转化后的文件数据转化成预览表头列的形式,显示在所述可视化界面;通过所述可视化界面在所述预览表头列中选择数据列作为节点,并从所述预览表头列中选择数据列作为所述节点对应的节点属性。优选地,所述步骤S3,具体包括:通过所述可视化界面在所述预览表头列中选择数据列作为边,其中,所述边中至少包括2个已选择的节点。优选地,所述步骤S3中,还包括:判断所述边中包含的已选节点的数量,当所述已选节点的数量不大于2,重新在所述格式转化后的文件数据中选择边,否则跳转到所述步骤S4。优选地,所述步骤S4,具体包括:从所述边包含的节点中选择2个节点作为所述边的起始点和终点,得到带起始点的边;为所述带起始点的边从所述预览表头列中选择数据列作为边属性。第二方面,本专利技术提供一种图数据库创建及数据加载设备,包括:至少一个处理器、至少一个存储器以及存储在所述存储器中的计算机程序指令,当所述计算机程序指令被所述处理器执行时实现如第一方面所述的方法。第三方面,本专利技术提供一种计算机可读存储介质,其上存储有计算机程序指令,当所述计算机程序指令被处理器执行时实现如第一方面所述的方法。与现有技术相比,本专利技术的优点:本专利技术提供的一种图数据库创建及数据加载方法、设备及介质,通过设置的可视化界面,让用户基于常见源文件数据通过简单流程进行图建模并导入图到图数据库,大大简化了原来非常复杂的建立图的过程,实现了简单拖拽完成的便利,提高了处理效率。附图说明为了更清楚地说明本专利技术具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍。图1示出了本专利技术实施例所提供的一种图数据库创建及数据加载方法的流程图;图2示出了本专利技术实施例所提供的一种图数据库创建及数据加载设备的硬件结构示意图。具体实施方式下面将结合附图对本专利技术技术方案的实施例进行详细的描述。以下实施例仅用于更加清楚地说明本专利技术的技术方案,因此只是作为示例,而不能以此来限制本专利技术的保护范围。实施例图1示出了本专利技术实施例所提供的一种图数据库创建及数据加载方法的流程图;如图1所示,本实施例提供的一种图数据库创建及数据加载方法,包括:步骤S1,接收用户输入的源文件数据,所述源文件数据为结构化数据,将所述源文件数据转化为csv格式或tsv格式,通过可视化界面显示格式转化后的文件数据;步骤S2,获取由所述用户通过可视化界面在所述格式转化后的文件数据中选择的节点,并为所述节点对应选择节点属性;步骤S3,获取由所述用户通过可视化界面在所述格式转化后的文件数据中选择的边,其中,所述边中至少包括2个已选择的节点;步骤S4,从本文档来自技高网
...
图数据库创建及数据加载方法、设备及介质

【技术保护点】
图数据库创建及数据加载方法,其特征在于,包括:步骤S1,接收用户输入的源文件数据,所述源文件数据为结构化数据,将所述源文件数据转化为csv格式或tsv格式,通过可视化界面显示格式转化后的文件数据;步骤S2,获取由所述用户通过可视化界面在所述格式转化后的文件数据中选择的节点,并为所述节点对应选择节点属性;步骤S3,获取由所述用户通过可视化界面在所述格式转化后的文件数据中选择的边,其中,所述边中至少包括2个已选择的节点;步骤S4,从所述边包含的节点中选择2个节点作为所述边的起始点和终点,并为选择起始点和终点后的边选择边属性;步骤S5,将所述节点和边,所述节点对应的节点属性和所述边对应的边属性传输给服务器,创建图数据,存入图数据库。

【技术特征摘要】
1.图数据库创建及数据加载方法,其特征在于,包括:步骤S1,接收用户输入的源文件数据,所述源文件数据为结构化数据,将所述源文件数据转化为csv格式或tsv格式,通过可视化界面显示格式转化后的文件数据;步骤S2,获取由所述用户通过可视化界面在所述格式转化后的文件数据中选择的节点,并为所述节点对应选择节点属性;步骤S3,获取由所述用户通过可视化界面在所述格式转化后的文件数据中选择的边,其中,所述边中至少包括2个已选择的节点;步骤S4,从所述边包含的节点中选择2个节点作为所述边的起始点和终点,并为选择起始点和终点后的边选择边属性;步骤S5,将所述节点和边,所述节点对应的节点属性和所述边对应的边属性传输给服务器,创建图数据,存入图数据库。2.根据权利要求1所述的方法,其特征在于,所述步骤S1,具体包括:步骤S11,接收用户输入的源文件数据,所述源文件数据为结构化数据;步骤S12,对所述源文件数据的格式进行判断,当所述源文件数据的格式为csv格式或tsv格式,不作处理,否则,将所述源文件数据的格式转化为csv格式或tsv格式。3.根据权利要求2所述的方法,其特征在于,所述步骤S11中,还包括:接收用户输入的源文件数据;对所述源文件数据进行判断,如果所述源文件数据是结构化数据,跳转到所述步骤S12,如果所述源文件数据不是结构化数据,重新获取用户输入的源...

【专利技术属性】
技术研发人员:张晨
申请(专利权)人:浙江创邻科技有限公司
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1