【技术实现步骤摘要】
基于开源arangodb的数据分析方法、装置及存储介质
本专利技术涉及计算机软件
,具体涉及一种基于开源arangodb的数据分析方法、装置及存储介质。
技术介绍
ArangoDB是一个开源NoSQL数据库,支持灵活的数据模型,比如文档Document、图Graph以及键值对Key-Value存储。ArangoDB同时也是一个高性能的数据库,它使用类SQL查询或JavaScript扩展来构建高性能应用。ArangoDB是一种图数据库具有如下特点:多数据模型,可以存储json文档、key/value键值对和图数据;可支持各种字段索引来提升查询速度,且支持字段内容的全文搜索;支持常用图遍历算法和更高级的最小子图等,比如用于寻找两点之间最短途径的算法,这些都是在大数据分布式上实现了自带的api。现在这个时代数据量越来越大,结构化的数据可以用spark统计计算,也可以用tableu这样的展示工具浏览。但是,社会网络中人与人之间的关系,这种关联性的连接图数据,如果用一般的sql数据库和表格形式,只能看见每个人的具 ...
【技术保护点】
1.一种基于开源arangodb的数据分析方法,其特征在于,包括:/n数据输入步骤:通过web页面获取用户输入的待检索数据;所述待检索数据包括指定的人员编号;/n待计算数据获取步骤:根据所述人员编号结合开源arangodb的图检索方式,得到多个独立图;/n数据图合并步骤:根据所述人员编号对多个独立图进行合并,得到合并图;/n无关节点删除步骤:采用深度优先遍历算法对所述合并图中的无关节点进行删除,得到展示图;/n数据展示步骤:通过前端默认的插件将所述展示图展示于web页面;所述展示图中包括指定人员之间的特定关系。/n
【技术特征摘要】
1.一种基于开源arangodb的数据分析方法,其特征在于,包括:
数据输入步骤:通过web页面获取用户输入的待检索数据;所述待检索数据包括指定的人员编号;
待计算数据获取步骤:根据所述人员编号结合开源arangodb的图检索方式,得到多个独立图;
数据图合并步骤:根据所述人员编号对多个独立图进行合并,得到合并图;
无关节点删除步骤:采用深度优先遍历算法对所述合并图中的无关节点进行删除,得到展示图;
数据展示步骤:通过前端默认的插件将所述展示图展示于web页面;所述展示图中包括指定人员之间的特定关系。
2.如权利要求1所述的数据分析方法,其特征在于,数据获取步骤具体为:
根据指定的人员编号逐条从开源arangodb数据库中检索获取指定人员的关系人信息;
根据所述关系人信息得到所述独立图。
3.如权利要求1所述的数据分析方法,其特征在于,数据图合并步骤具体为:
将具有相同人员编号的两个不同的独立图进行合并形成一个大图,以此类推,多个具有相同人员编号的独立图共同形成所述合并图。
4.如权利要求1所述的数据分析方法,其特征在于,所述合并图包括多个节点,无关节点删除步骤具体为:
以所述待检索数据中人员编号所在的节点为开始节点,采用DFS算法进行所述合并图的遍历操作;
当任一条路径的终点为所述待检索数据中的人员编号时,保留该条路径上的所有节点;
当任一条路径的终点不为所述待检索数据中的人员编号时,删除该条路径终点处的节点;
重复DFS算法的遍历操作,直至所有遍历出的路径的终点均为所述待检索数据中的人员编号为止。
5.一种基于开源arangodb的数据分析装置,其特征在于,包括:
输入单元,用于通过web页面获取用户输入的待检索数据;所述待检索数据包括指定的人员编号;
获取单元,用于根据所述人员编号结合开源arangodb的图检索方式,得到...
【专利技术属性】
技术研发人员:周鹏飞,李凡平,石柱国,
申请(专利权)人:青岛以萨数据技术有限公司,
类型:发明
国别省市:山东;37
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。