The invention provides a method for distributed database data distribution method and device, wherein, the method comprises the following steps: data distribution task, the data are split according to the minimum storage unit; the minimum storage unit distribution target resolution data calculation, and according to the distribution of the target node to distribute data. The data is divided in accordance with the minimum storage unit, the distribution target of the split data is calculated, and the data is distributed to the distributed object. Due to the physical continue to delay, to maintain the entire data calculation process as far as possible without materialized or less materialized data, reduce disk I/O. Until the final distribution of the data in accordance with the distribution of physical data. Reduced budget workload and system burden.
【技术实现步骤摘要】
本专利技术属于分布式数据库
,尤其是涉及一种适用于分布式数据库的数据分发方法及装置。
技术介绍
随着信息系统的日趋规模化、区域化,分布式数据库在信息系统中所承担的数据桥梁作用越来越重要,分布式数据库的设计在系统中的应用日渐广泛。分布式数据库是指利用高速计算机网络将物理上分散的多台计算机相连,逻辑上构成一个整体的数据库组织形式。每台计算机都可能有DBMS的一份完整拷贝副本,或者部分拷贝副本,并具有自己局部的数据库,通过分布来获取更大的存储容量和更高的并发访问量。在分布式数据库的使用过程中,随着分布式节点和数据量的增加,如何将数据能够快速准确地分布到节点中成为了一个重要的问题。目前,主要通过以下方式实现:抽取需要分布的数据,按照分布规则,如hash分布,对数据进行拆分;和分发数据。但是,上述方式还存在着一定的问题,需要分布的数据形成结果集合需要进行一次物化,而对其进行拆分形成新的结果集则相当于二次物化。增加计算工作量的同时还需要在内存中将数据保存两份,加大了系统负担。此外,如果对全量的结果集,按照并行度直接拆分任务,还会造成I/O离散度加大,降低了整个系统的性能。
技术实现思路
本专利技术实施例提供了一种适用于分布式数据库的数据分发方法及装置,以实现在减少物化过程的同时,实现数据分布的目的一方面,本专利技术实施例提供了适用于分布式数据库的数据分发方法,包括:存在数据分发任务时,对所述数据按照最小存储单位进行拆分;计算拆分的最小存储单位数据的分布目标,并根据所述分布目标向节点分发数据。进一步的,存在数据分发任务时,对所述数据按照最小存储单位进行拆分之前,还包 ...
【技术保护点】
一种适用于分布式数据库的数据分发方法,其特征在于,包括:存在数据分发任务时,对所述数据按照最小存储单位进行拆分;计算拆分的最小存储单位数据的分布目标,并根据所述分布目标向节点分发数据;存在数据分发任务时,对所述数据按照最小存储单位进行拆分之前,还包括:检测是否存在数据分发任务。
【技术特征摘要】
1.一种适用于分布式数据库的数据分发方法,其特征在于,包括:存在数据分发任务时,对所述数据按照最小存储单位进行拆分;计算拆分的最小存储单位数据的分布目标,并根据所述分布目标向节点分发数据;存在数据分发任务时,对所述数据按照最小存储单位进行拆分之前,还包括:检测是否存在数据分发任务。2.根据权利要求1所述的方法,其特征在于,在根据所述分布目标向节点分发数据之后,还包括:物化所述分发任务对应的数据结果集合;所述物化所述分发任务对应的数据结果集合,包括:在对所述结果集合进行查询时,按照固定大小的线程轮流获取分发任务。3.根据权利要求1所述的方法,其特征在于,所述物化所述分发任务对应的数据结果集合,包括:为每个写入线程预先分配存储空间,以使得每个进程通过抢锁获得目标存储空间。4.根据权利要求1所述的方法,其特征在于,所述根据所述分布目标向节点分发数据,包括在所述数据结果集合满足预设的发送数量时,向节点发送所述数据结...
【专利技术属性】
技术研发人员:武新,崔维力,刘威,郑黎辉,
申请(专利权)人:天津南大通用数据技术股份有限公司,
类型:发明
国别省市:天津;12
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。