并行计算系统及去重计数方法技术方案

技术编号:4074625 阅读:248 留言:0更新日期:2012-04-11 18:40
本发明专利技术另提出一种并行计算系统及方法,其方法包括以下步骤:(1)设置多个节点数据库。(2)将源数据库中的海量数据按照关键字段进行分割,并分配到各个节点数据库。(3)判断统计内容是否是被分割的关键字段。(4)若是,则对关键字段进行非重复的计数运算。(5)若不是,对非关键字段进行分组统计运算。本发明专利技术可以大大提高大型数据库的统计速度,并可以确保数据统计的准确性。

【技术实现步骤摘要】

本专利技术涉及一种数据库的统计方法,特别涉及一种。
技术介绍
随着计算机技术的发展和普及,大型数据库迅速地进入到电信、金融等各个行业。 SQL (Structured Query Language,结构化查询语言)是专为数据库而建立的操作命令集, 是一种数据库语言。SQL的主要功能就是同各种数据库建立联系,使不同类型的数据库之间 进行沟通。按照ANSI (美国国家标准协会)的规定,SQL被作为关系型数据库管理系统的 标准语言。在使用SQL时,只需要发出“做什么”的命令,而不需要考虑“怎么做”。SQL语 句可以用来执行对数据库的各种各样的操作,例如更新数据库中的数据,从数据库中提取 数据等。目前,绝大多数流行的关系型数据库管理系统,如QraclhSybashMicrosoft Sql Server, Access等都采用了 SQL语言标准。然而,随着信息化建设的深入,各行各业都建立了大量的数据库,而这些数据库的 数据量也越来越大,限制了对数据库的统计速度。为了提高数据库的统计速度,最常用的方 式是对硬件系统进行优化,提升的计算机性能,如提高CPU频率、增加内存、提高磁盘访问 速度等,本文档来自技高网...

【技术保护点】
一种并行计算系统,用于对一源数据库进行统计,其特征在于,包括:一数据分割服务器,与该源数据库相连,用于将该源数据库中的海量数据按照关键字段进行分割;多个节点服务器,均与该数据分割服务器相连,且每个节点服务器又进一步包括:一节点数据库,与该数据分割服务器相连,用于存放分割后的数据;一解析单元,用于判断统计内容是否是被分割的关键字段;一计数统计单元,分别与该节点数据库及该解析单元相连,用于对关键字段进行非重复的计数运算;一分组统计单元,分别与该节点数据库及该解析单元相连,用于对非关键字段进行分组统计运算。

【技术特征摘要】

【专利技术属性】
技术研发人员:李晓华
申请(专利权)人:上海云数信息科技有限公司
类型:发明
国别省市:31[中国|上海]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1