基于概率分布的计算机排序技术制造技术

技术编号：2869251 阅读：225 留言：0更新日期：2012-04-11 18:40

本发明专利技术涉及计算机技术中的排序问题。以待排数据量Ｎ定义问题规模，目前公知内排序算法平均时间复杂度都不低于Ｏ（Ｎ.ｌｏｇＮ）。大多数情况下待排数据可认为是“独立同分布”的，但公知排序技术都没有考虑这一统计特性。本文提出的排序技术，通过概率手段对待排数据目标位置进行估计，有效减少数据的比较与交换操作，提高排序效率。本发明专利技术给出具体的内、外排序方法，内排序方法平均时间复杂度为Ｏ（Ｎ）。（*该技术在2023年保护过期，可自由使用*）

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及计算机技术中一类非常基础和重要的问题排序。
技术介绍
排序是计算机领域中一类非常基础和重要的问题，在计算机技术中经常遇到，并且在很多数据处理过程中占用了大量的计算时间。同时排序也具有相当的理论价值。快速、高效的计算机排序技术一直是人们所感兴趣的问题。排序问题的数学描述给定N个无序的数据XN＝(x0，x1，...，xN-1)，找到XN的一个全排列YN＝(y0，y1，...，yN-1)，使得对于任何k＝1，2，...，N-1都有yk-1y成立。若YN中的ym与XN中的某个xn相对应，则称m是xn的目标位置(或者也称ym是xn的目标位置)。说明“”是定义于待排数据集上的一种次序关系。如上文“yk-1yk”表示yk-1应位于yk之前(或我们并不介意二者的相对位置关系，这时ykyk-1也成立，记作yk-1≡yk)。说明在实际应用中XN和YN可根据需要使用相同或者不同的存储空间。前者称为“原地置换排序(In-place Sort)”。如XN的存储空间不被破坏则称为“稳定排序(Stable Sort)”。说明后文也用方括号“，表达与xn相同的含义。根据应用环境不同，排序技术可以分成两类内排序和外排序。内排序指待排数据量较少，所有的数据都可以(存放于计算机内存中)供随机访问的情形。但是，如果待排数据量超过了内存容量，则一次只能从外存设备(如磁带、磁盘等)读入部分数据在内存中排序，并且需要通过多次内排序操作才能实现排序目的。这种情形称为外排序。针对不同情况，目前已经发展出各种各样的排序技术。常用内排序技术有选择排序、冒泡排序、Shell(希尔)排序...

【技术保护点】
在对批量数据进行排序的过程中，利用待排数据集的概率统计特性对待排数据的目标位置进行预测，并据此将排序问题分解。

【技术特征摘要】
【国外来华专利技术】

【专利技术属性】
技术研发人员：杨磊，黄辉，
申请(专利权)人：杨磊，
类型：发明
国别省市：11[中国|北京]

全部详细技术资料下载我是这个专利的主人