归并排序

归并排序(Merge Sort)是利用"归并"技术来进行排序。归并是指将若干个已排序的子文件合并成一个有序的文件。

两路归并算法

算法基本思路

设两个有序的子文件(相当于输入堆)放在同一向量中相邻的位置上:R[low..m],R[m+1..high],先将它们合并到一个局部的暂存向量 R1(相当于输出堆)中,待合并完成后将 R1 复制回 R[low..high]中。

(1)合并过程

合并过程中,设置 i,j 和 p 三个指针,其初值分别指向这三个记录区的起始位置。合并时依次比较 R[i]和 R[j]的关键字,取关键字较小的记录复制到 R1[p]中,然后将被复制记录的指针 i 或 j 加 1,以及指向复制位置的指针 p 加 1。 重复这一过程直至两个输入的子文件有一个已全部复制完毕(不妨称其为空),此时将另一非空的子文件中剩余记录依次复制到 R1 中即可。

(2)动态申请 R1

实现时,R1 是动态申请的,因为申请的空间可能很大,故须加入申请空间是否成功的处理。

归并算法

void Merge(SeqList R,int low,int m,int high)  
  {//将两个有序的子文件R[low..m)和R[m+1..high]归并成一个有序的  
   //子文件R[low..high]  
   int i=low,j=m+1,p=0; //置初始值  
   RecType *R1; //R1是局部向量,若p定义为此类型指针速度更快  
   R1=(ReeType *)malloc((high-low+1)*sizeof(RecType));  
   if(! R1) //申请空间失败  
     Error("Insufficient memory available!");  
   while(i<=m&&j<=high) //两子文件非空时取其小者输出到R1[p]上  
     R1[p++]=(R[i].key<=R[j].key)?R[i++]:R[j++];  
   while(i<=m) //若第1个子文件非空,则复制剩余记录到R1中  
     R1[p++]=R[i++];  
   while(j<=high) //若第2个子文件非空,则复制剩余记录到R1中  
     R1[p++]=R[j++];  
   for(p=0,i=low;i<=high;p++,i++)  
     R[i]=R1[p];//归并完成后将结果复制回R[low..high]  } //Merge  

归并排序

归并排序有两种实现方法:自底向上和自顶向下。

自底向上的方法

(1)自底向上的基本思想

自底向上的基本思想是:第 1 趟归并排序时,将待排序的文件 R[1..n]看作是 n 个长度为 1 的有序子文件,将这些子文件两两归并,若 n 为偶数,则得到个长度为 2 的有序子文件;若 n 为奇数,则最后一个子文件轮空(不参与归并)。故本趟归并完成后,前个有序子文件长度为 2,但最后一个子文件长度仍为 1;第 2 趟归并则是将第 1 趟归并所得到的个有序的子文件两两归并,如此反复,直到最后得到一个长度为 n 的有序文件为止。

上述的每次归并操作,均是将两个有序的子文件合并成一个有序的子文件,故称其为"二路归并排序"。类似地有k(k>2)路归并排序。

(2) 二路归并排序的全过程

(3) 一趟归并算法 分析: 在某趟归并中,设各子文件长度为length(最后一个子文件的长度可能小于length),则归并前R[1..n]中共有个有序的子文件:R

[1..length],R[length+1..2length],…, 。

注意: 调用归并操作将相邻的一对子文件进行归并时,必须对子文件的个数可能是奇数、以及最后一个子文件的长度小于 length 这两种特殊情况进行特殊处理:

  • 若子文件个数为奇数,则最后一个子文件无须和其它子文件归并(即本趟轮空);
  • 若子文件个数为偶数,则要注意最后一对子文件中后一子文件的区间上界是 n。

具体算法如下:

void MergePass(SeqList R,int length)  
     { //对R[1..n]做一趟归并排序  
      int i;  
      for(i=1;i+2*length-1<=n;i=i+2*length)  
      Merge(R,i,i+length-1,i+2*length-1);  
           //归并长度为length的两个相邻子文件  
      if(i+length-1<n) //尚有两个子文件,其中后一个长度小于length  
         Merge(R,i,i+length-1,n); //归并最后两个子文件  
      //注意:若i≤n且i+length-1≥n时,则剩余一个子文件轮空,无须归并  
     } //MergePass  
(4)二路归并排序算法
void MergeSort(SeqList R)  
 {//采用自底向上的方法,对R[1..n]进行二路归并排序  
   int length;  
   for(1ength=1;length<n;length*=2) //做 趟归并  

      MergePass(R,length); //有序段长度≥n时终止  
 }  

注意:自底向上的归并排序算法虽然效率较高,但可读性较差。

自顶向下的方法

采用分治法进行自顶向下的算法设计,形式更为简洁。

(1)分治法的三个步骤

设归并排序的当前区间是R[low..high],分治法的三个步骤是:

  • 分解:将当前区间一分为二,即求分裂点 
  • 求解:递归地对两个子区间 R[low..mid]和 R[mid+1..high]进行归并排序;
  • 组合:将已排序的两个子区间 R[low..mid]和 R[mid+1..high]归并为一个有序的区间 R[low..high]。

递归的终结条件:子区间长度为 1(一个记录自然有序)。

(2)具体算法

void MergeSortDC(SeqList R,int low,int high)  
 {//用分治法对R[low..high]进行二路归并排序  
   int mid;  
   if(low<high){//区间长度大于1  
      mid=(low+high)/2; //分解  
      MergeSortDC(R,low,mid); //递归地对R[low..mid]排序  
      MergeSortDC(R,mid+1,high); //递归地对R[mid+1..high]排序  
      Merge(R,low,mid,high); //组合,将两个有序区归并为一个有序区  
    }  
 }//MergeSortDC  

(3)算法 MergeSortDC 的执行过程

算法 MergeSortDC 的执行过程如下图所示的递归树。

算法分析

1、稳定性

归并排序是一种稳定的排序。

2、存储结构要求

可用顺序存储结构。也易于在链表上实现。

3、时间复杂度

对长度为 n 的文件,需进行 趟二路归并,每趟归并的时间为 O(n),故其时间复杂度无论是在最好情况下还是在最坏情况下均是 O(nlgn)。

4、空间复杂度

需要一个辅助向量来暂存两有序子文件归并的结果,故其辅助空间复杂度为 O(n),显然它不是就地排序。

注意: 若用单链表做存储结构,很容易给出就地的归并排序。

联系我们

邮箱 626512443@qq.com
电话 18611320371(微信)
QQ群 235681453

Copyright © 2015-2024

备案号:京ICP备15003423号-3