线性时间选择

题目】:给定线性序集中n个元素和一个整数k,1≤k≤n,要求找出这n个元素中第k小的元素,(这里给定的线性集是无序的)

思路】:如果能在线性时间内找到一个划分基准,使得按这个基准所划分出的2个子数组的长度都至少为原数组长度的ε倍(0<ε<1是某个正常数),那么就可以在最坏情况下用O(n)时间完成选择任务。
例如:若ε=9/10,算法递归调用所产生的子数组的长度至少缩短1/10。所以,在最坏情况下,算法所需的计算时间T(n)满足递归式T(n)≤T(9n/10)+O(n) 。由此可得T(n)=O(n)。

具体解题】:这里我们将所有的数(n个),以每5个划分为一组,共[n/5]组(将不足五个的那组忽略);然后用任意一种排序算法(因为只对五个数进行排序,所以任取一种排序法就可以了,这里我选用冒泡排序),将每组中的元素排好序再分别取每组的中位数,得到[n/5]个中位数;再取这[n/5]个中位数的中位数(如果n/5是偶数,就找它的2个中位数中较大的一个)作为划分基准,将全部的数划分为两个部分,小于基准的在左边,大于等于基准的放右边。
    在这种情况下,找出的基准x至少比3(n-5)/10个元素大,因为在每一组中有2个元素小于本组的中位数,中位数处于1/2*[n/5-1],即n/5个中位数中又有(n-5)/10个小于基准x。同理,基准x也至少比3(n-5)/10个元素小。而当n≥75时,3(n-5)/10≥n/4所以按此基准划分所得的2个子数组的长度都至少缩短1/4。
程序代码如下:

#include<iostream.h>

#include<stdlib.h>

#include<time.h>

#define MAX_VALUE 10000

#define random() rand()%MAX_VALUE

#define N 10000

int a[N];

class Find

{

public:

       void bubble(int first,int end) //冒泡排序

       {    

for(int flag=first;flag<end;flag++)

                     for(int i=end;i>flag;i--)

                            if(a[i]<a[i-1])

                            {     int t=a[i];

                                   a[i]=a[i-1];

                                   a[i-1]=t;

                            }

       }

       int partition(int p,int r,int x) //数组a中从a[p]a[r]的元素按照x划分,大于x的在左边,小于x的在右边

       { 

 int i,j;

              for(i=p,j=r;i<j;i++)

              {    

if(a[i]>x)

                     {    

while(i<j&&a[j]>x)

                                   j--;

                            if(i!=j){

                                   int t=a[i];

                                   a[i]=a[j];

                                   a[j]=t;

                                   j--;

                            }

                     }

              }

              return i-1;

       }

       int select(int p,int r,int k)   //寻找中位数

       {

              if(r-p<5){

                     bubble(p,r);

                     return a[p+k-1];

              }

              for(int i=0;i<(r-p-4)/5;i++)

              {

                     int s=p+5*i,t=s+4;

                     bubble(s,t);

                     int temp=a[p+i];

                     a[p+i]=a[s+2];

                     a[s+2]=temp;

              }

              int x=select(p,p+(r-p-4)/5,(r-p+6)/10);

              i=partition(p,r,x);

              int j=i-p+1;

              if(k<=j)

                     return select(p,i,k);

              else

                     return select(i+1,r,k-j);

       }

};

void main()

{

       clock_t   start,end;  

       double   elapsed;

       srand((int)time(NULL));

       for(int k=0;k<N;k++)

       {

              a[k]=random();

              cout<<a[k]<<"\t";

       }

       cout<<endl;

       start=clock();

       Find f;    

       int n=5000;

       cout<<"The No."<<n<<" is :"<<f.select(0,N-1,n)<<endl;

       end=clock();

       elapsed=((double)(end-start));///CLOCKS_PER_SEC;

       cout<<"Time: "<<elapsed<<endl;

}

这个题目关键在寻找划分基准,从而提高寻找效率,时间复杂度为o(n);