分析:
归并排序的主要思想依然是分治。
1. 确定分界点为中间元素。
2. 递归排序左区间,待左区间递归完毕后,再递归排序右区间。(递归边界是区间长度为 $1$。这时令指针 $i,j$ 分别指向左右区间的第一个元素,进行判断不断向后扫描,直至一方扫描结束。检查左/右区间是否还有没被扫描完的,继续扫描。这一步和数据结构书上使用双指针将两个有序线性表的合并的本质是一样的。
这是理解归并的重要一步,许多书上给出的“模拟图”看起来是左右两边同时排序的。其实是按照先左后右的递归顺序进行的。
3. 归并,将左右区间合二为一,我们在第 $2$ 步都是将较小的元素插入的辅助数组,这是需要将刚刚进行比较的原序列替换为辅助数组里的序列。
在双指针的扫描过程中,第一个指针只会 扫描左半区间,第二个指针只会扫描右半区间,因此归并这一步的时间复杂度是 $O(n)$ 的。
时间复杂度:
归并排序的平均时间复杂度是 $O(nlogn)$。
我们上面的分析中指出其每层的“扫描数”为 $n$,又有 $logn$层,因此归并排序的平均时间复杂度是 $O(nlogn)$。
快排那里的处理可能不会恰好将区间分 为$n/2$,但期望是 $n/2$,因此也是 $O(nlogn)$。
代码(C++)
#include <iostream>
using namespace std;
const int N = 1e5 + 10;
int a[N], tmp[N];
void merge_sort(int a[], int l, int r)
{
// 递归到底,直到分为长度为1的区间
if (l >= r) return;
int mid = (l + r) / 2;
// 先递归处理左右区间
merge_sort(a, l, mid), merge_sort(a, mid + 1, r);
int k = 0, i = l, j = mid + 1;
// i j 分别指向左右区间的起始位置不断向右扫描
while (i <= mid && j <= r)
{
// 这里小于等于的关系保证了归并排序是稳定的
// 稳定的概念是存在多个具有相同的关键字的记录,若经过排序,这些记录的相对次序保持不变
if (a[i] <= a[j]) tmp[k ++] = a[i ++];
else tmp[k ++] = a[j ++];
}
// 左半区间还有剩余
while (i <= mid) tmp[k ++] = a[i ++];
// 右半区间还有剩余
while (j <= r) tmp[k ++] = a[j ++];
// 将正确顺序的序列覆盖掉原序列
for (i = l, k = 0; i <= r; i ++, k ++) a[i] = tmp[k];
}
int main()
{
int n;
cin >> n;
for (int i = 0; i < n; i ++) cin >> a[i];
merge_sort(a, 0, n - 1);
for (int i = 0; i < n; i ++) cout << a[i] << ' ';
}
代码 (Java)
import java.util.Scanner;
public class Main {
public static void main(String[] args) {
Scanner scanner = new Scanner(System.in);
int n = scanner.nextInt();
int[] a = new int[n];
for (int i = 0; i < a.length; i ++) {
a[i] = scanner.nextInt();
}
merge_sort(a, 0, n - 1);
for (int i = 0; i < a.length; i ++) {
System.out.printf("%d ", a[i]);
}
}
public static void merge_sort(int[] a, int l, int r) {
if (l >= r) return ;
int mid = (l + r) / 2;
merge_sort(a, l, mid);
merge_sort(a, mid + 1, r);
int i = l, j = mid + 1, k = 0;
int[] tmp = new int[r - l + 1];
while (i <= mid && j <= r) {
if (a[i] <= a[j]) tmp[k ++] = a[i ++];
else tmp[k ++] = a[j ++];
}
while (i <= mid) tmp[k ++] = a[i ++];
while (j <= r) tmp[k ++] = a[j ++];
for (i = l, k = 0; i <= r; i ++, k ++) a[i] = tmp[k];
}
}