排序在我們的的工程應用中無處不見,也有著非常重要的作用,比如你隨意點開一個搜索引擎,搜索的結構就是經過排序而來。各種電商網站的秒殺活動,用戶點擊秒殺后,服務器會根據用戶的請求時間進行排序。在我們的用的文檔表格中,也存在各種排序。
所以排序真的是無處不見,所以在我們面試中出現排序也不足為奇了。今天就為大家帶來面試中經常出現的一種排序算法,合并排序進行深度解析。
合并排序本質上與二叉樹的后序遍歷非常類似的。
首先你還先回憶一下二叉樹的后續遍歷,后序遍歷有個三個重要的特點:
// 遞歸function postOrder(root, array = []) { if (root === null) return null; postOrder(root.left, array); postOrder(root.right, array); array.push(root.val)}
對于合并排序來說,其實也是非常類似:
簡單利用偽代碼表示就是:
function 后序遍歷/合并排序: sub = 子結構(子樹/子數組) full = 整合(sub)
不管是后續遍歷,還是合并排序的三個特點,這里可以總結為三個關鍵點:
對于二叉樹而言,子樹的劃分是天然的,已經在數據結構里面約定好了,比如 Node.left、Node.right。
root.leftroot.right 可以直接通過樹的子節點拿
但是對于數組而言,在切分的時候,如果想到達最優的效率,那么將數組切為平均的兩半效率應該是最高的。
const mid = begin + ((end - begin)>>1)數組a = [begin, mid) => 表示左子數組數組a = [mid, end) => 表示右子數組
對于二叉樹來說,獲取子結構的信息就是或者左右子節點的信息。
postOrder(root.left)postOrder(root.right)
對于合并排序來說,那么就分別需要對左子數組和右子數組進行排序。對子數組的排序,只需要遞歸就可以了。
merge(a, begin, mid)merge(a, mid, end)
接下來,我們需要將從子結構里面拿到的信息進行加工。不同的需求會導致加工的方式也不太一樣。
對于二叉樹來說,非常簡單,就是將節點值添加到結果中。
array.push(root.val)
對于合并排序而言,我們需要將兩個有序的子數組,合并成一個大的有序的數組。
let i = begin;let j = mid;let to = begin;// 將兩個數組合并,判斷條件是,只有左右子數組中還有元素while(i < mid || j < end) { // 讀取左數組的元素: // - 左數組還存在元素并且左數組的開頭元素小于右數組的開頭元素 // - 右數組沒有元素 if ((i < mid && a[i] < a[j]) || j >=end) { // t 為臨時數組 t[to++] = a[i++]; } else { // 讀取右數組的元素 t[to++] = a[j++]; }}
最后,不管是二叉樹還是合并排序都要考慮一下邊界:
二叉樹的邊界就是節點不能為空。
if (root === null) return null;
合并排序的邊界就是:
if (b > e || b + 1 >= e) { return }
對于二叉樹來說,代碼相對比較簡單。
function postOrder(root, array = []) { // 邊界處理 if (root === null) return null; // 第一步:劃分子結構,二叉樹在結構上已經劃分了子結構 root.left、root.right 可以直接通過樹的子節點拿 // 第二步:獲取子結構信息(遞歸的方式) postOrder(root.left, array); postOrder(root.right, array); // 第三步:整合子結構信息 array.push(root.val)}
對于二叉樹來說,如何切分左右子數組?如何進行合并,合并時注意循環的條件,以及穩定排序的寫法?都是在寫算法時需要注意的。
function merge(a, t, b, e) { // 邊界處理 if (b > e || b + 1 >= e) { return } /*********************核心代碼****************************/ // 第一步:劃分子結構 const mid = b + ((e-b)>>1); // 第二步:獲取子結構信息(遞歸的方式) merge(a, t, b, mid); // 左邊子結構 merge(a, t, mid, e); // 右邊子結構 // 第三步:整合子結構信息 let i = b; let j = mid; let to = b; // 注意:下面是一個很重要的模板???????????? // 將兩個數組合并,判斷條件是,只有左右子數組中還有元素 while(i < mid || j < e) { // 讀取左數組的元素: // - 左數組還存在元素并且左數組的開頭元素小于右數組的開頭元素 // - 右數組沒有元素 if ((i < mid && a[i] < a[j]) || j >=e) { t[to++] = a[i++]; } else { // 讀取右數組的元素 t[to++] = a[j++]; } } /*********************核心代碼****************************/ // 將合并的結果拷貝到源數組中 for (let i = b; i < e; i++) { a[i] = t[i]; }}function mergeSort(nums) { if (nums === null || nums.length === 0) { return; } merge(nums, [], 0, nums.length) return nums;}
接著我們利用剛才將的例子來看幾個例子。
給你鏈表的頭結點 head ,請將其按 升序 排列并返回 排序后的鏈表 。
這道題目就可以套用我們上面提到的模板。
第一步:劃分子結構,對于鏈表來說劃分子結構,也就是找到鏈表的中間節點。鏈表找中間節點也就是利用我上一篇文章中講到的“快慢指針”。
let fast = head, slaw = head;// 第一步:劃分子結構,快慢指針,一個節點走一步,另外一個節點走兩步,一快一慢// 這里 tail 相當于上面數組中的 end,對于鏈表來說,end 也就是 nullwhile(fast !== tail) { slaw = slaw.next; fast = fast.next; if (fast && fast !== tail) { fast = fast.next; }}const mid = slaw;
第二步:獲取子結構信息(遞歸的方式)。
// 第二步:獲取子結構信息const list1 = sort(head, mid);const list2 = sort(mid, tail)
第三步:整合信息,有了兩個子結構信息,也就需要將兩個子結構信息合成一個,對于鏈表來說就是合并兩個有序鏈表。這里合并的過程中,還可以用到到我上一篇文章說到的“鏈表第一板斧,假頭”。
// 第三步:整合,合并兩個有序鏈表var merge = function(head1, head2) { const dummy = new ListNode(); let tail = dummy; let list1 = head1; let list2 = head2; while(list1 && list2) { if (list1.val < list2.val) { tail.next = list1; tail = list1; list1 = list1.next; } else { tail.next = list2; tail = list2; list2 = list2.next; } } if (list1) { tail.next = list1; } if (list2) { tail.next = list2; } return dummy.next;}
最后少不了臨界條件的判斷。
if (head === null) { return head; } if (head.next === tail) { head.next = null; return head; }
完整的代碼如下:
var merge = function(head1, head2) { const dummy = new ListNode(); let tail = dummy; let list1 = head1; let list2 = head2; while(list1 && list2) { if (list1.val < list2.val) { tail.next = list1; tail = list1; list1 = list1.next; } else { tail.next = list2; tail = list2; list2 = list2.next; } } if (list1) { tail.next = list1; } if (list2) { tail.next = list2; } return dummy.next;}function sort(head, tail) { if (head === null) { return head; } if (head.next === tail) { head.next = null; return head; } let fast = head, slaw = head; // 第一步:劃分子結構,快慢指針,一個節點走一步,另外一個節點走兩步,一快一慢 // 這里 tail 相當于上面數組中的 end,對于鏈表來說,end 也就是 null while(fast !== tail) { slaw = slaw.next; fast = fast.next; if (fast && fast !== tail) { fast = fast.next; } } const mid = slaw; // 第二步:獲取子結構信息 const list1 = sort(head, mid); const list2 = sort(mid, tail) // 第三步:整合,合并兩個有序鏈表 return merge(list1, list2);}var sortList = function(head) { if (head === null || head.next === null) { return head; } return sort(head, null)};
給定兩個大小分別為 m 和 n 的正序(從小到大)數組 nums1 和 nums2。請你找出并返回這兩個正序數組的 中位數 。
算法的時間復雜度應該為 O(log (m+n)) 。
這是一道來自百度的面試題。解法有很多,我們重點介紹基于合并模板的解法。
如果單純的不考慮復雜度,通過合并排序,我們已經能夠將兩個有序的數組合并成一個有序的數組了,再取這個有序數組的中位數。
var findMedianSortedArrays = function(nums1, nums2) { function merge(a, t, b, e) { // 邊界處理 if (b > e || b + 1 >= e) { return } /*********************核心代碼****************************/ // 第一步:劃分子結構 const mid = b + ((e-b)>>1); // 第二步:獲取子結構信息(遞歸的方式) merge(a, t, b, mid); // 左邊子結構 merge(a, t, mid, e); // 右邊子結構 // 第三步:整合子結構信息 let i = b; let j = mid; let to = b; // 注意:下面是一個很重要的模板???????????? // 將兩個數組合并,判斷條件是,只有左右子數組中還有元素 while(i < mid || j < e) { // 讀取左數組的元素: // - 左數組還存在元素并且左數組的開頭元素小于右數組的開頭元素 // - 右數組沒有元素 if ((i < mid && a[i] < a[j]) || j >=e) { t[to++] = a[i++]; } else { // 讀取右數組的元素 t[to++] = a[j++]; } } /*********************核心代碼****************************/ // 將合并的結果拷貝到源數組中 for (let i = b; i < e; i++) { a[i] = t[i]; } } const nums = [].concat(nums1, nums2); merge(nums, [], 0, nums.length); const mid = nums.length>>1; if (nums.length % 2 === 0) { return (nums[mid-1] + nums[mid]) / 2; } return nums[mid];};
但是這樣操作的話,時間復雜度就變成 O(N),并且空間復雜度也是 O(N)。
如果在面試現場,面試官一定會問你,有沒有更好的辦法?所以我們應該有效地利用兩個數組的有序性解決這道題。下面我會從簡單的情況開始分析。
假設我們有一個一維有序數組,如果我們要拿第 9 小的數。(注:第 1 小就是最小的數。)只需要將前面 8 個數扔掉,然后排在前面的數就是第 9 小的數。
但是現在我們有多個有序數據,怎么辦了?但是非常確認的是,我們如果想拿到第 9 小的數,一定需要丟 8 個數。
那么接下來,思考一下在兩個數組 A,B 中如何扔掉這 8 個數?
圖片
圖片
所以總結一下,當我們需要丟棄 K 個元素的時候。k 是偶數的時候,我們只需要比較 A[k/2-1] 和 B[k/2-1] 的大小,誰小就扔掉對應的 [0...k/2-1] 這一段;k 是奇數的時候,我們只需要比較 A[k/2] 和 B[k/2] 的大小,誰小就扔掉對應的 [0...k/2] 這一段。不過由于整數在程序中的整除特性,我們可以將奇數和偶數的情況統一起來。需要扔掉 k 個數的時候,p = (k-1)/ 2,你只需要比較 A[p] 和 B[p] 的大小即可。如果 A[p] >= B[p],那么就可以把 B[0....p] 這段都扔掉。
var findMedianSortedArrays = function(A, B) { let len = A.length + B.length; let alen = A.length, blen = B.length; let i = 0, j = 0; // 如果兩個數組的總長度為0 //那么不用再找了,肯定是沒有中位數的,這里直接返回一個0 if (len == 0) { return 0; } // 總長度為偶數的情況: // 如果有4個數,那么當扔掉1個數之后 // 接下來需要合并的兩個數排[2,3]就是中位數 // 總長度為奇數的情況: // 比如如果有5個數,那么當合并掉2個數之后 // 接下來的那個排[3]位的就是中位數。 // 所以這里k表示:要扔掉的數的個數 // 第一步:劃分子結構 let k = (len - 1) >> 1; // 第二步:找到子結構信息 while (k > 0) { // 我們需要比較A[p]與B[p] // 只不過當數組的起始位置是i和j的時候。 // 比較的元素就變成 A[i+p], B[j+p] let p = (k - 1) >> 1; // 這時直接比較A[i + p]和B[j+p]來決定誰可以被扔掉掉 // 注意這里扔掉的時候,只需要前移p + 1即可。 if (j + p >= blen || (i + p < alen && A[i + p] < B[j + p])) { i += p + 1; } else { j += p + 1; } k -= p + 1; } // 第三步:整合信息 // 把排在前面的數取出來 let front = (j >= blen || (i < alen && A[i] < B[j])) ? A[i++] : B[j++]; // 如果總長度為奇數,那么這個時候,front就是我們要找的中位數 if ((len & 1) == 1) { return front; } // 此時總的數目為偶數,那么需要再取一個數,求平均值。 let back = (j >= blen || (i < alen && A[i] < B[j])) ? A[i] : B[j]; return (front + back) / 2.0;};
一共要合并的長度可以認為是 N/2,然后每次取一半進行合并。因此,合并次數為 O(lgN),空間復雜度為 O(1)。
通過合并排序,可以將兩個有序的數組合并成一個有序的數組了。合并是一個非常經典的模板代碼,你一定要理解并且背下來,很多地方都會用。比如合并有序鏈表,合并數組。一個小小的合并模板可就以解決這么多問題,多積累模版可以幫助我們在面試中快速答題。
本文鏈接:http://www.tebozhan.com/showinfo-26-12359-0.html有了這個代碼模板,合并排序手到擒來
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com