C++怎么實(shí)現(xiàn)兩個(gè)有序數(shù)組的中位數(shù)-創(chuàng)新互聯(lián)

這篇文章主要講解了“C++怎么實(shí)現(xiàn)兩個(gè)有序數(shù)組的中位數(shù)”,文中的講解內(nèi)容簡單清晰,易于學(xué)習(xí)與理解,下面請大家跟著小編的思路慢慢深入,一起來研究和學(xué)習(xí)“C++怎么實(shí)現(xiàn)兩個(gè)有序數(shù)組的中位數(shù)”吧!

建網(wǎng)站原本是網(wǎng)站策劃師、網(wǎng)絡(luò)程序員、網(wǎng)頁設(shè)計(jì)師等,應(yīng)用各種網(wǎng)絡(luò)程序開發(fā)技術(shù)和網(wǎng)頁設(shè)計(jì)技術(shù)配合操作的協(xié)同工作。創(chuàng)新互聯(lián)專業(yè)提供成都網(wǎng)站建設(shè)、網(wǎng)站制作,網(wǎng)頁設(shè)計(jì),網(wǎng)站制作(企業(yè)站、響應(yīng)式網(wǎng)站開發(fā)、電商門戶網(wǎng)站)等服務(wù),從網(wǎng)站深度策劃、搜索引擎友好度優(yōu)化到用戶體驗(yàn)的提升,我們力求做到極致!

兩個(gè)有序數(shù)組的中位數(shù)

Example 1:

nums1 = [1, 3]
nums2 = [2]

The median is 2.0

Example 2:

nums1 = [1, 2]
nums2 = [3, 4]

The median is (2 + 3)/2 = 2.5

這道題讓我們求兩個(gè)有序數(shù)組的中位數(shù),而且限制了時(shí)間復(fù)雜度為 O(log (m+n)),看到這個(gè)時(shí)間復(fù)雜度,自然而然的想到了應(yīng)該使用二分查找法來求解。但是這道題被定義為 Hard 也是有其原因的,難就難在要在兩個(gè)未合并的有序數(shù)組之間使用二分法,如果這道題只有一個(gè)有序數(shù)組,讓求中位數(shù)的話,估計(jì)就是個(gè) Easy 題。對于這道題來說,可以將兩個(gè)有序數(shù)組混合起來成為一個(gè)有序數(shù)組再做嗎,圖樣圖森破,這個(gè)時(shí)間復(fù)雜度限制的就是告訴你金坷垃別想啦。還是要用二分法,而且是在兩個(gè)數(shù)組之間使用,感覺很高端啊?;仡櫼幌轮形粩?shù)的定義,如果某個(gè)有序數(shù)組長度是奇數(shù),那么其中位數(shù)就是最中間那個(gè),如果是偶數(shù),那么就是最中間兩個(gè)數(shù)字的平均值。這里對于兩個(gè)有序數(shù)組也是一樣的,假設(shè)兩個(gè)有序數(shù)組的長度分別為m和n,由于兩個(gè)數(shù)組長度之和 m+n 的奇偶不確定,因此需要分情況來討論,對于奇數(shù)的情況,直接找到最中間的數(shù)即可,偶數(shù)的話需要求最中間兩個(gè)數(shù)的平均值。為了簡化代碼,不分情況討論,使用一個(gè)小 trick,分別找第 (m+n+1) / 2 個(gè),和 (m+n+2) / 2 個(gè),然后求其平均值即可,這對奇偶數(shù)均適用。若 m+n 為奇數(shù)的話,那么其實(shí) (m+n+1) / 2 和 (m+n+2) / 2 的值相等,相當(dāng)于兩個(gè)相同的數(shù)字相加再除以2,還是其本身。

好,這里需要定義一個(gè)函數(shù)來在兩個(gè)有序數(shù)組中找到第K個(gè)元素,下面重點(diǎn)來看如何實(shí)現(xiàn)找到第K個(gè)元素。首先,為了避免拷貝產(chǎn)生新的數(shù)組從而增加時(shí)間復(fù)雜度,使用兩個(gè)變量i和j分別來標(biāo)記數(shù)組 nums1 和 nums2 的起始位置。然后來處理一些 corner cases,比如當(dāng)某一個(gè)數(shù)組的起始位置大于等于其數(shù)組長度時(shí),說明其所有數(shù)字均已經(jīng)被淘汰了,相當(dāng)于一個(gè)空數(shù)組了,那么實(shí)際上就變成了在另一個(gè)數(shù)組中找數(shù)字,直接就可以找出來了。還有就是如果 K=1 的話,只要比較 nums1 和 nums2 的起始位置i和j上的數(shù)字就可以了。難點(diǎn)就在于一般的情況怎么處理?因?yàn)樾枰趦蓚€(gè)有序數(shù)組中找到第K個(gè)元素,為了加快搜索的速度,可以使用二分法,那么對誰二分呢,數(shù)組么?其實(shí)要對K二分,意思是需要分別在 nums1 和 nums2 中查找第 K/2 個(gè)元素,注意這里由于兩個(gè)數(shù)組的長度不定,所以有可能某個(gè)數(shù)組沒有第 K/2 個(gè)數(shù)字,所以需要先 check 一下,數(shù)組中到底存不存在第 K/2 個(gè)數(shù)字,如果存在就取出來,否則就賦值上一個(gè)整型較大值(目的是要在 nums1 或者 nums2 中先淘汰 K/2 個(gè)較小的數(shù)字,判斷的依據(jù)就是看 midVal1 和 midVal2 誰更小,但如果某個(gè)數(shù)組的個(gè)數(shù)都不到 K/2 個(gè),自然無法淘汰,所以將其對應(yīng)的 midVal 值設(shè)為整型較大值,以保證其不會(huì)被淘汰),若某個(gè)數(shù)組沒有第 K/2 個(gè)數(shù)字,則淘汰另一個(gè)數(shù)組的前 K/2 個(gè)數(shù)字即可。舉個(gè)例子來說吧,比如 nums1 = {3},nums2 = {2, 4, 5, 6, 7},K=4,要找兩個(gè)數(shù)組混合中第4個(gè)數(shù)字,則分別在 nums1 和 nums2 中找第2個(gè)數(shù)字,而 nums1 中只有一個(gè)數(shù)字,不存在第二個(gè)數(shù)字,則 nums2 中的前2個(gè)數(shù)字可以直接跳過,為啥呢,因?yàn)橐蟮氖钦麄€(gè)混合數(shù)組的第4個(gè)數(shù)字,不管 nums1 中的那個(gè)數(shù)字是大是小,第4個(gè)數(shù)字絕不會(huì)出現(xiàn)在 nums2 的前兩個(gè)數(shù)字中,所以可以直接跳過。

有沒有可能兩個(gè)數(shù)組都不存在第 K/2 個(gè)數(shù)字呢,這道題里是不可能的,因?yàn)镵不是任意給的,而是給的 m+n 的中間值,所以必定至少會(huì)有一個(gè)數(shù)組是存在第 K/2 個(gè)數(shù)字的。最后就是二分法的核心啦,比較這兩個(gè)數(shù)組的第 K/2 小的數(shù)字 midVal1 和 midVal2 的大小,如果第一個(gè)數(shù)組的第 K/2 個(gè)數(shù)字小的話,那么說明要找的數(shù)字肯定不在 nums1 中的前 K/2 個(gè)數(shù)字,可以將其淘汰,將 nums1 的起始位置向后移動(dòng) K/2 個(gè),并且此時(shí)的K也自減去 K/2,調(diào)用遞歸,舉個(gè)例子來說吧,比如 nums1 = {1, 3},nums2 = {2, 4, 5},K=4,要找兩個(gè)數(shù)組混合中第4個(gè)數(shù)字,那么分別在 nums1 和 nums2 中找第2個(gè)數(shù)字,nums1 中的第2個(gè)數(shù)字是3,nums2 中的第2個(gè)數(shù)字是4,由于3小于4,所以混合數(shù)組中第4個(gè)數(shù)字肯定在 nums2 中,可以將 nums1 的起始位置向后移動(dòng) K/2 個(gè)。反之,淘汰 nums2 中的前 K/2 個(gè)數(shù)字,并將 nums2 的起始位置向后移動(dòng) K/2 個(gè),并且此時(shí)的K也自減去 K/2,調(diào)用遞歸即可,參見代碼如下:

C++ 解法一:

class Solution {
public:
    double findMedianSortedArrays(vector<int>& nums1, vector<int>& nums2) {
        int m = nums1.size(), n = nums2.size(), left = (m + n + 1) / 2, right = (m + n + 2) / 2;
        return (findKth(nums1, 0, nums2, 0, left) + findKth(nums1, 0, nums2, 0, right)) / 2.0;
    }
    int findKth(vector<int>& nums1, int i, vector<int>& nums2, int j, int k) {
        if (i >= nums1.size()) return nums2[j + k - 1];
        if (j >= nums2.size()) return nums1[i + k - 1];
        if (k == 1) return min(nums1[i], nums2[j]);
        int midVal1 = (i + k / 2 - 1 < nums1.size()) ? nums1[i + k / 2 - 1] : INT_MAX;
        int midVal2 = (j + k / 2 - 1 < nums2.size()) ? nums2[j + k / 2 - 1] : INT_MAX;
        if (midVal1 < midVal2) {
            return findKth(nums1, i + k / 2, nums2, j, k - k / 2);
        } else {
            return findKth(nums1, i, nums2, j + k / 2, k - k / 2);
        }
    }
};

Java 解法一:

public class Solution {
    public double findMedianSortedArrays(int[] nums1, int[] nums2) {
        int m = nums1.length, n = nums2.length, left = (m + n + 1) / 2, right = (m + n + 2) / 2;
        return (findKth(nums1, 0, nums2, 0, left) + findKth(nums1, 0, nums2, 0, right)) / 2.0;
    }
    int findKth(int[] nums1, int i, int[] nums2, int j, int k) {
        if (i >= nums1.length) return nums2[j + k - 1];
        if (j >= nums2.length) return nums1[i + k - 1];
        if (k == 1) return Math.min(nums1[i], nums2[j]);
        int midVal1 = (i + k / 2 - 1 < nums1.length) ? nums1[i + k / 2 - 1] : Integer.MAX_VALUE;
        int midVal2 = (j + k / 2 - 1 < nums2.length) ? nums2[j + k / 2 - 1] : Integer.MAX_VALUE;
        if (midVal1 < midVal2) {
            return findKth(nums1, i + k / 2, nums2, j, k - k / 2);
        } else {
            return findKth(nums1, i, nums2, j + k / 2, k - k / 2);
        }
    }
}

上面的解法一直使用的是原數(shù)組,同時(shí)用了兩個(gè)變量來分別標(biāo)記當(dāng)前的起始位置。我們也可以直接生成新的數(shù)組,這樣就不要用起始位置變量了,不過拷貝數(shù)組的操作可能會(huì)增加時(shí)間復(fù)雜度,也許會(huì)超出限制,不過就算當(dāng)個(gè)思路拓展也是好的。首先要判斷數(shù)組是否為空,為空的話,直接在另一個(gè)數(shù)組找第K個(gè)即可。還有一種情況是當(dāng) K = 1 時(shí),表示要找第一個(gè)元素,只要比較兩個(gè)數(shù)組的第一個(gè)元素,返回較小的那個(gè)即可。這里分別取出兩個(gè)數(shù)組的第 K/2 個(gè)數(shù)字的位置坐標(biāo)i和j,為了避免數(shù)組沒有第 K/2 個(gè)數(shù)組的情況,每次都和數(shù)組長度做比較,取出較小值。這里跟上面的解法有些許不同,上面解法直接取出的是值,而這里取出的是位置坐標(biāo),但是思想都是很類似的。不同在于,上面解法中每次固定淘汰 K/2 個(gè)數(shù)字,而這里由于取出了合法的i和j,所以每次淘汰i或j個(gè)。評論區(qū)有網(wǎng)友提出,可以讓 j = k-i,這樣也是對的,可能還更好一些,收斂速度可能會(huì)更快一些,參見代碼如下:

C++ 解法二:

class Solution {
public:
    double findMedianSortedArrays(vector<int>& nums1, vector<int>& nums2) {
        int m = nums1.size(), n = nums2.size();
        return (findKth(nums1, nums2, (m + n + 1) / 2) + findKth(nums1, nums2, (m + n + 2) / 2)) / 2.0;
    }
    int findKth(vector<int> nums1, vector<int> nums2, int k) {
        if (nums1.empty()) return nums2[k - 1];
        if (nums2.empty()) return nums1[k - 1];
        if (k == 1) return min(nums1[0], nums2[0]);
        int i = min((int)nums1.size(), k / 2), j = min((int)nums2.size(), k / 2);
        if (nums1[i - 1] > nums2[j - 1]) {
            return findKth(nums1, vector<int>(nums2.begin() + j, nums2.end()), k - j);
        } else {
            return findKth(vector<int>(nums1.begin() + i, nums1.end()), nums2, k - i);
        }
        return 0;
    }
};

Java 解法二:

public class Solution {
    public double findMedianSortedArrays(int[] nums1, int[] nums2) {
        int m = nums1.length, n = nums2.length, left = (m + n + 1) / 2, right = (m + n + 2) / 2;
        return (findKth(nums1, nums2, left) + findKth(nums1, nums2, right)) / 2.0;
    }
    int findKth(int[] nums1, int[] nums2, int k) {
        int m = nums1.length, n = nums2.length;
        if (m == 0) return nums2[k - 1];
        if (n == 0) return nums1[k - 1];
        if (k == 1) return Math.min(nums1[0], nums2[0]);
        int i = Math.min(m, k / 2), j = Math.min(n, k / 2);
        if (nums1[i - 1] > nums2[j - 1]) {
            return findKth(nums1, Arrays.copyOfRange(nums2, j, n), k - j);
        } else {
            return findKth(Arrays.copyOfRange(nums1, i, m), nums2, k - i);
        }
    }
}

此題還能用迭代形式的二分搜索法來解,是一種相當(dāng)巧妙的應(yīng)用,這里就參照 stellari 大神的帖子 來講解吧。所謂的中位數(shù),換一種角度去看,其實(shí)就是把一個(gè)有序數(shù)組分為長度相等的兩段,中位數(shù)就是前半段的較大值和后半段的最小值的平均數(shù),也就是離分割點(diǎn)相鄰的兩個(gè)數(shù)字的平均值。比如說對于偶數(shù)個(gè)數(shù)組 [1 3 5 7],那么分割開來就是 [1 3 / 5 7],其中 '/' 表示分割點(diǎn),中位數(shù)就是3和5的平均值。對于奇數(shù)個(gè)數(shù)組 [1 3 4 5 7],可以分割為 [1 3 4 / 4 5 7],可以發(fā)現(xiàn)左右兩邊都有個(gè)4,則中位數(shù)是兩個(gè)4的平均數(shù),還是4。這里使用L表示分割點(diǎn)左邊的數(shù)字,R表示分割點(diǎn)右邊的數(shù)字,則對于 [1 3 5 7] 來說,L=3,R=5。對于 [1 3 4 5 7] 來說,L=4,R=4。那么對于長度為N的數(shù)組來說,可以分別得到L和R的位置,如下所示:

N        Index of L        Index of R

1            0                0

2            0                1

3            1                1

4            1                2

5            2                2

6            2                3

7            3                3

觀察上表,可以得到規(guī)律,Idx(L)= (N-1)/2,idx(R) = N/2,所以中位數(shù)可以用下式表示:

(L + R) / 2 = (A[(N - 1) / 2] + A[N / 2]) / 2

為了統(tǒng)一數(shù)組長度為奇數(shù)和偶數(shù)的情況,可以使用一個(gè)小 tricky,即在每個(gè)數(shù)字的兩邊都加上一個(gè)特殊字符,比如井號,這個(gè) tricky 其實(shí)在馬拉車算法中也使用過。這樣做的好處是不管奇數(shù)或者偶數(shù),加井號后數(shù)組的長度都是奇數(shù),并且切割點(diǎn)的位置也是確定的,比如:

[1 3 5 7]    ->    [# 1 # 3 # 5 # 7 #]        N = 4

index               0 1 2 3 4 5 6 7 8         newN = 9

[1 3 4 5 7]    ->    [# 1 # 3 # 4 # 5 # 7 #]        N = 5

index                 0 1 2 3 4 5 6 7 8 9 10        newN = 11

這里的N是原數(shù)組的長度,newN 是添加井號后新數(shù)組的長度,可以發(fā)現(xiàn) newN = 2N+1,而且切割點(diǎn)永遠(yuǎn)都在新數(shù)組中坐標(biāo)為N的位置,且 idx(L) = (N-1)/2,idx(R) = N/2,這里的N就可以換成分割點(diǎn)的位置,豈不美哉(注意這里的 idx(L) 和 idx(R) 表示的是在未填充#號的坐標(biāo)位置)!現(xiàn)在假設(shè)有兩個(gè)數(shù)組:

[1 3 4 5 7]    ->    [# 1 # 3 # 4 # 5 # 7 #]        N1 = 5

index                 0 1 2 3 4 5 6 7 8 9 10        newN1 = 11


[1 2 2 2]    ->    [# 1 # 2 # 2 # 2 #]        N2 = 4
index               0 1 2 3 4 5 6 7 8         newN2 = 9

跟只有一個(gè)數(shù)組的情況類似,這里需要找到一個(gè)切割點(diǎn),使得其分別可以將兩個(gè)數(shù)組分成左右兩部分,需要滿足的是兩個(gè)左半邊中的任意一個(gè)數(shù)字都要小于兩個(gè)右半邊數(shù)組的數(shù)字,注意這里可能有的左半邊或右半邊會(huì)為空,但是兩個(gè)左半邊數(shù)字的個(gè)數(shù)和應(yīng)該等于兩個(gè)右半邊的個(gè)數(shù)和。這里還可以觀察出一些規(guī)律:

1. 總共有 2N1 + 2N2 + 2 個(gè)位置,那么除去兩個(gè)分割點(diǎn),兩個(gè)左右半邊應(yīng)該各有 N1 + N2 個(gè)數(shù)字。

2. 因此,對于一個(gè)在 A2 數(shù)組中的分割點(diǎn)位置 C2 = K,在 A1 數(shù)組中的位置應(yīng)該為 C1 = N1 + N2 - K,比如假如在 A2 中的分割點(diǎn)位置為 C2 = 2,那么在 A1 中的位置為 C1 = 4 + 5 - C2 = 7。

[# 1 # 3 # 4 # (5/5) # 7 #]

[# 1 / 2 # 2 # 2 #]

3. 假如兩個(gè)數(shù)組都被分割了,那么就應(yīng)該會(huì)有兩個(gè)L和R,分別是:

L1 = A1[(C1 - 1) / 2]

R1 = A1[C1 / 2]


L2 = A2[(C2 - 1) / 2]
R2 = A2[C2 / 2]

對于上面的例子就有:

L1 = A1[(7 - 1) / 2] = A1[3] = 5

R1 = A1[7 / 2] = A1[3] = 5


L2 = A2[(2 - 1) / 2] = A2[0] = 1
R2 = A2[2 / 2] = A2[1] = 2

現(xiàn)在需要檢測這個(gè)切割點(diǎn)是否是正確的中位數(shù)的切割點(diǎn),那么根據(jù)之前的分析,任意的左半邊的數(shù)字都需要小于等于右半邊的數(shù)字,L1 和 L2 是左半邊的較大的數(shù)字,R1 和 R2 是右半邊的最小的數(shù)字,所以需要滿足下列關(guān)系:

L1 <= R1 && L1 <= R2 && L2 <= R1 && L2 <= R2

由于兩個(gè)數(shù)組都是有序的,所以 L1 <= R1 和 L2 <= R2 都是滿足的,那么就只需要滿足下列的不等式即可:

L1 <= R2 && L2 <= R1

這樣的話就可以利用二分搜索了,假如 L1 > R2 的話,說明數(shù)組 A1 的左半邊的數(shù)字過大了,需要把切割點(diǎn) C1 往左移動(dòng)。假如 L2 > R1,說明數(shù)組 A2 的左半邊數(shù)字過大,需要把分割點(diǎn) C2 左移。若滿足上面的條件,說明當(dāng)前切割點(diǎn)就是正確的,那么中位數(shù)就可以求出來了,即為:

(max(L1, L2) + min(R1, R2)) / 2

最后還有兩點(diǎn)注意事項(xiàng):

1. 由于 C1 和 C2 是可以互相計(jì)算而得,即一個(gè)確定了,另一個(gè)就可以計(jì)算出來了。所以盡量去移動(dòng)較短的那個(gè)數(shù)組,這樣得到的時(shí)間復(fù)雜度為 O(lg(min(N1, N2)))。

2. 對于 corner case 的處理,當(dāng)切割點(diǎn)在 0 或者 2n 的位置時(shí),將L或R的值分別賦值為整型最小值和較大值,這不會(huì)改變正確的切割點(diǎn)的位置,會(huì)使得代碼實(shí)現(xiàn)更加方便。

C++ 解法三:

class Solution {
public:
    double findMedianSortedArrays(vector<int>& nums1, vector<int>& nums2) {
        int m = nums1.size(), n = nums2.size();
        if (m < n) return findMedianSortedArrays(nums2, nums1);
        if (n == 0) return ((double)nums1[(m - 1) / 2] + (double)nums1[m / 2]) / 2.0;
        int left = 0, right = n * 2;
        while (left <= right) {
            int mid2 = (left + right) / 2;
            int mid1 = m + n - mid2;
            double L1 = mid1 == 0 ? INT_MIN : nums1[(mid1 - 1) / 2];
            double L2 = mid2 == 0 ? INT_MIN : nums2[(mid2 - 1) / 2];
            double R1 = mid1 == m * 2 ? INT_MAX : nums1[mid1 / 2];
            double R2 = mid2 == n * 2 ? INT_MAX : nums2[mid2 / 2];
            if (L1 > R2) left = mid2 + 1;
            else if (L2 > R1) right = mid2 - 1;
            else return (max(L1, L2) + min(R1, R2)) / 2;
        }
        return -1;
    }
};

Java 解法三:

public class Solution {
    public double findMedianSortedArrays(int[] nums1, int[] nums2) {
        int m = nums1.length, n = nums2.length;
        if (m < n) return findMedianSortedArrays(nums2, nums1);
        if (n == 0) return (nums1[(m - 1) / 2] + nums1[m / 2]) / 2.0;
        int left = 0, right = 2 * n;
        while (left <= right) {
            int mid2 = (left + right) / 2;
            int mid1 = m + n - mid2;
            double L1 = mid1 == 0 ? Double.MIN_VALUE : nums1[(mid1 - 1) / 2];
            double L2 = mid2 == 0 ? Double.MIN_VALUE : nums2[(mid2 - 1) / 2];
            double R1 = mid1 == m * 2 ? Double.MAX_VALUE : nums1[mid1 / 2];
            double R2 = mid2 == n * 2 ? Double.MAX_VALUE : nums2[mid2 / 2];
            if (L1 > R2) left = mid2 + 1;
            else if (L2 > R1) right = mid2 - 1;
            else return (Math.max(L1, L2) + Math.min(R1, R2)) / 2;
        }
        return -1;
    }
}

感謝各位的閱讀,以上就是“C++怎么實(shí)現(xiàn)兩個(gè)有序數(shù)組的中位數(shù)”的內(nèi)容了,經(jīng)過本文的學(xué)習(xí)后,相信大家對C++怎么實(shí)現(xiàn)兩個(gè)有序數(shù)組的中位數(shù)這一問題有了更深刻的體會(huì),具體使用情況還需要大家實(shí)踐驗(yàn)證。這里是創(chuàng)新互聯(lián)網(wǎng)站建設(shè)公司,,小編將為大家推送更多相關(guān)知識點(diǎn)的文章,歡迎關(guān)注!

文章題目:C++怎么實(shí)現(xiàn)兩個(gè)有序數(shù)組的中位數(shù)-創(chuàng)新互聯(lián)
文章起源:http://bm7419.com/article40/iigho.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供搜索引擎優(yōu)化、標(biāo)簽優(yōu)化、定制網(wǎng)站、企業(yè)網(wǎng)站制作、服務(wù)器托管、用戶體驗(yàn)

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)

微信小程序開發(fā)