Python中一條SQL語句執(zhí)行得很慢的原因有哪些-創(chuàng)新互聯(lián)

Python中一條SQL語句執(zhí)行得很慢的原因有哪些，相信很多沒有經(jīng)驗(yàn)的人對(duì)此束手無策，為此本文總結(jié)了問題出現(xiàn)的原因和解決方法，通過這篇文章希望你能解決這個(gè)問題。

成都創(chuàng)新互聯(lián)公司是由多位在大型網(wǎng)絡(luò)公司、廣告設(shè)計(jì)公司的優(yōu)秀設(shè)計(jì)人員和策劃人員組成的一個(gè)具有豐富經(jīng)驗(yàn)的團(tuán)隊(duì)，其中包括網(wǎng)站策劃、網(wǎng)頁美工、網(wǎng)站程序員、網(wǎng)頁設(shè)計(jì)師、平面廣告設(shè)計(jì)師、網(wǎng)絡(luò)營銷人員及形象策劃。承接：網(wǎng)站制作、網(wǎng)站設(shè)計(jì)、網(wǎng)站改版、網(wǎng)頁設(shè)計(jì)制作、網(wǎng)站建設(shè)與維護(hù)、網(wǎng)絡(luò)推廣、數(shù)據(jù)庫開發(fā),以高性價(jià)比制作企業(yè)網(wǎng)站、行業(yè)門戶平臺(tái)等全方位的服務(wù)。

說實(shí)話，這個(gè)問題可以涉及到 MySQL 的很多核心知識(shí)，可以扯出一大堆，就像要考你計(jì)算機(jī)網(wǎng)絡(luò)的知識(shí)時(shí)，問你“輸入U(xiǎn)RL回車之后，究竟發(fā)生了什么”一樣，看看你能說出多少了。

之前騰訊面試的實(shí)話，也問到這個(gè)問題了，不過答的很不好，之前沒去想過相關(guān)原因，導(dǎo)致一時(shí)之間扯不出來。所以今天，我?guī)Т蠹襾碓敿?xì)扯一下有哪些原因，相信你看完之后一定會(huì)有所收獲！

一、開始裝逼：分類討論

一條 SQL 語句執(zhí)行的很慢，那是每次執(zhí)行都很慢呢？還是大多數(shù)情況下是正常的，偶爾出現(xiàn)很慢呢？所以我覺得，我們還得分以下兩種情況來討論。

1、大多數(shù)情況是正常的，只是偶爾會(huì)出現(xiàn)很慢的情況。

2、在數(shù)據(jù)量不變的情況下，這條SQL語句一直以來都執(zhí)行的很慢。

針對(duì)這兩種情況，我們來分析下可能是哪些原因?qū)е碌摹?/p>

二、針對(duì)偶爾很慢的情況

一條 SQL 大多數(shù)情況正常，偶爾才能出現(xiàn)很慢的情況，針對(duì)這種情況，我覺得這條SQL語句的書寫本身是沒什么問題的，而是其他原因?qū)е碌模菚?huì)是什么原因呢？

1、數(shù)據(jù)庫在刷新臟頁我也無奈啊

當(dāng)我們要往數(shù)據(jù)庫插入一條數(shù)據(jù)、或者要更新一條數(shù)據(jù)的時(shí)候，我們知道數(shù)據(jù)庫會(huì)在內(nèi)存中把對(duì)應(yīng)字段的數(shù)據(jù)更新了，但是更新之后，這些更新的字段并不會(huì)馬上同步持久化到磁盤中去，而是把這些更新的記錄寫入到 redo log 日記中去，等到空閑的時(shí)候，在通過 redo log 里的日記把最新的數(shù)據(jù)同步到磁盤中去。

不過，redo log 里的容量是有限的，如果數(shù)據(jù)庫一直很忙，更新又很頻繁，這個(gè)時(shí)候 redo log 很快就會(huì)被寫滿了，這個(gè)時(shí)候就沒辦法等到空閑的時(shí)候再把數(shù)據(jù)同步到磁盤的，只能暫停其他操作，全身心來把數(shù)據(jù)同步到磁盤中去的，而這個(gè)時(shí)候，就會(huì)導(dǎo)致我們平時(shí)正常的SQL語句突然執(zhí)行的很慢，所以說，數(shù)據(jù)庫在在同步數(shù)據(jù)到磁盤的時(shí)候，就有可能導(dǎo)致我們的SQL語句執(zhí)行的很慢了。

2、拿不到鎖我能怎么辦

這個(gè)就比較容易想到了，我們要執(zhí)行的這條語句，剛好這條語句涉及到的表，別人在用，并且加鎖了，我們拿不到鎖，只能慢慢等待別人釋放鎖了?；蛘撸頉]有加鎖，但要使用到的某個(gè)一行被加鎖了，這個(gè)時(shí)候，我也沒辦法啊。

如果要判斷是否真的在等待鎖，我們可以用 show processlist這個(gè)命令來查看當(dāng)前的狀態(tài)哦，這里我要提醒一下，有些命令最好記錄一下，反正，我被問了好幾個(gè)命令，都不知道怎么寫，呵呵。

下來我們來訪分析下第二種情況，我覺得第二種情況的分析才是最重要的

三、針對(duì)一直都這么慢的情況

如果在數(shù)據(jù)量一樣大的情況下，這條 SQL 語句每次都執(zhí)行的這么慢，那就就要好好考慮下你的 SQL 書寫了，下面我們來分析下哪些原因會(huì)導(dǎo)致我們的 SQL 語句執(zhí)行的很不理想。

我們先來假設(shè)我們有一個(gè)表，表里有下面兩個(gè)字段,分別是主鍵 id，和兩個(gè)普通字段 c 和 d。

mysql> CREATE TABLE `t` (
 `id` int(11) NOT NULL,
 `c` int(11) DEFAULT NULL,
 `d` int(11) DEFAULT NULL,
 PRIMARY KEY (`id`)
) ENGINE=InnoDB;

1、扎心了，沒用到索引

沒有用上索引，我覺得這個(gè)原因是很多人都能想到的，例如你要查詢這條語句

select * from t where 100 <c and c < 100000;

（1）、字段沒有索引

剛好你的 c 字段上沒有索引，那么抱歉，只能走全表掃描了，你就體驗(yàn)不會(huì)索引帶來的樂趣了，所以，這回導(dǎo)致這條查詢語句很慢。

（2）、字段有索引，但卻沒有用索引

好吧，這個(gè)時(shí)候你給 c 這個(gè)字段加上了索引，然后又查詢了一條語句

select * from t where c - 1 = 1000;

我想問大家一個(gè)問題，這樣子在查詢的時(shí)候會(huì)用索引查詢嗎？

答是不會(huì)，如果我們?cè)谧侄蔚淖筮呑隽诉\(yùn)算，那么很抱歉，在查詢的時(shí)候，就不會(huì)用上索引了，所以呢，大家要注意這種字段上有索引，但由于自己的疏忽，導(dǎo)致系統(tǒng)沒有使用索引的情況了。

正確的查詢應(yīng)該如下

select * from t where c = 1000 + 1;

有人可能會(huì)說，右邊有運(yùn)算就能用上索引？難道數(shù)據(jù)庫就不會(huì)自動(dòng)幫我們優(yōu)化一下，自動(dòng)把 c - 1=1000 自動(dòng)轉(zhuǎn)換為 c = 1000+1。

不好意思，確實(shí)不會(huì)幫你，所以，你要注意了。

（3）、函數(shù)操作導(dǎo)致沒有用上索引

如果我們?cè)诓樵兊臅r(shí)候，對(duì)字段進(jìn)行了函數(shù)操作，也是會(huì)導(dǎo)致沒有用上索引的，例如

select * from t where pow(c,2) = 1000;

這里我只是做一個(gè)例子，假設(shè)函數(shù) pow 是求 c 的 n 次方，實(shí)際上可能并沒有 pow(c,2)這個(gè)函數(shù)。其實(shí)這個(gè)和上面在左邊做運(yùn)算也是很類似的。

所以呢，一條語句執(zhí)行都很慢的時(shí)候，可能是該語句沒有用上索引了，不過具體是啥原因?qū)е聸]有用上索引的呢，你就要會(huì)分析了，我上面列舉的三個(gè)原因，應(yīng)該是出現(xiàn)的比較多的吧。

2、呵呵，數(shù)據(jù)庫自己選錯(cuò)索引了

我們?cè)谶M(jìn)行查詢操作的時(shí)候，例如

select * from t where 100 < c and c < 100000;

我們知道，主鍵索引和非主鍵索引是有區(qū)別的，主鍵索引存放的值是整行字段的數(shù)據(jù)，而非主鍵索引上存放的值不是整行字段的數(shù)據(jù)，而且存放主鍵字段的值。

也就是說，我們?nèi)绻?c 這個(gè)字段的索引的話，最后會(huì)查詢到對(duì)應(yīng)主鍵的值，然后，再根據(jù)主鍵的值走主鍵索引，查詢到整行數(shù)據(jù)返回。

好吧扯了這么多，其實(shí)我就是想告訴你，就算你在 c 字段上有索引，系統(tǒng)也并不一定會(huì)走 c 這個(gè)字段上的索引，而是有可能會(huì)直接掃描掃描全表，找出所有符合 100 < c and c < 100000 的數(shù)據(jù)。

為什么會(huì)這樣呢？

其實(shí)是這樣的，系統(tǒng)在執(zhí)行這條語句的時(shí)候，會(huì)進(jìn)行預(yù)測：究竟是走 c 索引掃描的行數(shù)少，還是直接掃描全表掃描的行數(shù)少呢？顯然，掃描行數(shù)越少當(dāng)然越好了，因?yàn)閽呙栊袛?shù)越少，意味著I/O操作的次數(shù)越少。

如果是掃描全表的話，那么掃描的次數(shù)就是這個(gè)表的總行數(shù)了，假設(shè)為 n；而如果走索引 c 的話，我們通過索引 c 找到主鍵之后，還得再通過主鍵索引來找我們整行的數(shù)據(jù)，也就是說，需要走兩次索引。而且，我們也不知道符合 100 c < and c < 10000 這個(gè)條件的數(shù)據(jù)有多少行，萬一這個(gè)表是全部數(shù)據(jù)都符合呢？這個(gè)時(shí)候意味著，走 c 索引不僅掃描的行數(shù)是 n，同時(shí)還得每行數(shù)據(jù)走兩次索引。

所以呢，系統(tǒng)是有可能走全表掃描而不走索引的。那系統(tǒng)是怎么判斷呢？

判斷來源于系統(tǒng)的預(yù)測，也就是說，如果要走 c 字段索引的話，系統(tǒng)會(huì)預(yù)測走 c 字段索引大概需要掃描多少行。如果預(yù)測到要掃描的行數(shù)很多，它可能就不走索引而直接掃描全表了。

那么問題來了，系統(tǒng)是怎么預(yù)測判斷的呢？這里我給你講下系統(tǒng)是怎么判斷的吧，雖然這個(gè)時(shí)候我已經(jīng)寫到脖子有點(diǎn)酸了。

系統(tǒng)是通過索引的區(qū)分度來判斷的，一個(gè)索引上不同的值越多，意味著出現(xiàn)相同數(shù)值的索引越少，意味著索引的區(qū)分度越高。我們也把區(qū)分度稱之為基數(shù)，即區(qū)分度越高，基數(shù)越大。所以呢，基數(shù)越大，意味著符合 100 < c and c < 10000 這個(gè)條件的行數(shù)越少。

所以呢，一個(gè)索引的基數(shù)越大，意味著走索引查詢?cè)接袃?yōu)勢。

那么問題來了，怎么知道這個(gè)索引的基數(shù)呢？

系統(tǒng)當(dāng)然是不會(huì)遍歷全部來獲得一個(gè)索引的基數(shù)的，代價(jià)太大了，索引系統(tǒng)是通過遍歷部分?jǐn)?shù)據(jù)，也就是通過采樣的方式，來預(yù)測索引的基數(shù)的。

扯了這么多，重點(diǎn)的來了，居然是采樣，那就有可能出現(xiàn)失誤的情況，也就是說，c 這個(gè)索引的基數(shù)實(shí)際上是很大的，但是采樣的時(shí)候，卻很不幸，把這個(gè)索引的基數(shù)預(yù)測成很小。例如你采樣的那一部分?jǐn)?shù)據(jù)剛好基數(shù)很小，然后就誤以為索引的基數(shù)很小。然后就呵呵，系統(tǒng)就不走 c 索引了，直接走全部掃描了。

所以呢，說了這么多，得出結(jié)論：由于統(tǒng)計(jì)的失誤，導(dǎo)致系統(tǒng)沒有走索引，而是走了全表掃描，而這，也是導(dǎo)致我們 SQL 語句執(zhí)行的很慢的原因。

這里我聲明一下，系統(tǒng)判斷是否走索引，掃描行數(shù)的預(yù)測其實(shí)只是原因之一，這條查詢語句是否需要使用使用臨時(shí)表、是否需要排序等也是會(huì)影響系統(tǒng)的選擇的。

不過呢，我們有時(shí)候也可以通過強(qiáng)制走索引的方式來查詢，例如

select * from t force index(a) where c < 100 and c < 100000;

我們也可以通過

show index from t;

來查詢索引的基數(shù)和實(shí)際是否符合，如果和實(shí)際很不符合的話，我們可以重新來統(tǒng)計(jì)索引的基數(shù)，可以用這條命令

analyze table t;

來重新統(tǒng)計(jì)分析。

既然會(huì)預(yù)測錯(cuò)索引的基數(shù)，這也意味著，當(dāng)我們的查詢語句有多個(gè)索引的時(shí)候，系統(tǒng)有可能也會(huì)選錯(cuò)索引哦，這也可能是 SQL 執(zhí)行的很慢的一個(gè)原因。

好吧，就先扯這么多了，你到時(shí)候能扯出這么多，我覺得已經(jīng)很棒了，下面做一個(gè)總結(jié)。

四、總結(jié)

以上是我的總結(jié)與理解，最后一個(gè)部分，我怕很多人不大懂?dāng)?shù)據(jù)庫居然會(huì)選錯(cuò)索引，所以我詳細(xì)解釋了一下，下面我對(duì)以上做一個(gè)總結(jié)。

一個(gè) SQL 執(zhí)行的很慢，我們要分兩種情況討論：

1、大多數(shù)情況下很正常，偶爾很慢，則有如下原因

(1)、數(shù)據(jù)庫在刷新臟頁，例如 redo log 寫滿了需要同步到磁盤。

(2)、執(zhí)行的時(shí)候，遇到鎖，如表鎖、行鎖。

2、這條 SQL 語句一直執(zhí)行的很慢，則有如下原因。

(1)、沒有用上索引：例如該字段沒有索引；由于對(duì)字段進(jìn)行運(yùn)算、函數(shù)操作導(dǎo)致無法用索引。

(2)、數(shù)據(jù)庫選錯(cuò)了索引。

看完上述內(nèi)容，你們掌握Python中一條SQL語句執(zhí)行得很慢的原因有哪些的方法了嗎？如果還想學(xué)到更多技能或想了解更多相關(guān)內(nèi)容，歡迎關(guān)注創(chuàng)新互聯(lián)-成都網(wǎng)站建設(shè)公司行業(yè)資訊頻道，感謝各位的閱讀！

網(wǎng)站題目：Python中一條SQL語句執(zhí)行得很慢的原因有哪些-創(chuàng)新互聯(lián)
轉(zhuǎn)載注明：http://bm7419.com/article44/dpocee.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián)，為您提供做網(wǎng)站、軟件開發(fā)、App開發(fā)、營銷型網(wǎng)站建設(shè)、網(wǎng)站改版、建站公司

聲明：本網(wǎng)站發(fā)布的內(nèi)容（圖片、視頻和文字）以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主，如果涉及侵權(quán)請(qǐng)盡快告知，我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場，如需處理請(qǐng)聯(lián)系客服。電話：028-86922220；郵箱：631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載，或轉(zhuǎn)載時(shí)需注明來源：創(chuàng)新互聯(lián)

猜你還喜歡下面的內(nèi)容