一次神奇的MySQL死鎖排查記錄

背景

成都創(chuàng)新互聯(lián)專注于武夷山企業(yè)網(wǎng)站建設,響應式網(wǎng)站開發(fā),商城網(wǎng)站開發(fā)。武夷山網(wǎng)站建設公司,為武夷山等地區(qū)提供建站服務。全流程按需定制開發(fā),專業(yè)設計,全程項目跟蹤,成都創(chuàng)新互聯(lián)專業(yè)和態(tài)度為您提供的服務

說起MySQL死鎖,之前寫過一次有關Mysql加鎖的基本介紹,對于一些基本的Mysql鎖或者死鎖都有一個簡單的認識,可以看下這篇文章為什么開發(fā)人員需要了解數(shù)據(jù)庫鎖。有了上面的經(jīng)驗之后,本以為對于死鎖都能手到擒來,沒想到再一個陽光明媚的下午報出了一個死鎖,但是這一次卻沒想象的那么簡單。

問題初現(xiàn)

在某天下午,突然系統(tǒng)報警,拋出個異常:

一次神奇的MySQL死鎖排查記錄

仔細一看好像是事務回滾異常,寫著的是因為死鎖回滾,原來是個死鎖問題,由于我對Mysql鎖還是有一定了解的,于是開始主動排查這個問題。

首先在數(shù)據(jù)庫中查找Innodb Status,在Innodb Status中會記錄上一次死鎖的信息,輸入下面命令:

SHOW ENGINE INNODB STATUS 

死鎖信息如下,sql信息進行了簡單處理:

------------------------ 
LATEST DETECTED DEADLOCK 
------------------------ 
2019-02-22 15:10:56 0x7eec2f468700 
*** (1) TRANSACTION: 
TRANSACTION 2660206487, ACTIVE 0 sec starting index read 
mysql tables in use 1, locked 1 
LOCK WAIT 2 lock struct(s), heap size 1136, 1 row lock(s) 
MySQL thread id 31261312, OS thread handle 139554322093824, query id 11624975750 10.23.134.92 erp_crm__6f73 updating 
/*id:3637ba36*/UPDATE tenant_config SET 
 open_card_point = 0 
 where tenant_id = 123 
*** (1) WAITING FOR THIS LOCK TO BE GRANTED: 
RECORD LOCKS space id 1322 page no 534 n bits 960 index uidx_tenant of table `erp_crm_member_plan`.`tenant_config` trx id 2660206487 lock_mode X locks rec but not gap waiting 
 *** (2) TRANSACTION: 
TRANSACTION 2660206486, ACTIVE 0 sec starting index read 
mysql tables in use 1, locked 1 
3 lock struct(s), heap size 1136, 2 row lock(s) 
MySQL thread id 31261311, OS thread handle 139552870532864, query id 11624975758 10.23.134.92 erp_crm__6f73 updating 
/*id:3637ba36*/UPDATE tenant_config SET 
 open_card_point = 0 
 where tenant_id = 123 
*** (2) HOLDS THE LOCK(S): 
RECORD LOCKS space id 1322 page no 534 n bits 960 index uidx_tenant of table `erp_crm_member_plan`.`tenant_config` trx id 2660206486 lock mode S 
*** (2) WAITING FOR THIS LOCK TO BE GRANTED: 
RECORD LOCKS space id 1322 page no 534 n bits 960 index uidx_tenant of table `erp_crm_member_plan`.`tenant_config` trx id 2660206486 lock_mode X locks rec but not gap waiting 
 *** WE ROLL BACK TRANSACTION (1) 
------------ 

給大家簡單的分析解釋一下這段死鎖日志,事務1執(zhí)行Update語句的時候需要獲取uidx_tenant這個索引再where條件上的X鎖(行鎖),事務2執(zhí)行同樣的Update語句,也在uidx_tenant上面想要獲取X鎖(行鎖),然后就出現(xiàn)了死鎖,回滾了事務1。當時我就很懵逼,回想了一下死鎖產(chǎn)生的必要條件:

1、互斥。

2、請求與保持條件。

3、不剝奪條件。

4、循環(huán)等待。

從日志上來看事務1和事務2都是取爭奪同一行的行鎖,和以往的互相循環(huán)爭奪鎖有點不同,怎么看都無法滿足循環(huán)等待條件。經(jīng)過同事提醒,既然從死鎖日志中不能進行排查,那么就只能從業(yè)務代碼和業(yè)務日志從排查。這段代碼的邏輯如下:

public int saveTenantConfig(PoiContext poiContext, TenantConfigDO tenantConfig) { 
 try { 
  return tenantConfigMapper.saveTenantConfig(poiContext.getTenantId(), poiContext.getPoiId(), tenantConfig); 
 } catch (DuplicateKeyException e) { 
  LOGGER.warn("[saveTenantConfig] 主鍵沖突,更新該記錄。context:{}, config:{}", poiContext, tenantConfig); 
  return tenantConfigMapper.updateTenantConfig(poiContext.getTenantId(), tenantConfig); 
 } 
 } 

這段代碼的意思是保存一個配置文件,如果發(fā)生了唯一索引沖突那么就會進行更新,當然這里可能寫得不是很規(guī)范,其實可以用

insert into ... 
on duplicate key update 

也可以達到同樣的效果,但是就算用這個其實也會發(fā)生死鎖??戳舜a之后同事又給我發(fā)了當時業(yè)務日志,

一次神奇的MySQL死鎖排查記錄

可以看見這里有三條同時發(fā)生的日志,說明都發(fā)生了唯一索引沖突進入了更新的語句,然后發(fā)生的死鎖。到這里答案終于稍微有點眉目了。

這個時候再看我們的表結構如下(做了簡化處理):

CREATE TABLE `tenant_config` ( 
 `id` bigint(21) NOT NULL AUTO_INCREMENT, 
 `tenant_id` int(11) NOT NULL, 
 `open_card_point` int(11) DEFAULT NULL, 
 PRIMARY KEY (`id`), 
 UNIQUE KEY `uidx_tenant` (`tenant_id`) 
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 ROW_FORMAT=COMPACT 

我們的tenant_id是用來做唯一索引,我們的插入和更新的where條件都是基于唯一索引來操作的。

UPDATE tenant_config SET 
 open_card_point = 0 
 where tenant_id = 123 

到了這里感覺插入的時候對唯一索引加鎖有關系,接下來我們進行下一步的深入剖析。

深入剖析

上面我們說有三個事務進入update語句,為了簡化說明這里我們只需要兩個事務同時進入update語句即可,下面的表格展示了我們整個的發(fā)生過程:

一次神奇的MySQL死鎖排查記錄

小提示:S鎖是共享鎖,X鎖是互斥鎖。一般來說X鎖和S,X鎖都互斥,S鎖和S鎖不互斥。

我們從上面的流程中看見發(fā)生這個死鎖的關鍵需要獲取S鎖,為什么我們再插入的時候需要獲取S鎖呢?因為我們需要檢測唯一索引?在RR隔離級別下如果要讀取那么就是當前讀,那么其實就需要加上S鎖。這里發(fā)現(xiàn)唯一鍵已經(jīng)存在,這個時候執(zhí)行update就會被兩個事務的S鎖互相阻塞,從而形成上面的循環(huán)等待條件。

一次神奇的MySQL死鎖排查記錄

小提示: 在MVCC中,當前讀和快照讀的區(qū)別:當前讀每次需要加鎖(可以使共享鎖或者互斥鎖)獲取到最新的數(shù)據(jù),而快照讀是讀取的是這個事務開始的時候那個快照,這個是通過undo log去進行實現(xiàn)的。

這個就是整個死鎖的原因,能出現(xiàn)這種死鎖的還有一個情況,就是同一時間來三個插入操作,其中先插入的那個事務如果最后回滾了,其余兩個事務也會出現(xiàn)這種死鎖。

解決方案

這里的核心問題是需要把S鎖給干掉,這里有三個可供參考的解決方案:

  •  將RR隔離級別,降低成RC隔離級別。這里RC隔離級別會用快照讀,從而不會加S鎖。
  •  再插入的時候使用select * for update,加X鎖,從而不會加S鎖。
  •  可以提前加上分布式鎖,可以利用redis,或者ZK等等,分布式鎖可以參考我的這篇文章。聊聊分布式鎖

第一種方法不太現(xiàn)實,畢竟隔離級別不能輕易的修改。第三種方法又比較麻煩。所以第二種方法是我們最后確定的。

總結

說了這么多,最后做一個小小的總結吧。排查死鎖這種問題的時候有時候光看死鎖日志有時候會解決不了問題,需要結合整個的業(yè)務日志,代碼以及表結構來進行分析,才能得到正確的結果。當然上面有一些數(shù)據(jù)庫鎖的基本知識如果不了解可以查看我的另一篇文章為什么開發(fā)人員需要了解數(shù)據(jù)庫鎖。

最后這篇文章被我收錄于JGrowing-CaseStudy篇,一個全面,優(yōu)秀,由社區(qū)一起共建的Java學習路線,如果您想?yún)⑴c開源項目的維護,可以一起共建,github地址為:https://github.com/javagrowing/JGrowing

好了,以上就是這篇文章的全部內容了,希望本文的內容對大家的學習或者工作具有一定的參考學習價值,謝謝大家對創(chuàng)新互聯(lián)的支持。

文章名稱:一次神奇的MySQL死鎖排查記錄
轉載來于:http://bm7419.com/article22/jddpjc.html

成都網(wǎng)站建設公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站建設建站公司、小程序開發(fā)做網(wǎng)站外貿網(wǎng)站建設、網(wǎng)頁設計公司

廣告

聲明:本網(wǎng)站發(fā)布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經(jīng)允許不得轉載,或轉載時需注明來源: 創(chuàng)新互聯(lián)

搜索引擎優(yōu)化