沒看這篇干貨，別說你會使用“緩存”

2021-02-02 分類：網(wǎng)站建設(shè)

在互聯(lián)網(wǎng)高速發(fā)展的今天，緩存技術(shù)被廣泛地應(yīng)用。無論業(yè)內(nèi)還是業(yè)外，只要是提到性能問題，大家都會脫口而出“用緩存解決”。

圖片來自 Unsplash

這種說法帶有片面性，甚至是一知半解，但是作為專業(yè)人士的我們，需要對緩存有更深、更廣的了解。

緩存技術(shù)存在于應(yīng)用場景的方方面面。從瀏覽器請求，到反向代理服務(wù)器，從進程內(nèi)緩存到分布式緩存。其中緩存策略，算法也是層出不窮，今天就帶大家走進緩存。

處處皆緩存

緩存對于每個開發(fā)者來說是相當(dāng)熟悉了，為了提高程序的性能我們會去加緩存，但是在什么地方加緩存，如何加緩存呢?

假設(shè)一個網(wǎng)站，需要提高性能，緩存可以放在瀏覽器，可以放在反向代理服務(wù)器，還可以放在應(yīng)用程序進程內(nèi)，同時可以放在分布式緩存系統(tǒng)中。

負(fù)載均衡緩存工作簡圖

以 Nginx 為例，我們看看它是如何工作的：

用戶請求在達到應(yīng)用服務(wù)器之前，會先訪問 Nginx 負(fù)載均衡器，如果發(fā)現(xiàn)有緩存信息，直接返回給用戶。
如果沒有發(fā)現(xiàn)緩存信息，Nginx 回源到應(yīng)用服務(wù)器獲取信息。
另外，有一個緩存更新服務(wù)，定期把應(yīng)用服務(wù)器中相對穩(wěn)定的信息更新到 Nginx 本地緩存中。

進程內(nèi)緩存

通過了客戶端，

消息隊列修改方案簡圖

Timer 修改方案

為了避免耦合，降低復(fù)雜性，對“實時一致性”不敏感的情況下。每個應(yīng)用都會啟動一個 Timer，定時從數(shù)據(jù)庫拉取最新的數(shù)據(jù)，更新緩存。

不過在有的應(yīng)用更新數(shù)據(jù)庫后，其他節(jié)點通過 Timer 獲取數(shù)據(jù)之間，會讀到臟數(shù)據(jù)。這里需要控制好 Timer 的頻率，以及應(yīng)用與對實時性要求不高的場景。

Timer 修改方案簡圖

進程內(nèi)緩存有哪些使用場景呢?

場景一：只讀數(shù)據(jù)，可以考慮在進程啟動時加載到內(nèi)存。當(dāng)然，把數(shù)據(jù)加載到類似 Redis 這樣的進程外緩存服務(wù)也能解決這類問題。
場景二：高并發(fā)，可以考慮使用進程內(nèi)緩存，例如：秒殺。

分布式緩存

說完進程內(nèi)緩存，自然就過度到進程外緩存了。與進程內(nèi)緩存不同，進程外緩存在應(yīng)用運行的進程之外，它擁有更大的緩存容量，并且可以部署到不同的物理節(jié)點，通常會用分布式緩存的方式實現(xiàn)。

分布式緩存是與應(yīng)用分離的緩存服務(wù)，大的特點是，自身是一個獨立的應(yīng)用/服務(wù)，與本地應(yīng)用隔離，多個應(yīng)用可直接共享一個或者多個緩存應(yīng)用/服務(wù)。

分布式緩存簡圖

既然是分布式緩存，緩存的數(shù)據(jù)會分布到不同的緩存節(jié)點上，每個緩存節(jié)點緩存的數(shù)據(jù)大小通常也是有限制的。

數(shù)據(jù)被緩存到不同的節(jié)點，為了能方便的訪問這些節(jié)點，需要引入緩存代理，類似 Twemproxy。他會幫助請求找到對應(yīng)的緩存節(jié)點。

同時如果緩存節(jié)點增加了，這個代理也會只能識別并且把新的緩存數(shù)據(jù)分片到新的節(jié)點，做橫向的擴展。

為了提高緩存的可用性，會在原有的緩存節(jié)點上加入 Master/Slave 的設(shè)計。當(dāng)緩存數(shù)據(jù)寫入 Master 節(jié)點的時候，會同時同步一份到 Slave 節(jié)點。

一旦 Master 節(jié)點失效，可以通過代理直接切換到 Slave 節(jié)點，這時 Slave 節(jié)點就變成了 Master 節(jié)點，保證緩存的正常工作。

每個緩存節(jié)點還會提供緩存過期的機制，并且會把緩存內(nèi)容定期以快照的方式保存到文件上，方便緩存崩潰之后啟動預(yù)熱加載。

高性能

當(dāng)緩存做成分布式的時候，數(shù)據(jù)會根據(jù)一定的規(guī)律分配到每個緩存應(yīng)用/服務(wù)上。

如果我們把這些緩存應(yīng)用/服務(wù)叫做緩存節(jié)點，每個節(jié)點一般都可以緩存一定容量的數(shù)據(jù)，例如：Redis 一個節(jié)點可以緩存 2G 的數(shù)據(jù)。

如果需要緩存的數(shù)據(jù)量比較大就需要擴展多個緩存節(jié)點來實現(xiàn)，這么多的緩存節(jié)點，客戶端的請求不知道訪問哪個節(jié)點怎么辦?緩存的數(shù)據(jù)又如何放到這些節(jié)點上?

緩存代理服務(wù)已經(jīng)幫我們解決這些問題了，例如：Twemproxy 不但可以幫助緩存路由，同時可以管理緩存節(jié)點。

這里有介紹三種緩存數(shù)據(jù)分片的算法，有了這些算法緩存代理就可以方便的找到分片的數(shù)據(jù)了。

①哈希算法

Hash 表是最常見的數(shù)據(jù)結(jié)構(gòu)，實現(xiàn)方式是，對數(shù)據(jù)記錄的關(guān)鍵值進行 Hash，然后再對需要分片的緩存節(jié)點個數(shù)進行取模得到的余數(shù)進行數(shù)據(jù)分配。

例如：有三條記錄數(shù)據(jù)分別是 R1，R2，R3。他們的 ID 分別是 01，02，03，假設(shè)對這三個記錄的 ID 作為關(guān)鍵值進行 Hash 算法之后的結(jié)果依舊是 01，02，03。

我們想把這三條數(shù)據(jù)放到三個緩存節(jié)點中，可以把這個結(jié)果分別對 3 這個數(shù)字取模得到余數(shù)，這個余數(shù)就是這三條記錄分別放置的緩存節(jié)點。

Hash 算法是某種程度上的平均放置，策略比較簡單，如果要增加緩存節(jié)點，對已經(jīng)存在的數(shù)據(jù)會有較大的變動。

②一致性哈希算法

一致性 Hash 是將數(shù)據(jù)按照特征值映射到一個首尾相接的 Hash 環(huán)上，同時也將緩存節(jié)點映射到這個環(huán)上。

如果要緩存數(shù)據(jù)，通過數(shù)據(jù)的關(guān)鍵值(Key)在環(huán)上找到自己存放的位置。這些數(shù)據(jù)按照自身的 ID 取 Hash 之后得到的值按照順序在環(huán)上排列。

如果這個時候要插入一條新的數(shù)據(jù)其 ID 是 115，那么就應(yīng)該插入到如下圖的位置。

同理如果要增加一個緩存節(jié)點 N4 150，也可以放到如下圖的位置。

這種算法對于增加緩存數(shù)據(jù)，和緩存節(jié)點的開銷相對比較小。

③Range Based 算法

這種方式是按照關(guān)鍵值(例如 ID)將數(shù)據(jù)劃分成不同的區(qū)間，每個緩存節(jié)點負(fù)責(zé)一個或者多個區(qū)間。跟一致性哈希有點像。

例如：存在三個緩存節(jié)點分別是 N1，N2，N3。他們用來存放數(shù)據(jù)的區(qū)間分別是，N1(0, 100]， N2(100, 200]， N3(300, 400]。

那么數(shù)據(jù)根據(jù)自己 ID 作為關(guān)鍵字做 Hash 以后的結(jié)果就會分別對應(yīng)放到這幾個區(qū)域里面了。

可用性

根據(jù)事物的兩面性，在分布式緩存帶來高性能的同時，我們也需要重視它的可用性。那么哪些潛在的風(fēng)險是我們需要防范的呢?

①緩存雪崩

當(dāng)緩存失效，緩存過期被清除，緩存更新的時候。請求是無法命中緩存的，這個時候請求會直接回源到數(shù)據(jù)庫。

如果上述情況頻繁發(fā)生或者同時發(fā)生的時候，就會造成大面積的請求直接到數(shù)據(jù)庫，造成數(shù)據(jù)庫訪問瓶頸。我們稱這種情況為緩存雪崩。

從如下兩方面來思考解決方案：

緩存方面
設(shè)計方面

緩存方面：

避免緩存同時失效，不同的 key 設(shè)置不同的超時時間。
增加互斥鎖，對緩存的更新操作進行加鎖保護，保證只有一個線程進行緩存更新。緩存一旦失效可以通過緩存快照的方式迅速重建緩存。對緩存節(jié)點增加主備機制，當(dāng)主緩存失效以后切換到備用緩存繼續(xù)工作。

設(shè)計方面，這里給出了幾點建議供大家參考：

熔斷機制：某個緩存節(jié)點不能工作的時候，需要通知緩存代理不要把請求路由到該節(jié)點，減少用戶等待和請求時長。
限流機制：在接入層和代理層可以做限流(之前的文章講到過)，當(dāng)緩存服務(wù)無法支持高并發(fā)的時候，前端可以把無法響應(yīng)的請求放入到隊列或者丟棄。
隔離機制：緩存無法提供服務(wù)或者正在預(yù)熱重建的時候，把該請求放入隊列中，這樣該請求因為被隔離就不會被路由到其他的緩存節(jié)點。

如此就不會因為這個節(jié)點的問題影響到其他節(jié)點。當(dāng)緩存重建以后，再從隊列中取出請求依次處理。

②緩存穿透

緩存一般是 Key，Value 方式存在，一個 Key 對應(yīng)的 Value 不存在時，請求會回源到數(shù)據(jù)庫。

假如對應(yīng)的 Value 一直不存在，則會頻繁的請求數(shù)據(jù)庫，對數(shù)據(jù)庫造成訪問壓力。如果有人利用這個漏洞攻擊，就麻煩了。

解決方法：如果一個 Key 對應(yīng)的 Value 查詢返回為空，我們?nèi)匀话堰@個空結(jié)果緩存起來，如果這個值沒有變化下次查詢就不會請求數(shù)據(jù)庫了。

將所有可能存在的數(shù)據(jù)哈希到一個足夠大的 Bitmap 中，那么不存在的數(shù)據(jù)會被這個 Bitmap 過濾器攔截掉，避免對數(shù)據(jù)庫的查詢壓力。

③緩存擊穿

在數(shù)據(jù)請求的時候，某一個緩存剛好失效或者正在寫入緩存，同時這個緩存數(shù)據(jù)可能會在這個時間點被超高并發(fā)請求，成為“熱點”數(shù)據(jù)。

這就是緩存擊穿問題，這個和緩存雪崩的區(qū)別在于，這里是針對某一個緩存，前者是針對多個緩存。

解決方案：導(dǎo)致問題的原因是在同一時間讀/寫緩存，所以只有保證同一時間只有一個線程寫，寫完成以后，其他的請求再使用緩存就可以了。

比較常用的做法是使用 mutex(互斥鎖)。在緩存失效的時候，不是立即寫入緩存，而是先設(shè)置一個 mutex(互斥鎖)。當(dāng)緩存被寫入完成以后，再放開這個鎖讓請求進行訪問。

總結(jié)

今天內(nèi)容有點多，讓我們一起來回顧一下。緩存設(shè)計有五大策略，從用戶請求開始依次是：

HTTP 緩存
CDN 緩存
負(fù)載均衡緩存
進程內(nèi)緩存
分布式緩存

前兩種緩存靜態(tài)數(shù)據(jù)，后三種緩存動態(tài)數(shù)據(jù)：

HTTP 緩存包括強制緩存和對比緩存。
CDN 緩存和 HTTP 緩存是好搭檔。
負(fù)載均衡器緩存相對穩(wěn)定資源，需要服務(wù)協(xié)助工作。
進程內(nèi)緩存，效率高，但容量有限制，有兩個方案可以應(yīng)對緩存同步的問題。
分布式緩存容量大，能力強，牢記三個性能算法并且防范三個緩存風(fēng)險。

網(wǎng)站欄目：沒看這篇干貨，別說你會使用“緩存”
轉(zhuǎn)載源于：http://www.bm7419.com/news4/98754.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián)，為您提供Google、App設(shè)計、搜索引擎優(yōu)化、定制網(wǎng)站、定制開發(fā)、微信公眾號

聲明：本網(wǎng)站發(fā)布的內(nèi)容（圖片、視頻和文字）以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主，如果涉及侵權(quán)請盡快告知，我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場，如需處理請聯(lián)系客服。電話：028-86922220；郵箱：631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載，或轉(zhuǎn)載時需注明來源：創(chuàng)新互聯(lián)

猜你還喜歡下面的內(nèi)容

小程序浪潮下，各大平臺的路該如何走？ 2021-02-02
無服務(wù)器架構(gòu)的三個重要意義 2021-02-02
香港服務(wù)器的優(yōu)點 2021-02-02
5分鐘搞清楚云計算的三種服務(wù)模式！ 2021-02-02
商標(biāo)與域名之間的不同之處 2021-02-02
企業(yè)網(wǎng)站安裝SSL證書優(yōu)勢在哪里？ 2021-02-02
智慧城市大數(shù)據(jù)可視化系統(tǒng)設(shè)計心得 2021-02-02

沒看這篇干貨，別說你會使用“緩存”

沒看這篇干貨，別說你會使用“緩存”