Nginx常見工作原理及應(yīng)用

2021-02-07 分類：網(wǎng)站建設(shè)

1 反向代理

1.1 概念

反向代理（Reverse Proxy）方式是指以代理服務(wù)器來接受internet上的連接請求，然后將請求轉(zhuǎn)發(fā)給內(nèi)部網(wǎng)絡(luò)上的服務(wù)器，并將從服務(wù)器上得到的結(jié)果返回給internet上請求連接的客戶端，此時(shí)代理服務(wù)器對外就表現(xiàn)為一個(gè)服務(wù)器。

舉個(gè)例子，比如我想訪問 http://www.test.com/readme，但www.test.com上并不存在readme頁面，于是他是偷偷從另外一臺服務(wù)器上取回來，然后作為自己的內(nèi)容返回用戶，但用戶并不知情。這里所提到的 www.test.com 這個(gè)域名對應(yīng)的服務(wù)器就設(shè)置了反向代理功能。

結(jié)論就是，反向代理服務(wù)器對于客戶端而言它就像是原始服務(wù)器，并且客戶端不需要進(jìn)行任何特別的設(shè)置。客戶端向反向代理的命名空間(name-space)中的內(nèi)容發(fā)送普通請求，接著反向代理服務(wù)器將判斷向何處(原始服務(wù)器)轉(zhuǎn)交請求，并將獲得的內(nèi)容返回給客戶端，就像這些內(nèi)容原本就是它自己的一樣。

正向代理，既然有反向代理，就肯定有正向代理。什么叫正向代理呢？

正向代理（Forward Proxy）通常都被簡稱為代理，就是在用戶無法正常訪問外部資源，比方說受到GFW的影響無法訪問twitter的時(shí)候，我們可以通過代理的方式，讓用戶繞過防火墻，從而連接到目標(biāo)網(wǎng)絡(luò)或者服務(wù)。

正向代理的工作原理就像一個(gè)跳板，比如：我訪問不了google.com，但是我能訪問一個(gè)代理服務(wù)器A，A能訪問google.com，于是我先連上代理服務(wù)器A，告訴他我需要google.com的內(nèi)容，A就去取回來，然后返回給我。從網(wǎng)站的角度，只在代理服務(wù)器來取內(nèi)容的時(shí)候有一次記錄，有時(shí)候并不知道是用戶的請求，也隱藏了用戶的資料，這取決于代理告不告訴網(wǎng)站。

結(jié)論就是，正向代理是一個(gè)位于客戶端和原始服務(wù)器(origin server)之間的服務(wù)器。為了從原始服務(wù)器取得內(nèi)容，客戶端向代理發(fā)送一個(gè)請求并指定目標(biāo)(原始服務(wù)器)，然后代理向原始服務(wù)器轉(zhuǎn)交請求并將獲得的內(nèi)容返回給客戶端。

反向代理VS正向代理：

正向代理示意圖

反向代理示意圖

1.2 工作流程

用戶通過域名發(fā)出訪問Web服務(wù)器的請求，該域名被DNS服務(wù)器解析為反向代理服務(wù)器的IP地址；
反向代理服務(wù)器接受用戶的請求；
反向代理服務(wù)器在本地緩存中查找請求的內(nèi)容，找到后直接把內(nèi)容發(fā)送給用戶；
如果本地緩存里沒有用戶所請求的信息內(nèi)容，反向代理服務(wù)器會代替用戶向源服務(wù)器請求同樣的信息內(nèi)容，并把信息內(nèi)容發(fā)給用戶，如果信息內(nèi)容是緩存的還會把它保存到緩存中。

1.3 優(yōu)點(diǎn)

保護(hù)了真實(shí)的web服務(wù)器，保證了web服務(wù)器的資源安全

通常的代理服務(wù)器，只用于代理內(nèi)部網(wǎng)絡(luò)對Internet外部網(wǎng)絡(luò)的連接請求，客戶機(jī)必須指定代理服務(wù)器，并將本來要直接發(fā)送到Web服務(wù)器上的http請求發(fā)送到代理服務(wù)器中。不支持外部網(wǎng)絡(luò)對內(nèi)部網(wǎng)絡(luò)的連接請求，因?yàn)閮?nèi)部網(wǎng)絡(luò)對外部網(wǎng)絡(luò)是不可見的。當(dāng)一個(gè)代理服務(wù)器能夠代理外部網(wǎng)絡(luò)上的主機(jī)，訪問內(nèi)部網(wǎng)絡(luò)時(shí)，這種代理服務(wù)的方式稱為反向代理服務(wù)。此時(shí)代理服務(wù)器對外就表現(xiàn)為一個(gè)Web服務(wù)器，外部網(wǎng)絡(luò)就可以簡單把它當(dāng)作一個(gè)標(biāo)準(zhǔn)的Web服務(wù)器而不需要特定的配置。不同之處在于，這個(gè)服務(wù)器沒有保存任何網(wǎng)頁的真實(shí)數(shù)據(jù)，所有的靜態(tài)網(wǎng)頁或者CGI程序，都保存在內(nèi)部的Web服務(wù)器上。因此對反向代理服務(wù)器的攻擊并不會使得網(wǎng)頁信息遭到破壞，這樣就增強(qiáng)了Web服務(wù)器的安全性。

節(jié)約了有限的IP地址資源

企業(yè)內(nèi)所有的網(wǎng)站共享一個(gè)在internet中注冊的IP地址，這些服務(wù)器分配私有地址，采用虛擬主機(jī)的方式對外提供服務(wù)。

減少WEB服務(wù)器壓力，提高響應(yīng)速度

反向代理就是通常所說的web服務(wù)器加速，它是一種通過在繁忙的web服務(wù)器和外部網(wǎng)絡(luò)之間增加一個(gè)高速的web緩沖服務(wù)器來降低實(shí)際的web服務(wù)器的負(fù)載的一種技術(shù)。反向代理是針對web服務(wù)器提高加速功能，作為代理緩存，它并不是針對瀏覽器用戶，而針對一臺或多臺特定的web服務(wù)器，它可以代理外部網(wǎng)絡(luò)對內(nèi)部網(wǎng)絡(luò)的訪問請求。

反向代理服務(wù)器會強(qiáng)制將外部網(wǎng)絡(luò)對要代理的服務(wù)器的訪問經(jīng)過它，這樣反向代理服務(wù)器負(fù)責(zé)接收客戶端的請求，然后到源服務(wù)器上獲取內(nèi)容，把內(nèi)容返回給用戶，并把內(nèi)容保存到本地，以便日后再收到同樣的信息請求時(shí)，它會把本地緩存里的內(nèi)容直接發(fā)給用戶，以減少后端web服務(wù)器的壓力，提高響應(yīng)速度。因此Nginx還具有緩存功能。

其他優(yōu)點(diǎn)

（1）請求的統(tǒng)一控制，包括設(shè)置權(quán)限、過濾規(guī)則等；

（2）區(qū)分動(dòng)態(tài)和靜態(tài)可緩存內(nèi)容；

（3）實(shí)現(xiàn)負(fù)載均衡，內(nèi)部可以采用多臺服務(wù)器來組成服務(wù)器集群，外部還是可以采用一個(gè)地址訪問；

（4）解決Ajax跨域問題；

（5）作為真實(shí)服務(wù)器的緩沖，解決瞬間負(fù)載量大的問題；

Nginx有五大優(yōu)點(diǎn)：模塊化、事件驅(qū)動(dòng)、異步、非阻塞、多進(jìn)程單線程。由內(nèi)核和模塊組成的，其中內(nèi)核完成的工作比較簡單，僅僅通過查找配置文件將客戶端請求映射到一個(gè)location block，然后又將這個(gè)location block中所配置的每個(gè)指令將會啟動(dòng)不同的模塊去完成相應(yīng)的工作。

2 Nginx模塊

2.1 模塊劃分

Nginx的模塊從結(jié)構(gòu)上分為核心模塊、基礎(chǔ)模塊和第三方模塊：

核心模塊：HTTP模塊、EVENT模塊和MAIL模塊
基礎(chǔ)模塊：HTTP Access模塊、HTTP FastCGI模塊、HTTP Proxy模塊和HTTP Rewrite模塊，
第三方模塊：HTTP Upstream Request Hash模塊、Notice模塊和HTTP Access Key模塊。

Nginx的模塊從功能上分為如下四類：

Core(核心模塊)：構(gòu)建nginx基礎(chǔ)服務(wù)、管理其他模塊。
Handlers（處理器模塊）：此類模塊直接處理請求，并進(jìn)行輸出內(nèi)容和修改headers信息等操作。
Filters （過濾器模塊）：此類模塊主要對其他處理器模塊輸出的內(nèi)容進(jìn)行修改操作，最后由Nginx輸出。
Proxies （代理類模塊）：此類模塊是Nginx的HTTP Upstream之類的模塊，這些模塊主要與后端一些服務(wù)比如FastCGI等進(jìn)行交互，實(shí)現(xiàn)服務(wù)代理和負(fù)載均衡等功能。

Nginx的核心模塊主要負(fù)責(zé)建立nginx服務(wù)模型、管理網(wǎng)絡(luò)層和應(yīng)用層協(xié)議、以及啟動(dòng)針對特定應(yīng)用的一系列候選模塊。其他模塊負(fù)責(zé)分配給web服務(wù)器的實(shí)際工作：

(1) 當(dāng)Nginx發(fā)送文件或者轉(zhuǎn)發(fā)請求到其他服務(wù)器，由Handlers(處理模塊)或Proxies（代理類模塊）提供服務(wù)；
(2) 當(dāng)需要Nginx把輸出壓縮或者在服務(wù)端加一些東西，由Filters(過濾模塊)提供服務(wù)。

2.2 模塊處理

當(dāng)服務(wù)器啟動(dòng)，每個(gè)handlers(處理模塊)都有機(jī)會映射到配置文件中定義的特定位置（location）；如果有多個(gè)handlers(處理模塊)映射到特定位置時(shí)，只有一個(gè)會“贏”（說明配置文件有沖突項(xiàng)，應(yīng)該避免發(fā)生）。

處理模塊以三種形式返回：

OK
ERROR
或者放棄處理這個(gè)請求而讓默認(rèn)處理模塊來處理（主要是用來處理一些靜態(tài)文件，事實(shí)上如果是位置正確而真實(shí)的靜態(tài)文件，默認(rèn)的處理模塊會搶先處理）。

如果handlers(處理模塊)把請求反向代理到后端的服務(wù)器，就變成另外一類的模塊：load-balancers（負(fù)載均衡模塊）。負(fù)載均衡模塊的配置中有一組后端服務(wù)器，當(dāng)一個(gè)HTTP請求過來時(shí)，它決定哪臺服務(wù)器應(yīng)當(dāng)獲得這個(gè)請求。

Nginx的負(fù)載均衡模塊采用兩種方法：

輪轉(zhuǎn)法，它處理請求就像紙牌游戲一樣從頭到尾分發(fā)；
IP哈希法，在眾多請求的情況下，它確保來自同一個(gè)IP的請求會分發(fā)到相同的后端服務(wù)器。

如果handlers(處理模塊)沒有產(chǎn)生錯(cuò)誤，filters（過濾模塊）將被調(diào)用。多個(gè)filters（過濾模塊）能映射到每個(gè)位置，所以（比如）每個(gè)請求都可以被壓縮成塊。它們的執(zhí)行順序在編譯時(shí)決定。

filters（過濾模塊）是經(jīng)典的“接力鏈表（CHAIN OF RESPONSIBILITY）”模型：一個(gè)filters（過濾模塊）被調(diào)用，完成其工作，然后調(diào)用下一個(gè)filters（過濾模塊），直到最后一個(gè)filters（過濾模塊）。

過濾模塊鏈的特別之處在于：

每個(gè)filters（過濾模塊）不會等上一個(gè)filters（過濾模塊）全部完成；
它能把前一個(gè)過濾模塊的輸出作為其處理內(nèi)容；有點(diǎn)像Unix中的流水線；

過濾模塊能以buffer（緩沖區(qū)）為單位進(jìn)行操作，這些buffer一般都是一頁（4K）大小，當(dāng)然你也可以在nginx.conf文件中進(jìn)行配置。這意味著，比如，模塊可以壓縮來自后端服務(wù)器的響應(yīng)，然后像流一樣的到達(dá)客戶端，直到整個(gè)響應(yīng)發(fā)送完成。

總之，過濾模塊鏈以流水線的方式高效率地向客戶端發(fā)送響應(yīng)信息。

所以總結(jié)下上面的內(nèi)容，一個(gè)典型的HTTP處理周期是這樣的：

客戶端發(fā)送HTTP請求 –>
Nginx基于配置文件中的位置選擇一個(gè)合適的處理模塊 ->
(如果有)負(fù)載均衡模塊選擇一臺后端服務(wù)器 –>
處理模塊進(jìn)行處理并把輸出緩沖放到第一個(gè)過濾模塊上 –>
第一個(gè)過濾模塊處理后輸出給第二個(gè)過濾模塊 –>
然后第二個(gè)過濾模塊又到第三個(gè) –>
依此類推 –> 最后把響應(yīng)發(fā)給客戶端。

下圖展示了Nginx模塊處理流程：

Nginx模塊處理流程

Nginx本身做的工作實(shí)際很少，當(dāng)它接到一個(gè)HTTP請求時(shí)，它僅僅是通過查找配置文件將此次請求映射到一個(gè)location block，而此location中所配置的各個(gè)指令則會啟動(dòng)不同的模塊去完成工作，因此模塊可以看做Nginx真正的勞動(dòng)工作者。通常一個(gè)location中的指令會涉及一個(gè)handler模塊和多個(gè)filter模塊（當(dāng)然，多個(gè)location可以復(fù)用同一個(gè)模塊）。handler模塊負(fù)責(zé)處理請求，完成響應(yīng)內(nèi)容的生成，而filter模塊對響應(yīng)內(nèi)容進(jìn)行處理。

3 Nginx請求處理

Nginx在啟動(dòng)時(shí)會以daemon形式在后臺運(yùn)行，采用多進(jìn)程+異步非阻塞IO事件模型來處理各種連接請求。多進(jìn)程模型包括一個(gè)master進(jìn)程，多個(gè)worker進(jìn)程，一般worker進(jìn)程個(gè)數(shù)是根據(jù)服務(wù)器CPU核數(shù)來決定的。master進(jìn)程負(fù)責(zé)管理Nginx本身和其他worker進(jìn)程。如下圖：

Master進(jìn)程負(fù)責(zé)管理Nginx本身和其他worker進(jìn)程

Master-Worker模式

從上圖中可以很明顯地看到，4個(gè)worker進(jìn)程的父進(jìn)程都是master進(jìn)程，表明worker進(jìn)程都是從父進(jìn)程fork出來的，并且父進(jìn)程的ppid為1，表示其為daemon進(jìn)程。
需要說明的是，在nginx多進(jìn)程中，每個(gè)worker都是平等的，因此每個(gè)進(jìn)程處理外部請求的機(jī)會權(quán)重都是一致的。

Master進(jìn)程的作用是？

讀取并驗(yàn)證配置文件nginx.conf；管理worker進(jìn)程；
Worker進(jìn)程的作用是？
每一個(gè)Worker進(jìn)程都維護(hù)一個(gè)線程（避免線程切換），處理連接和請求；注意Worker進(jìn)程的個(gè)數(shù)由配置文件決定，一般和CPU個(gè)數(shù)相關(guān)（有利于進(jìn)程切換），配置幾個(gè)就有幾個(gè)Worker進(jìn)程。

Nginx如何做到熱部署？

所謂熱部署，就是配置文件nginx.conf修改后，不需要stop Nginx，不需要中斷請求，就能讓配置文件生效！（nginx -s reload 重新加載/nginx -t檢查配置/nginx -s stop）
通過上文我們已經(jīng)知道worker進(jìn)程負(fù)責(zé)處理具體的請求，那么如果想達(dá)到熱部署的效果，可以想象：
方案一：
修改配置文件nginx.conf后，主進(jìn)程master負(fù)責(zé)推送給woker進(jìn)程更新配置信息，woker進(jìn)程收到信息后，更新進(jìn)程內(nèi)部的線程信息。
方案二：
修改配置文件nginx.conf后，重新生成新的worker進(jìn)程，當(dāng)然會以新的配置進(jìn)行處理請求，而且新的請求必須都交給新的worker進(jìn)程，至于老的worker進(jìn)程，等把那些以前的請求處理完畢后，kill掉即可。
Nginx采用的就是方案二來達(dá)到熱部署的！

Nginx如何做到高并發(fā)下的高效處理？

上文已經(jīng)提及Nginx的worker進(jìn)程個(gè)數(shù)與CPU綁定、worker進(jìn)程內(nèi)部包含一個(gè)線程高效回環(huán)處理請求，這的確有助于效率，但這是不夠的。
作為專業(yè)的程序員，我們可以開一下腦洞：BIO/NIO/AIO、異步/同步、阻塞/非阻塞...
要同時(shí)處理那么多的請求，要知道，有的請求需要發(fā)生IO，可能需要很長時(shí)間，如果等著它，就會拖慢worker的處理速度。
Nginx采用了Linux的epoll模型，epoll模型基于事件驅(qū)動(dòng)機(jī)制，它可以監(jiān)控多個(gè)事件是否準(zhǔn)備完畢，如果OK，那么放入epoll隊(duì)列中，這個(gè)過程是異步的。worker只需要從epoll隊(duì)列循環(huán)處理即可。

Nginx掛了怎么辦？

Nginx既然作為入口網(wǎng)關(guān)，很重要，如果出現(xiàn)單點(diǎn)問題，顯然是不可接受的。
答案是：Keepalived+Nginx實(shí)現(xiàn)高可用。
Keepalived是一個(gè)高可用解決方案，主要是用來防止服務(wù)器單點(diǎn)發(fā)生故障，可以通過和Nginx配合來實(shí)現(xiàn)Web服務(wù)的高可用。（其實(shí)，Keepalived不僅僅可以和Nginx配合，還可以和很多其他服務(wù)配合）
Keepalived+Nginx實(shí)現(xiàn)高可用的思路：
第一：請求不要直接打到Nginx上，應(yīng)該先通過Keepalived（這就是所謂虛擬IP，VIP）
第二：Keepalived應(yīng)該能監(jiān)控Nginx的生命狀態(tài)（提供一個(gè)用戶自定義的腳本，定期檢查Nginx進(jìn)程狀態(tài)，進(jìn)行權(quán)重變化,，從而實(shí)現(xiàn)Nginx故障切換）

Keepalived+Nginx

Nginx架構(gòu)及工作流程圖：

Nginx架構(gòu)及工作流程圖

Nginx真正處理請求業(yè)務(wù)的是Worker之下的線程。worker進(jìn)程中有一個(gè)ngx_worker_process_cycle()函數(shù)，執(zhí)行無限循環(huán)，不斷處理收到的來自客戶端的請求，并進(jìn)行處理，直到整個(gè)Nginx服務(wù)被停止。

worker 進(jìn)程中，ngx_worker_process_cycle()函數(shù)就是這個(gè)無限循環(huán)的處理函數(shù)。在這個(gè)函數(shù)中，一個(gè)請求的簡單處理流程如下：

操作系統(tǒng)提供的機(jī)制（例如 epoll, kqueue 等）產(chǎn)生相關(guān)的事件。
接收和處理這些事件，如是接收到數(shù)據(jù)，則產(chǎn)生更高層的 request 對象。
處理 request 的 header 和 body。
產(chǎn)生響應(yīng)，并發(fā)送回客戶端。
完成 request 的處理。
重新初始化定時(shí)器及其他事件。

3.1 多進(jìn)程處理模型

下面來介紹一個(gè)請求進(jìn)來，多進(jìn)程模型的處理方式：

首先，master進(jìn)程一開始就會根據(jù)我們的配置，來建立需要listen的網(wǎng)絡(luò)socket fd，然后fork出多個(gè)worker進(jìn)程。
其次，根據(jù)進(jìn)程的特性，新建立的worker進(jìn)程，也會和master進(jìn)程一樣，具有相同的設(shè)置。因此，其也會去監(jiān)聽相同ip端口的套接字socket fd。
然后，這個(gè)時(shí)候有多個(gè)worker進(jìn)程都在監(jiān)聽同樣設(shè)置的socket fd，意味著當(dāng)有一個(gè)請求進(jìn)來的時(shí)候，所有的worker都會感知到。這樣就會產(chǎn)生所謂的“驚群現(xiàn)象”。為了保證只會有一個(gè)進(jìn)程成功注冊到listenfd的讀事件，nginx中實(shí)現(xiàn)了一個(gè)“accept_mutex”類似互斥鎖，只有獲取到這個(gè)鎖的進(jìn)程，才可以去注冊讀事件。其他進(jìn)程全部accept 失敗。
最后，監(jiān)聽成功的worker進(jìn)程，讀取請求，解析處理，響應(yīng)數(shù)據(jù)返回給客戶端，斷開連接，結(jié)束。因此，一個(gè)request請求，只需要worker進(jìn)程就可以完成。

進(jìn)程模型的處理方式帶來的一些好處就是：進(jìn)程之間是獨(dú)立的，也就是一個(gè)worker進(jìn)程出現(xiàn)異常退出，其他worker進(jìn)程是不會受到影響的；此外，獨(dú)立進(jìn)程也會避免一些不需要的鎖操作，這樣子會提高處理效率，并且開發(fā)調(diào)試也更容易。

如前文所述，多進(jìn)程模型+異步非阻塞模型才是勝出的方案。單純的多進(jìn)程模型會導(dǎo)致連接并發(fā)數(shù)量的降低，而采用異步非阻塞IO模型很好的解決了這個(gè)問題；并且還因此避免的多線程的上下文切換導(dǎo)致的性能損失。

worker進(jìn)程會競爭監(jiān)聽客戶端的連接請求：這種方式可能會帶來一個(gè)問題，就是可能所有的請求都被一個(gè)worker進(jìn)程給競爭獲取了，導(dǎo)致其他進(jìn)程都比較空閑，而某一個(gè)進(jìn)程會處于忙碌的狀態(tài)，這種狀態(tài)可能還會導(dǎo)致無法及時(shí)響應(yīng)連接而丟棄discard掉本有能力處理的請求。這種不公平的現(xiàn)象，是需要避免的，尤其是在高可靠web服務(wù)器環(huán)境下。

針對這種現(xiàn)象，Nginx采用了一個(gè)是否打開accept_mutex選項(xiàng)的值，ngx_accept_disabled標(biāo)識控制一個(gè)worker進(jìn)程是否需要去競爭獲取accept_mutex選項(xiàng)，進(jìn)而獲取accept事件。

ngx_accept_disabled值：nginx單進(jìn)程的所有連接總數(shù)的八分之一，減去剩下的空閑連接數(shù)量，得到的這個(gè)ngx_accept_disabled。
當(dāng)ngx_accept_disabled大于0時(shí)，不會去嘗試獲取accept_mutex鎖，并且將ngx_accept_disabled減1，于是，每次執(zhí)行到此處時(shí)，都會去減1，直到小于0。不去獲取accept_mutex鎖，就是等于讓出獲取連接的機(jī)會，很顯然可以看出，當(dāng)空閑連接越少時(shí)，ngx_accept_disable越大，于是讓出的機(jī)會就越多，這樣其它進(jìn)程獲取鎖的機(jī)會也就越大。不去accept，自己的連接就控制下來了，其它進(jìn)程的連接池就會得到利用，這樣，nginx就控制了多進(jìn)程間連接的平衡了。

3.2 一個(gè)簡單的HTTP請求

從 Nginx 的內(nèi)部來看，一個(gè) HTTP Request 的處理過程涉及到以下幾個(gè)階段：

初始化 HTTP Request（讀取來自客戶端的數(shù)據(jù)，生成 HTTP Request 對象，該對象含有該請求所有的信息）。
處理請求頭。
處理請求體。
如果有的話，調(diào)用與此請求（URL 或者 Location）關(guān)聯(lián)的 handler。
依次調(diào)用各 phase handler 進(jìn)行處理。

在建立連接過程中，對于nginx監(jiān)聽到的每個(gè)客戶端連接，都會將它的讀事件的handler設(shè)置為ngx_http_init_request函數(shù)，這個(gè)函數(shù)就是請求處理的入口。在處理請求時(shí)，主要就是要解析http請求，比如：uri，請求行等，然后再根據(jù)請求生成響應(yīng)。下面看一下nginx處理的具體過程：

Nginx處理的具體過程

在這里，我們需要了解一下 phase handler 這個(gè)概念。phase 字面的意思，就是階段。所以 phase handlers 也就好理解了，就是包含若干個(gè)處理階段的一些 handler。

在每一個(gè)階段，包含有若干個(gè) handler，再處理到某個(gè)階段的時(shí)候，依次調(diào)用該階段的 handler 對 HTTP Request 進(jìn)行處理。

通常情況下，一個(gè) phase handler 對這個(gè) request 進(jìn)行處理，并產(chǎn)生一些輸出。通常 phase handler 是與定義在配置文件中的某個(gè) location 相關(guān)聯(lián)的。

一個(gè) phase handler 通常執(zhí)行以下幾項(xiàng)任務(wù)：

獲取 location 配置。
產(chǎn)生適當(dāng)?shù)捻憫?yīng)。
發(fā)送 response header。
發(fā)送 response body。

當(dāng) Nginx 讀取到一個(gè) HTTP Request 的 header 的時(shí)候，Nginx 首先查找與這個(gè)請求關(guān)聯(lián)的虛擬主機(jī)的配置。如果找到了這個(gè)虛擬主機(jī)的配置，那么通常情況下，這個(gè) HTTP Request 將會經(jīng)過以下幾個(gè)階段的處理（phase handlers）：

NGX_HTTP_POST_READ_PHASE: 讀取請求內(nèi)容階段
NGX_HTTP_SERVER_REWRITE_PHASE: Server 請求地址重寫階段
NGX_HTTP_FIND_CONFIG_PHASE: 配置查找階段
NGX_HTTP_REWRITE_PHASE: Location請求地址重寫階段
NGX_HTTP_POST_REWRITE_PHASE: 請求地址重寫提交階段
NGX_HTTP_PREACCESS_PHASE: 訪問權(quán)限檢查準(zhǔn)備階段
NGX_HTTP_ACCESS_PHASE: 訪問權(quán)限檢查階段
NGX_HTTP_POST_ACCESS_PHASE: 訪問權(quán)限檢查提交階段
NGX_HTTP_TRY_FILES_PHASE: 配置項(xiàng) try_files 處理階段
NGX_HTTP_CONTENT_PHASE: 內(nèi)容產(chǎn)生階段
NGX_HTTP_LOG_PHASE: 日志模塊處理階段

在內(nèi)容產(chǎn)生階段，為了給一個(gè) request 產(chǎn)生正確的響應(yīng)，Nginx 必須把這個(gè) request 交給一個(gè)合適的 content handler 去處理。如果這個(gè) request 對應(yīng)的 location 在配置文件中被明確指定了一個(gè) content handler，那么Nginx 就可以通過對 location 的匹配，直接找到這個(gè)對應(yīng)的 handler，并把這個(gè) request 交給這個(gè) content handler 去處理。這樣的配置指令包括像，perl，flv，proxy_pass，mp4等。

如果一個(gè) request 對應(yīng)的 location 并沒有直接有配置的 content handler，那么 Nginx 依次嘗試：

如果一個(gè) location 里面有配置 random_index on，那么隨機(jī)選擇一個(gè)文件，發(fā)送給客戶端。
如果一個(gè) location 里面有配置 index 指令，那么發(fā)送 index 指令指明的文件，給客戶端。
如果一個(gè) location 里面有配置 autoindex on，那么就發(fā)送請求地址對應(yīng)的服務(wù)端路徑下的文件列表給客戶端。
如果這個(gè) request 對應(yīng)的 location 上有設(shè)置 gzip_static on，那么就查找是否有對應(yīng)的.gz文件存在，有的話，就發(fā)送這個(gè)給客戶端（客戶端支持 gzip 的情況下）。
請求的 URI 如果對應(yīng)一個(gè)靜態(tài)文件，static module 就發(fā)送靜態(tài)文件的內(nèi)容到客戶端。

內(nèi)容產(chǎn)生階段完成以后，生成的輸出會被傳遞到 filter 模塊去進(jìn)行處理。filter 模塊也是與 location 相關(guān)的。所有的 filter 模塊都被組織成一條鏈。輸出會依次穿越所有的 filter，直到有一個(gè) filter 模塊的返回值表明已經(jīng)處理完成。

這里列舉幾個(gè)常見的 filter 模塊，例如：

server-side includes。
XSLT filtering。
圖像縮放之類的。
gzip 壓縮。

在所有的 filter 中，有幾個(gè) filter 模塊需要關(guān)注一下。按照調(diào)用的順序依次說明如下：

copy: 將一些需要復(fù)制的 buf(文件或者內(nèi)存)重新復(fù)制一份然后交給剩余的 body filter 處理。
postpone: 這個(gè) filter 是負(fù)責(zé) subrequest 的，也就是子請求的。
write: 寫輸出到客戶端，實(shí)際上是寫到連接對應(yīng)的 socket 上。

3.3 請求完整處理過程

根據(jù)以上請求步驟所述，請求完整的處理過程如下圖所示：

請求完整的處理過程

3.4 keepalive 長連接

當(dāng)然，在nginx中，對于http1.0與http1.1也是支持長連接的。

什么是長連接呢？我們知道，http請求是基于TCP協(xié)議之上的，那么，當(dāng)客戶端在發(fā)起請求前，需要先與服務(wù)端建立TCP連接，而每一次的TCP連接是需要三次握手來確定的，如果客戶端與服務(wù)端之間網(wǎng)絡(luò)差一點(diǎn)，這三次交互消費(fèi)的時(shí)間會比較多，而且三次交互也會帶來網(wǎng)絡(luò)流量。當(dāng)然，當(dāng)連接斷開后，也會有四次的交互，當(dāng)然對用戶體驗(yàn)來說就不重要了。而http請求是請求應(yīng)答式的，如果我們能知道每個(gè)請求頭與響應(yīng)體的長度，那么我們是可以在一個(gè)連接上面執(zhí)行多個(gè)請求的，這就是所謂的長連接，但前提條件是我們先得確定請求頭與響應(yīng)體的長度。

對于請求來說，如果當(dāng)前請求需要有body，如POST請求，那么nginx就需要客戶端在請求頭中指定content-length來表明body的大小，否則返回400錯(cuò)誤。也就是說，請求體的長度是確定的，那么響應(yīng)體的長度呢？先來看看http協(xié)議中關(guān)于響應(yīng)body長度的確定：

對于http1.0協(xié)議來說，如果響應(yīng)頭中有content-length頭，則以content-length的長度就可以知道body的長度了，客戶端在接收body時(shí)，就可以依照這個(gè)長度來接收數(shù)據(jù)，接收完后，就表示這個(gè)請求完成了。而如果沒有content-length頭，則客戶端會一直接收數(shù)據(jù)，直到服務(wù)端主動(dòng)斷開連接，才表示body接收完了。
而對于http1.1協(xié)議來說，如果響應(yīng)頭中的Transfer-encoding為chunked傳輸，則表示body是流式輸出，body會被分成多個(gè)塊，每塊的開始會標(biāo)識出當(dāng)前塊的長度，此時(shí)，body不需要通過長度來指定。如果是非chunked傳輸，而且有content-length，則按照content-length來接收數(shù)據(jù)。否則，如果是非chunked，并且沒有content-length，則客戶端接收數(shù)據(jù)，直到服務(wù)端主動(dòng)斷開連接。

從上面，我們可以看到，除了http1.0不帶content-length以及http1.1非chunked不帶content-length外，body的長度是可知的。此時(shí)，當(dāng)服務(wù)端在輸出完body之后，會可以考慮使用長連接。能否使用長連接，也是有條件限制的。如果客戶端的請求頭中的connection為close，則表示客戶端需要關(guān)掉長連接，如果為keep-alive，則客戶端需要打開長連接，如果客戶端的請求中沒有connection這個(gè)頭，那么根據(jù)協(xié)議，如果是http1.0，則默認(rèn)為close，如果是http1.1，則默認(rèn)為keep-alive。如果結(jié)果為keepalive，那么，nginx在輸出完響應(yīng)體后，會設(shè)置當(dāng)前連接的keepalive屬性，然后等待客戶端下一次請求。

當(dāng)然，nginx不可能一直等待下去，如果客戶端一直不發(fā)數(shù)據(jù)過來，豈不是一直占用這個(gè)連接？所以當(dāng)nginx設(shè)置了keepalive等待下一次的請求時(shí)，同時(shí)也會設(shè)置一個(gè)大等待時(shí)間，這個(gè)時(shí)間是通過選項(xiàng)keepalive_timeout來配置的，如果配置為0，則表示關(guān)掉keepalive，此時(shí)，http版本無論是1.1還是1.0，客戶端的connection不管是close還是keepalive，都會強(qiáng)制為close。

如果服務(wù)端最后的決定是keepalive打開，那么在響應(yīng)的http頭里面，也會包含有connection頭域，其值是”Keep-Alive”，否則就是”Close”。如果connection值為close，那么在nginx響應(yīng)完數(shù)據(jù)后，會主動(dòng)關(guān)掉連接。所以，對于請求量比較大的nginx來說，關(guān)掉keepalive最后會產(chǎn)生比較多的time-wait狀態(tài)的socket。一般來說，當(dāng)客戶端的一次訪問，需要多次訪問同一個(gè)server時(shí)，打開keepalive的優(yōu)勢非常大，比如圖片服務(wù)器，通常一個(gè)網(wǎng)頁會包含很多個(gè)圖片。打開keepalive也會大量減少time-wait的數(shù)量。

網(wǎng)站標(biāo)題：Nginx常見工作原理及應(yīng)用
當(dāng)前URL：http://www.bm7419.com/news/99664.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián)，為您提供動(dòng)態(tài)網(wǎng)站、軟件開發(fā)、企業(yè)建站、品牌網(wǎng)站制作、Google、網(wǎng)站內(nèi)鏈

聲明：本網(wǎng)站發(fā)布的內(nèi)容（圖片、視頻和文字）以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主，如果涉及侵權(quán)請盡快告知，我們將會在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場，如需處理請聯(lián)系客服。電話：028-86922220；郵箱：631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載，或轉(zhuǎn)載時(shí)需注明來源：創(chuàng)新互聯(lián)

猜你還喜歡下面的內(nèi)容

全球過半的網(wǎng)站已部署HTTPS，網(wǎng)絡(luò)安全全面升級 2021-02-07
Chrome的未來還會有cookie嗎？ 2021-02-07
適合企業(yè)的系統(tǒng)是OA、ERP 還是CRM？ 2021-02-07
不同行業(yè)CRM應(yīng)用解讀：如何用好CRM這個(gè)工具 2021-02-07
中小型新零售電商的機(jī)會只有一條 2021-02-07
云計(jì)算如何改變世界 2021-02-07
百度搜索資源平臺將在6月30日下線MIP Cache服務(wù) 2021-02-07
小程序+公眾號+社群將助力社交新零售崛起 2021-02-07