TCP/IP是如何工作的

2021-01-29    分類: 網(wǎng)站建設(shè)

互聯(lián)網(wǎng)是人類歷史上最偉大的發(fā)明創(chuàng)造之一,而構(gòu)成互聯(lián)網(wǎng)架構(gòu)的核心在于TCP/IP協(xié)議。那么TCP/IP是如何工作的呢,我們先從數(shù)據(jù)包開始講起。

1、數(shù)據(jù)包

一、HTTP請(qǐng)求和響應(yīng)步驟


http請(qǐng)求全過程


請(qǐng)求


響應(yīng)

以上完整表示了HTTP請(qǐng)求和響應(yīng)的7個(gè)步驟,下面從TCP/IP協(xié)議模型的角度來理解HTTP請(qǐng)求和響應(yīng)如何傳遞的。

2、TCP/IP概述

我們以RFC 1180中的圖作為參考


上圖展示了四層TCP/IP協(xié)議圖,其中network applications是應(yīng)用程序,屬于應(yīng)用層;TCP和UDP主要是傳輸數(shù)據(jù),屬于傳輸層,TCP確保端對(duì)端的可靠傳輸并盡量確保網(wǎng)絡(luò)健康運(yùn)行,而UDP是簡(jiǎn)單不可靠傳輸;IP主要解決路由問題,屬于網(wǎng)絡(luò)層;ARP是網(wǎng)絡(luò)地址轉(zhuǎn)換,主要用來轉(zhuǎn)換IP地址和MAC地址,介于數(shù)據(jù)鏈路層和網(wǎng)絡(luò)層之間,可以看成2.5層;ENET在這里是數(shù)據(jù)鏈路層,網(wǎng)卡驅(qū)動(dòng)屬于這一層,主要做具體的介質(zhì)傳輸,前面示例中的廣告請(qǐng)求抓包就是在數(shù)據(jù)鏈路層抓取。

值得注意的是,ARP在linux系統(tǒng)里屬于網(wǎng)絡(luò)層,而在RFC里是介于數(shù)據(jù)鏈路層和網(wǎng)絡(luò)層之間。在《TCP/IP詳解》一書里,ARP被放到了數(shù)據(jù)鏈路層。當(dāng)解決實(shí)際問題的時(shí)候,我們應(yīng)該把ARP放到網(wǎng)絡(luò)層。


上圖給出使用TCPCopy在不同層發(fā)包的使用方法。如果TCPCopy從數(shù)據(jù)鏈路層發(fā)包,由于沒有享受到ARP服務(wù),用戶需要在使用TCPCopy的時(shí)候額外加上MAC地址;而如果TCPCopy從IP層發(fā)包,則無需指定MAC地址。

本課程主要講述TCP相關(guān)案例,沒有特殊說明的話,TCP特指?jìng)鬏攲拥腡CP。

3、什么是TCP

TCP即傳輸控制協(xié)議,是一種面向連接的、可靠的、基于字節(jié)流的通信協(xié)議。TCP的主要工作是定義端口標(biāo)識(shí)應(yīng)用程序的身份,實(shí)現(xiàn)端對(duì)端的可靠通信,并進(jìn)行擁塞控制,防止互聯(lián)網(wǎng)崩塌。

TCP有如下關(guān)鍵特性:


由于TCP是面向連接的協(xié)議,所以是一種有狀態(tài)的協(xié)議,而有狀態(tài)的協(xié)議往往比較復(fù)雜,因此TCP學(xué)習(xí)起來也比較困難。

通過狀態(tài)圖來查看一下TCP狀態(tài)的復(fù)雜性:


上圖展示了錯(cuò)綜復(fù)雜的TCP狀態(tài)圖,然而現(xiàn)實(shí)更加復(fù)雜。

現(xiàn)實(shí)中的TCP狀態(tài)圖其實(shí)是這樣的:


圖中,不僅SYN_RCVD狀態(tài)能夠收到reset數(shù)據(jù)包(圖中RST,reset數(shù)據(jù)包是重置連接的數(shù)據(jù)包,可以使TCP狀態(tài)瞬間變?yōu)镃LOSED狀態(tài),而CLOSED狀態(tài)是無法追蹤的),而且FIN_WAIT1、FIN_WAIT2、ESTABLISHED、SYN_SENT和CLOSE_WAIT都能被reset數(shù)據(jù)包打回到CLOSED狀態(tài)。不僅如此,TCP狀態(tài)還受到超時(shí)的影響。例如Linux系統(tǒng),一旦連接處于FIN_WAIT_2,在60秒內(nèi)(默認(rèn))如果沒有接收到對(duì)端的FIN數(shù)據(jù)包,系統(tǒng)會(huì)把此連接狀態(tài)FIN_WAIT_2直接變到CLOSED狀態(tài)。雖然Linux這樣做是為了防止攻擊,但這種超時(shí)就干掉連接狀態(tài)的做法,很可能誤殺了很多正常連接,從而使問題更加捉摸不定。

在互聯(lián)網(wǎng)領(lǐng)域,很多詭異的問題跟TCP狀態(tài)有關(guān)系,課程后續(xù)會(huì)有較多案例來講述這些靈異問題。

4、端口

當(dāng)我們?nèi)ミB接服務(wù)器程序時(shí),需要指明服務(wù)器端口。為什么需要端口呢?因?yàn)橄到y(tǒng)是通過端口來區(qū)分不同應(yīng)用程序,TCP通過端口找到上層應(yīng)用。

需要注意的是,端口號(hào)是有限的,端口號(hào)大為65535,能夠利用的端口數(shù)量隨配置而定。例如在壓力測(cè)試過程中,一臺(tái)機(jī)器可以利用的TCP端口是有限的,能夠利用的連接(客戶端端口,客戶端IP,服務(wù)器應(yīng)用端口,服務(wù)器IP地址)是有限的。為了解決這個(gè)問題,可以配置多IP地址來擴(kuò)大可用連接數(shù)量。系統(tǒng)支持同一個(gè)端口,不同的IP地址來綁定不同的應(yīng)用。Linux高版本系統(tǒng)下,在綁定同一個(gè)IP地址的情況下,我們還可以利用REUSEPORT機(jī)制使不同應(yīng)用程序共享同一個(gè)監(jiān)聽端口,這對(duì)高性能服務(wù)器開發(fā)是非常有用的。我們開發(fā)的數(shù)據(jù)庫中間件cetus就利用這個(gè)機(jī)制來解決短鏈接風(fēng)暴的問題。

5、IP

網(wǎng)絡(luò)層的主要工作是定義網(wǎng)絡(luò)地址,區(qū)分網(wǎng)段,子網(wǎng)內(nèi)MAC尋址,對(duì)不同子網(wǎng)的數(shù)據(jù)包進(jìn)行路由。IP的主要作用就是在復(fù)雜的網(wǎng)絡(luò)環(huán)境中將數(shù)據(jù)包發(fā)給最終的目標(biāo)地址。

IP是面向無連接的,是無狀態(tài)的協(xié)議。IP為什么被設(shè)計(jì)成無狀態(tài)呢?

1. 無狀態(tài)協(xié)議處理簡(jiǎn)單

2. 通信之前無需建立連接

3. TCP已經(jīng)面向連接服務(wù)了,IP層可以委托TCP來解決面向連接的問題

4. 由于不帶有狀態(tài),互聯(lián)網(wǎng)路由起來更加自由,容錯(cuò)性也更強(qiáng)

值得注意的是,現(xiàn)實(shí)中的IP層往往都帶有安全過濾,甚至有些路由器,防火墻等中途設(shè)備還會(huì)干涉應(yīng)用(例如通過reset數(shù)據(jù)包來干涉TCP會(huì)話),為了更好的做安全檢測(cè),IP層還增加了connection tracking,在無狀態(tài)協(xié)議上面來追蹤上層連接。這種方式提高了安全性,但有時(shí)也會(huì)帶來新的問題,我們后面有案例具體講述connnection tracking帶來的坑的故事。

6、TCP Socket

應(yīng)用程序通過TCP socket接口來調(diào)用TCP服務(wù),從而達(dá)到傳遞數(shù)據(jù)的目的。每一個(gè)TCP socket會(huì)被綁定到一個(gè)端口,TCP socket雙向都可以通信,在發(fā)送數(shù)據(jù)的同時(shí),還可以接收數(shù)據(jù)。

值得注意的是,應(yīng)用程序發(fā)送完數(shù)據(jù),只代表通過TCP socket委托給TCP的工作已經(jīng)完成,不代表發(fā)送給對(duì)端完畢,應(yīng)用發(fā)送數(shù)據(jù)和TCP傳輸數(shù)據(jù)不是同步的。

7、How TCP/IP Works

當(dāng)用戶通過TCP socket接口發(fā)送請(qǐng)求后,TCP協(xié)議模塊接管了請(qǐng)求傳遞,TCP先把請(qǐng)求拆分成一個(gè)個(gè)更小的數(shù)據(jù)分段(假設(shè)TCP offload沒有開啟的情況下),通過IP層發(fā)送出去。在IP層,這些數(shù)據(jù)分段會(huì)被封裝成IP數(shù)據(jù)包,通過數(shù)據(jù)鏈路層發(fā)送給互聯(lián)網(wǎng)(見下圖)。這些數(shù)據(jù)包經(jīng)過互聯(lián)網(wǎng)的多個(gè)路由器到達(dá)目的地。由于IP網(wǎng)絡(luò)是無狀態(tài)的協(xié)議,每一個(gè)數(shù)據(jù)包走的路徑可能不一樣,而且到達(dá)的順序也有可能不一樣,這就要求對(duì)端的TCP需要重新組裝數(shù)據(jù)包,以確保向應(yīng)用層傳遞的數(shù)據(jù)是用戶能夠識(shí)別的用戶請(qǐng)求,這樣服務(wù)器應(yīng)用程序就可以處理用戶發(fā)起的請(qǐng)求了。


下圖中,假設(shè)用戶請(qǐng)求拆分成兩個(gè)IP數(shù)據(jù)包


第一個(gè)IP數(shù)據(jù)包可能經(jīng)過A,B,C,G,如下圖。


第二個(gè)數(shù)據(jù)包可能經(jīng)過A,B,E,G(在B點(diǎn)選擇了E節(jié)點(diǎn),導(dǎo)致路徑不同),如下圖。


導(dǎo)致數(shù)據(jù)包在B節(jié)點(diǎn)走向不同路徑的原因可能有很多種,例如C節(jié)點(diǎn)暫時(shí)不如E節(jié)點(diǎn)通暢或者臨時(shí)發(fā)生了網(wǎng)絡(luò)擁塞,這與在高速道路駕駛的原理差不多。

由于網(wǎng)絡(luò)環(huán)境多變,還可能第二個(gè)數(shù)據(jù)包先到達(dá)服務(wù)器,這時(shí)TCP會(huì)負(fù)責(zé)處理out of order的情況;如果網(wǎng)絡(luò)傳遞過程中,某一個(gè)路由器由于過于繁忙,把第一個(gè)數(shù)據(jù)包丟了,那么客戶端的TCP會(huì)負(fù)責(zé)重傳第一個(gè)數(shù)據(jù)包,確保服務(wù)器端的TCP能夠不會(huì)因?yàn)閬G包而收不到第一個(gè)數(shù)據(jù)包。

如果用戶請(qǐng)求內(nèi)容很大,如上傳一個(gè)大文件,就會(huì)被拆分成大量數(shù)據(jù)分段,而TCP傳輸這些數(shù)據(jù)分段的時(shí)候,往往還會(huì)考慮整個(gè)互聯(lián)網(wǎng)能夠接收的程度和對(duì)方能夠接收的程度,發(fā)送數(shù)據(jù)過于貪婪不僅會(huì)連累整個(gè)互聯(lián)網(wǎng),對(duì)方也未必能夠接收得了,而且還可能使自己速度更慢,這有點(diǎn)像道路駕駛一樣,不能過于自私,遵守一定的交通規(guī)則才能使道路通暢。在互聯(lián)網(wǎng)傳輸數(shù)據(jù)方面,這些交通規(guī)則算法就是赫赫有名的網(wǎng)絡(luò)擁塞控制算法,而對(duì)方能否接收得了,則通過發(fā)送窗口的方式進(jìn)行控制??傮w來說,一次發(fā)送數(shù)據(jù)的大小是根據(jù)對(duì)方的接收窗口大小和擁塞控制算法來綜合決定的。

從上面可以看出,IP負(fù)責(zé)在互聯(lián)網(wǎng)傳輸數(shù)據(jù),而TCP負(fù)責(zé)數(shù)據(jù)傳輸可靠并且盡量使網(wǎng)絡(luò)健康運(yùn)行,兩者合作完成了請(qǐng)求的傳遞,這也是互聯(lián)網(wǎng)應(yīng)用工作的普遍方式。

需要注意的是,TCP負(fù)責(zé)跟TCP進(jìn)行交互,應(yīng)用層無需去實(shí)現(xiàn)TCP的功能,只需要委托給TCP來完成數(shù)據(jù)傳輸,這種隔離的方式給應(yīng)用層的開發(fā)/運(yùn)維/測(cè)試帶來了方便,另外,當(dāng)出現(xiàn)TCP相關(guān)問題時(shí),解決問題的難度也大大增加。

8、TCP經(jīng)驗(yàn)知識(shí)

在多年實(shí)戰(zhàn)過程中,我們發(fā)現(xiàn)以下TCP經(jīng)驗(yàn)對(duì)工作很有幫助??偨Y(jié)如下:

1. 距離越遠(yuǎn),延遲越大,重傳概率越大

2. 網(wǎng)絡(luò)狀況好壞,直接影響應(yīng)用程序性能

3. 不同環(huán)境,采用不同的擁塞算法

4. 擁塞控制算法是互聯(lián)網(wǎng)的精華,是互聯(lián)網(wǎng)大獲成功的關(guān)鍵因素之一

5. TCP是有狀態(tài)協(xié)議,采用異步處理

6. 抓包分析是找到TCP相關(guān)問題根本原因的利器

7. TCP客戶端和TCP服務(wù)器端之間的交互,是應(yīng)用層所有應(yīng)用公共的交互部分,理解了這部分原理,可以解決大量TCP相關(guān)問題。

9、IP經(jīng)驗(yàn)知識(shí)

在IP經(jīng)驗(yàn)知識(shí)方面,我們大致總結(jié)如下:

1. 數(shù)據(jù)包選擇路徑不是固定的,到達(dá)的順序也可能是亂序的

2. 安全過濾,坑多的地方

3. 無狀態(tài)協(xié)議,簡(jiǎn)化互聯(lián)網(wǎng)架構(gòu),是互聯(lián)網(wǎng)大獲成功的關(guān)鍵因素之一

4. IP層對(duì)TCP傳遞過來的數(shù)據(jù)包很少分片處理

5. 中途設(shè)備不僅僅具備路由功能,而且還會(huì)干涉TCP會(huì)話(靈異問題的溫床)

10、結(jié)束語

TCP/IP網(wǎng)絡(luò)是互聯(lián)網(wǎng)的基石,了解TCP/IP是如何工作的,對(duì)于我們解決問題是非常有幫助的。

文章名稱:TCP/IP是如何工作的
網(wǎng)頁地址:http://www.bm7419.com/news40/98090.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站內(nèi)鏈微信公眾號(hào)網(wǎng)頁設(shè)計(jì)公司、品牌網(wǎng)站建設(shè)服務(wù)器托管、電子商務(wù)

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)

商城網(wǎng)站建設(shè)