CPU緩存和內(nèi)存屏障

CPU性能優(yōu)化手段-緩存

為了提高程序運(yùn)行的性能，現(xiàn)代CPU在很多方面對程序進(jìn)行了優(yōu)化。
例如：CPU高速緩存。盡可能地避免處理器訪問主內(nèi)存的時間開銷，處理器大多會利用緩存(cache)以提高性能。

創(chuàng)新互聯(lián)建站主營池州網(wǎng)站建設(shè)的網(wǎng)絡(luò)公司,主營網(wǎng)站建設(shè)方案,app軟件開發(fā),池州h5小程序設(shè)計搭建,池州網(wǎng)站營銷推廣歡迎池州等地區(qū)企業(yè)咨詢

CPU緩存和內(nèi)存屏障 cdn.xitu.io/2019/8/28/16cd87cafcc2740a?w=1440&h=384&f=png&s=91896">

多級緩存

L1 Cache(一級緩存)是CPU第一層高速緩存，分為數(shù)據(jù)緩存和指令緩存。一般服務(wù)器CPU的L1緩存的容量通常在32-4096KB。

L2由于L1級高速緩存容量的限制，為了再次提高CPU的運(yùn)算速度，在CPU外部放置-高速存儲器，即二級緩存。

L3現(xiàn)在的都是內(nèi)置的。而它的實(shí)際作用即是，L3緩存的應(yīng)用可以進(jìn)一步降低內(nèi)存延遲，同時提升大數(shù)據(jù)量計算時處理器的性能。具有較大L3緩存的處理器提供更有效的文件系統(tǒng)緩存行為及較短消息和處理器隊列長度。一般是多核共享一個L3緩存！

CPU在讀取數(shù)據(jù)時，先在L1中尋找，再從L2尋找，再從L3尋找，然后是內(nèi)存，再后是外存儲器。

緩存同步協(xié)議

多CPU讀取同樣的數(shù)據(jù)進(jìn)行緩存，進(jìn)行不同運(yùn)算之后，最終寫入主內(nèi)存以哪個CPU為準(zhǔn)？

在這種高速緩存回寫的場景下，有一個緩存一致性協(xié)議多數(shù)CPU廠商對它進(jìn)行了實(shí)現(xiàn)。

MESI協(xié)議，它規(guī)定每條緩存有個狀態(tài)位，同時定義了下面四個狀態(tài)：

修改態(tài)(Modified)-此cache行已被修改過(臟行),內(nèi)容已不同于主存，為此cache專有；
專有態(tài)(Exclusive)-此cache行內(nèi)容同于主存，但不出現(xiàn)于其它c(diǎn)ache中；
共享態(tài)(Shared)-此cache行內(nèi)容同于主存，但也出現(xiàn)于其它c(diǎn)ache中；
無效態(tài)(Invalid)-此cache行內(nèi)容無效(空行)。

多處理器，單個CPU對緩存中數(shù)據(jù)進(jìn)行了改動，需要通知給其它CPU。也就是意味著，CPU處理要控制自己的讀寫操作，還要監(jiān)聽其他CPU發(fā)出的通知，從而保證最終一致。

CPU性能優(yōu)化手段-運(yùn)行時指令重排

CPU緩存和內(nèi)存屏障

指令重排的場景：當(dāng)CPU寫緩存時發(fā)現(xiàn)緩存區(qū)塊正被其他CPU占用，為了提高CPU處理性能，可能將后面的讀緩存命令優(yōu)先執(zhí)行。

并非隨便重排，需要遵守as-if-serial語義

as-if-serial語義的意思指：不管怎么重排序(編譯器和處理器為了提高并行度)，(單線程）程序的執(zhí)行結(jié)果不能被改變。編譯器，runtime和處理器都必須遵守as-if-serial語義。也就是說：編譯器和處理器不會對存在數(shù)據(jù)依賴關(guān)系的操作做重排序。

兩個問題

1、CPU高速緩存下有一個問題：

緩存中數(shù)據(jù)與主內(nèi)存的數(shù)據(jù)并不是實(shí)時同步的，各CPU(或CPU核心)間緩存的數(shù)據(jù)也不是實(shí)時同步。

在同一個時間點(diǎn)，各CPU所看到同一內(nèi)存地址的數(shù)據(jù)的值可能是不一致的。

2、CPU執(zhí)行指令重排序優(yōu)化下有一個問題：

雖然遵守了as-if-serial語義，單僅在單CPU自己執(zhí)行的情況下能保證結(jié)果正確。多核多線程中，指令邏輯無法分辨因果關(guān)聯(lián)，可能出現(xiàn)亂序執(zhí)行，導(dǎo)致程序運(yùn)行結(jié)果錯誤。

內(nèi)存屏障

處理器提供了兩個內(nèi)存屏障指令(Memory Barrier)用于解決上述兩個問題：

寫內(nèi)存屏障(Store Memory Barrier):在指令后插入Store Barrier,能讓寫入緩存中的最新數(shù)據(jù)更新寫入主內(nèi)存，讓其他線程可見。強(qiáng)制寫入主內(nèi)存，這種顯示調(diào)用，CPU就不會因為性能考慮而去對指令重排。

讀內(nèi)存屏障(Load Memory Barrier):在指令前插入Load Barrier,可以讓高速緩存中的數(shù)據(jù)失效，強(qiáng)制從主內(nèi)存加載數(shù)據(jù)。強(qiáng)制讀取主內(nèi)存內(nèi)容，讓CPU緩存與主內(nèi)存保持一致，避免了緩存導(dǎo)致的一致性問題。

CPU緩存和內(nèi)存屏障

分享題目：CPU緩存和內(nèi)存屏障
文章鏈接：http://bm7419.com/article14/gijege.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián)，為您提供App開發(fā)、營銷型網(wǎng)站建設(shè)、品牌網(wǎng)站制作、網(wǎng)站營銷、做網(wǎng)站、手機(jī)網(wǎng)站建設(shè)

聲明：本網(wǎng)站發(fā)布的內(nèi)容（圖片、視頻和文字）以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主，如果涉及侵權(quán)請盡快告知，我們將會在第一時間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場，如需處理請聯(lián)系客服。電話：028-86922220；郵箱：631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載，或轉(zhuǎn)載時需注明來源：創(chuàng)新互聯(lián)

猜你還喜歡下面的內(nèi)容