輕松搞定Java內存泄漏(轉)

輕松搞定Java內存泄漏(轉)[@more@] 抽象

  盡管java虛擬機和垃圾回收機制管理著大部分的內存事務,但是在java軟件中還是可能存在內存泄漏的情況。的確,在大型工程中,內存泄漏是一個普遍問題。避免內存泄漏的第一步,就是要了解他們發(fā)生的原因。這篇文章就是要介紹一些常見的缺陷,然后提供一些非常好的實踐例子來指導你寫出沒有內存泄漏的代碼。一旦你的程序存在內存泄漏,要查明代碼中引起泄漏的原因是很困難的。同時這篇文章也要介紹一個新的工具來查找內存泄漏,然后指明發(fā)生的根本原因。這個工具容易上手,可以讓你找到產品級系統中的內存泄漏。

  垃圾回收(GC)的角色

  雖然垃圾回收關心著大部分的問題,包括內存管理,使得程序員的任務顯得更加輕松,但是程序員還是可能犯些錯誤導致內存泄漏問題。GC(垃圾回收)通過遞歸對所有從"根"對象(堆棧中的對象,靜態(tài)數據成員,JNI句柄等等)繼承下來的引用進行工作,然后標記所有可以訪問的活著的對象。而這些對象變成了程序唯一能夠操縱的對象,其他的對象都被釋放了。因為GC使得程序不能夠訪問那些被釋放的對象,所以這樣做是安全的。

內存管理可以說是自動的,但是這并沒有讓程序員脫離內存管理問題。比方說,對于內存的分配(還有釋放)總是存在一定的開銷,盡管這些開銷對程序員來說是暗含的。一個程序如果創(chuàng)建了很多對象,那么它就要比完成相同任務而創(chuàng)建了較少對象的程序執(zhí)行的速度慢(其他提供的內容都相同)。

  導致內存泄漏主要的原因是,先前申請了內存空間而忘記了釋放。如果程序中存在對無用對象的引用,那么這些對象就會駐留內存,消耗內存,因為無法讓垃圾回收器驗證這些對象是否不再需要。正如我們前面看到的,如果存在對象的引用,這個對象就被定義為"活著的",同時不會被釋放。要確定對象所占內存將被回收,程序員就要務必確認該對象不再會被使用。典型的做法就是把對象數據成員設為null或者從集合中移除該對象。注意,當局部變量不需要時,不需明顯的設為 null,因為一個方法執(zhí)行完畢時,這些引用會自動被清理。

  從更高一個層次看,這就是所有存在內存管的語言對內存泄漏所考慮的事情,剩余的對象引用將不再會被使用。

  典型泄漏

  既然我們知道了在java中確實會存在內存泄漏,那么就讓我們看一些典型的泄漏,并找出他們發(fā)生的原因。

  全局集合

  在大型應用程序中存在各種各樣的全局數據倉庫是很普遍的,比如一個JNDI-tree或者一個session table。在這些情況下,注意力就被放在了管理數據倉庫的大小上。當然是有一些適當的機制可以將倉庫中的無用數據移除。

  可以有很多不同的解決形式,其中最常用的是一種周期運行的清除作業(yè)。這個作業(yè)會驗證倉庫中的數據然后清除一切不需要的數據。
另一個辦法是使用引用計算。集合用來對了解每個集合入口關聯器(referrer)的數目負責。這要求關聯器通知集合什么時候完成進入。當關聯器的數目為零時,就可以移除集合中的相關元素。

  高速緩存

  高速緩存是一種用來快速查找已經執(zhí)行過的操作結果的數據結構。因此,如果一個操作執(zhí)行很慢的話,你可以先把普通輸入的數據放入高速緩存,然后過些時間再調用高速緩存中的數據。

  高速緩存多少還有一點動態(tài)實現的意思,當數據操作完畢,又被送入高速緩存。一個典型的算法如下所示:

  1.檢查結果是否在高速緩存中,存在則返回結果;

  2.如果結果不在,那么計算結果;

  3.將結果放入高速緩存,以備將來的操作調用。

  這個算法的問題(或者說潛在的內存泄漏)在最后一步。如果操作伴隨著一個不同的,輸入非常大的數字,那么存入高速緩存的也是一個非常大的結果。那么這個方法就不是能夠勝任的了。

  為了避免這種潛在的致命錯誤設計,程序就必須確定高速緩存在他所使用的內存中有一個上界。因此,更好的算法是:

  1.檢查結果是否在高速緩存中,存在則返回結果;

  2.如果結果不在,那么計算結果;

  3.如果高速緩存所占空間過大,移除緩存中舊的結果;

  4.將結果放入高速緩存,以備將來的操作調用。

  通過不斷的從緩存中移除舊的結果,我們可以假設,將來,最新輸入的數據可能被重用的幾率要遠遠大于舊的結果。這通常是一個不錯的設想。

  這個新的算法會確保高速緩存的容量在預先確定的范圍內。精確的范圍是很難計算的,因為緩存中的對象存在引用時將繼續(xù)有效。正確的劃分高速緩存的大小是一個復雜的任務,你必須權衡可使用內存大小和數據快速存取之間的矛盾。

  另一個解決這個問題的途徑是使用java.lang.ref.SoftReference類堅持將對象放入高速緩存。這個方法可以保證當虛擬機用完內存或者需要更多堆的時候,可以釋放這些對象的引用。

  類裝載器

  Java類裝載器創(chuàng)建就存在很多導致內存泄漏的漏洞。由于類裝載器的復雜結構,使得很難得到內存泄漏的透視圖。這些困難不僅僅是由于類裝載器只與"普通的"對象引用有關,同時也和對象內部的引用有關,比如數據變量,方法和各種類。這意味著只要存在對數據變量,方法,各種類和對象的類裝載器,那么類裝載器將駐留在JVM中。既然類裝載器可以同很多的類關聯,同時也可以和靜態(tài)數據變量關聯,那么相當多的內存就可能發(fā)生泄漏。

  定位內存泄漏

  常常地,程序內存泄漏的最初跡象發(fā)生在出錯之后,得到一個OutOfMemoryError在你的程序中。這種典型地情況發(fā)生在產品環(huán)境中,而在那里,你希望內存泄漏盡可能的少,調試的可能性也達到最小。也許你的測試環(huán)境和產品的系統環(huán)境不盡相同,導致泄露的只會在產品中揭示。這種情況下,你需要一個低內務操作工具來監(jiān)聽和尋找內存泄漏。同時,你還需要把這個工具同你的系統聯系起來,而不需要重新啟動他或者機械化你的代碼。也許更重要的是,當你做分析的時候,你需要能夠同工具分離而使得系統不會受到干擾。

  一個OutOfMemoryError常常是內存泄漏的一個標志,有可能應用程序的確用了太多的內存;這個時候,你既不能增加JVM的堆的數量,也不能改變你的程序而使得他減少內存使用。但是,在大多數情況下,一個 OutOfMemoryError是內存泄漏的標志。一個解決辦法就是繼續(xù)監(jiān)聽GC的活動,看看隨時間的流逝,內存使用量是否會增加,如果有,程序中一定存在內存泄漏。

  詳細輸出

  有很多辦法來監(jiān)聽垃圾回收器的活動。也許運用最廣泛的就是以:-Xverbose:gc選項運行JVM,然后觀察輸出結果一段時間。

[memory] 10.109-10.235: GC 65536K->16788K (65536K), 126.000 ms

  箭頭后的值(在這個例子中 16788K)是垃圾回收后堆的使用量。

  控制臺

  觀察這些無盡的GC詳細統計輸出是一件非常單調乏味的事情。好在有一些工具來代替我們做這些事情。The JRockit Management Console可以用圖形的方式輸出堆的使用量。通過觀察圖像,我們可以很方便的觀察堆的使用量是否伴隨時間增長。




400) {this.resized=true; this.width=400; this.alt='Click here to open new window';}" border=0>

Figure 1. The JRockit Management Console


  管理控制臺甚至可以配置成在堆使用量出現問題(或者其他的事件發(fā)生)時向你發(fā)送郵件。這個顯然使得監(jiān)控內存泄漏更加容易。
  內存泄漏探測工具

  有很多專門的內存泄漏探測工具。其中The JRockit Memory Leak Detector可以供來觀察內存泄漏也可以針對性地找到泄漏的原因。這個強大的工具被緊密地集成在JRockit JVM中,可以提供最低可能的內存事務也可以輕松的訪問虛擬機的堆。

  專門工具的優(yōu)勢

  一旦你知道程序中存在內存泄漏,你需要更專業(yè)的工具來查明為什么這里會有泄漏。而JVM是不可能告訴你的?,F在有很多工具可以利用了。這些工具本質上主要通過兩種方法來得到JVM的存儲系統信息的:JVMTI和字節(jié)碼使用儀器。Java虛擬機工具接口(JVMTI)和他的原有形式JVMPI(壓型接口)都是標準接口,作為外部工具同JVM進行通信,搜集JVM的信息。字節(jié)碼使用儀器則是引用通過探針獲得工具所需的字節(jié)信息的預處理技術。

  通過這些技術來偵測內存泄漏存在兩個缺點,而這使得他們在產品級環(huán)境中的運用不夠理想。首先,根據兩者對內存的使用量和內存事務性能的降級是不可以忽略的。從JVM 獲得的堆的使用量信息需要在工具中導出,收集和處理。這意味著要分配內存。按照JVM的性能導出信息是需要開銷的,垃圾回收器在搜集信息的時候是運行的非常緩慢的。另一個缺點就是,這些工具所需要的信息是關系到JVM的。讓工具在JVM開始運行的時候和它關聯,而在分析的時候,分離工具而保持JVM運行,這顯然是不可能的。

  既然JRockit Memory Leak Detector是被集成到JVM中的,那么以上兩種缺點就不再適用。首先,大部分的處理和分析都是在JVM中完成的,所以就不再需要傳送或重建任何數據。處理也可以在垃圾回收器的背上,他的意思是提高速度。再有,內存泄漏偵測器可以同一個運行的JVM關聯和分離,只要JVM在開始的時候伴隨著 -Xmanagement選項(這個允許監(jiān)聽和管理JVM通過遠程JMX接口)。當工具分離以后,工具不會遺留任何東西在JVM中;JVM就可以全速運行代碼就好像工具關聯之前一樣。

 趨勢分析

  讓我們更深一步來觀察這個工具,了解他如何捕捉到內存泄漏。在你了解到代碼中存在內存泄漏,第一步就是嘗試計算出什么數據在泄漏--哪個對象類導致泄露。The JRockit Memory Leak Detector通過在垃圾回收的時候,計算每個類所包含的現有的對象來達到目的。如果某一個類的對象成員數目隨著時間增長(增長率),那么這里很可能存在泄漏。




400) {this.resized=true; this.width=400; this.alt='Click here to open new window';}" border=0>

igure 2. The trend analysis view of the Memory Leak Detector

  因為一個泄漏很可能只是像水滴一樣小,所以趨勢分析必須運行足夠長的一段時間。在每個短暫的時間段里,局部類的增加會使得泄漏發(fā)生推遲。但是,內存事務是非常小的(最大的內存事務是由在每個垃圾回收時從JRockit向內存泄漏探測器發(fā)送的一個數據包組成的)。內存事務不應該成為任何系統的問題--甚至一個在產品階段全速運行的程序。

  一開始,數字會有很大的跳轉,隨時間的推進,這些數字會變得穩(wěn)定,而后顯示哪些類會不斷的增大。

  尋找根本原因

  知道那些對象的類會導致泄露,有時候足夠制止泄露問題。這個類也許只是被用在非常有限的部分,通過快速的視察就可以找到問題所在。不幸的是,這些信息是不夠的。比方說,經常導致內存泄漏的對象類java.lang.String,然而String類被應用于整個程序,這就變得有些無助。

  我們想知道的是其他的對象是否會導致內存泄漏,好比上面提到的String類,為什么這些導致泄漏的對象還是存在周圍?那些引用是指向這些對象的?這里一列的對象存有對String類的引用,就會變得太大而沒有實際意義。為了限制數據的數量,我們可以通過類把他們編成一個組,這樣我們就可以看到,那些其他類的對象會依然泄漏對象(String類)。比如,將一個String類放入Hashtable,那里我們可以看到關聯到String類的 Hashtable入口。從Hashtable入口向后運行,我們終于找到那些關聯到String類的Hashtable對象(參看圖三如下)。




Click here to open new window400) {this.resized=true; this.width=400; this.alt='Click here to open new window';}" border=0 resized="true">

Figure 3. Sample view of the type graph as seen in the tool
  向后工作

  自從開始我們就一直著眼于對象類,而不是單獨的對象,我們不知道那個Hashtable存在泄漏。如果我們可以找出所有的Hashtable在系統中有多大,我們可以假設最大的那個Hashtable存在泄漏(因為它可以聚集足夠的泄漏而變得很大)。因此,所有Hashtable,同時有和所有他們所涉及的數據,可以幫助我們查明導致泄露的精確的Hashtable。




400) {this.resized=true; this.width=400; this.alt='Click here to open new window';}" border=0>

Figure 4. Screenshot of the list of Hashtable objects and the size of the data they are holding live

  計算一個對象所涉及的數據的開銷是非常大的(這要求引用圖表伴隨著那個對象作為根運行)而且如果對每一個對象都這樣處理,就需要很多時間。知道一些關于 Hashtable內部的實現機制可以帶來捷徑。在內部,一個Hashtable有一個Hashtable的數組入口。數組的增長伴隨著 Hashtable中對象的增長。因此,要找到最大的Hashtable,我們可以把搜索限制在尋找包含Hashtable引用入口的最大的數組。這樣就更快捷了。




400) {this.resized=true; this.width=400; this.alt='Click here to open new window';}" border=0>

Figure 5. Screenshot of the listing of the largest Hashtable entry arrays, as well as their sizes.

  向下深入

  當我們發(fā)現了存在泄漏的Hashtable的實例,就可以順藤摸瓜找到其他的引用這些Hashtable的實例,然后用上面的方法來找到是那個Hashtable存在問題。




Click here to open new window400) {this.resized=true; this.width=400; this.alt='Click here to open new window';}" border=0 resized="true">

Figure 6. This is what an instance graph can look like in the tool.

  舉個例子,一個Hashtable可以有一個來自MyServer的對象的引用,而MyServer包含一個activeSessions數據成員。這些信息就足夠深入代碼找出問題所在。




400) {this.resized=true; this.width=400; this.alt='Click here to open new window';}" border=0>

Figure 7. Inspecting an object and its references to other objects

  找出分配點

  當發(fā)現了內存泄漏問題,找到那些泄漏的對象在何處是非常有用的。也許沒有足夠的信息知道他們同其他相關對象之間的聯系,但是關于他們在那里被創(chuàng)建的信息還是很有幫助的。當然,你不會愿意創(chuàng)建一個工具來打印出所有分配的堆棧路徑。你也不會愿意在模擬環(huán)境中運行程序只是為了捕捉到一個內存泄漏。

  有了JRockit Memory Leak Detector,程序代碼可以動態(tài)的在內存分配出創(chuàng)建堆棧路徑。這些堆棧路徑可以在工具中累積,分析。如果你不啟用這個工具,這個特征就不會有任何消耗,這就意味著時刻準備著開始。當需要分配路徑時,JRockit的編譯器可以讓代碼不工作,而監(jiān)視內存分配,但只對需要的特定類有效。更好的是,當做完數據分析后,生成的機械代碼會完全被移除,不會引起任何執(zhí)行上的效率衰退。




400) {this.resized=true; this.width=400; this.alt='Click here to open new window';}" border=0>

Figure 8. The allocation stack traces for String during execution of a sample program

  總結

  內存泄漏查找起來非常困難,文章中的一些避免泄漏的好的實踐,包括了要時刻記住把什么放進了數據結構中,更接近的監(jiān)視內存中意外的增長。

  我們同時也看到了JRockit Memory Leak Detector是如何捕捉產品級系統中的內存泄漏的。該工具通過三步的方法發(fā)現泄漏。一,通過趨勢分析發(fā)現那些對象類存在泄漏;二,找出同泄漏對象相關的其他類;三,向下發(fā)掘,觀察獨立的對象之間是如何相互聯系的。同時,該工具也可以動態(tài)的,找出所有內存分配的堆棧路徑。利用這三個特性,將該工具緊緊地集成在JVM中,那么就可以安全的,有效的捕捉和修復內存泄漏了。

分享標題:輕松搞定Java內存泄漏(轉)
標題URL:http://bm7419.com/article26/jjedcg.html

成都網站建設公司_創(chuàng)新互聯,為您提供網站導航、全網營銷推廣網站營銷、品牌網站建設、網站排名、定制開發(fā)

廣告

聲明:本網站發(fā)布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創(chuàng)新互聯

小程序開發(fā)