一個(gè)小需求,自動(dòng)重啟k8s集群中日志不刷新的POD

2022-10-07    分類: 網(wǎng)站建設(shè)

一個(gè)小需求,自動(dòng)重啟k8s集群中日志不刷新的POD

k8s

需求

日常工作中,所有項(xiàng)目都不是好的,筆者就經(jīng)常遇到這種情況,pod狀態(tài)是running,但是程序卻沒有響應(yīng)。發(fā)生這種情況的原因有很多種,有可能是因?yàn)閗8s健康檢查的原因,比如使用ps檢查進(jìn)程;或者是程序內(nèi)部死循環(huán),但是不退出;再或者網(wǎng)絡(luò)閃斷,程序無法重連等等。

無論什么原因,都會(huì)有解決辦法,但是優(yōu)化需要時(shí)間,在未完全解決之前,問題不能不解決,于是想到了一個(gè)臨時(shí)方案,因?yàn)楣P者公司項(xiàng)目日志是直接打印在stdout的,發(fā)生了程序無響應(yīng)的情況,比較簡單的一個(gè)辦法是判斷日志輸出的時(shí)間。基于此,可以簡單寫一個(gè)小腳本,發(fā)現(xiàn)日志長時(shí)間不輸出的時(shí)候,重啟pod。

思路

使用kubectl logs命令查看最后一條日志輸出的時(shí)間戳,與服務(wù)器時(shí)間對比,差值大于閾值,則重啟相應(yīng)POD。當(dāng)然,這只是一個(gè)簡單的思路,并不適用于大部分場景,但是適合筆者公司,因?yàn)楹诵捻?xiàng)目請求量很大,但凡是超過1分鐘日志不刷新,基本可以斷定100%出現(xiàn)問題了。

此思路其實(shí)也是拋磚引玉,希望能給大家一些靈感,如果有什么更好的辦法,也可以與筆者溝通交流。

簡單實(shí)現(xiàn)

shell比較簡單,直接與服務(wù)器交互也比較友好,就是用shell來寫吧。

#!/bin/sh
# 獲取當(dāng)前UTC時(shí)間utc_now=`date -u`
# 將時(shí)間轉(zhuǎn)換為timestamptimestamp_now=`date -d "$utc_now" +%s`
function restart_pod() {
    for i in `kubectl get pod -n iot|grep PODNAME|awk '{print $1}'`;do
        for time in `kubectl logs  --tail=1 --timestamps $i -n iot | awk '{print $1}'`;do
            timestamp_pod=`date -d "$time" +%s`
            delay=$(($timestamp_now-$timestamp_pod))            echo $i:$delay            if [ "$delay" -ge "30" ];then
                echo "Pod $i 30S內(nèi)沒有最新日志產(chǎn)生,重啟pod!"
                echo $i                kubectl delete pod $i -n iot --force --grace-period=0
                curlwxFunc "Pod $i 30S內(nèi)沒有最新日志產(chǎn)生,重啟pod!(生產(chǎn)環(huán)境)"
            fi        done    done}function curlwxFunc() {
    JSON='{
            "msgtype": "text",
            "text": {
                "content": "'$1'"
            }
        }'
    curl 'https://qyapi.weixin.qq.com/cgi-bin/webhook/send?key=xxx'
    -H 'Content-Type:application/json'
    -d "${JSON}"
}restart_pod 

腳本很簡單,先查詢pod,然后看pod最后一條日志時(shí)間,與服務(wù)器時(shí)間對比,延遲超過30s就重啟pod,并且調(diào)用企業(yè)微信接口發(fā)一條通知。

后記

此方法也是治標(biāo)不治本,治標(biāo)還需要從源頭解決,不過需要時(shí)間,再?zèng)]有解決之前,先用這個(gè)小腳本抗一抗吧。也歡迎大家拍磚。

本文名稱:一個(gè)小需求,自動(dòng)重啟k8s集群中日志不刷新的POD
分享URL:http://www.bm7419.com/news32/203282.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供小程序開發(fā)、網(wǎng)站設(shè)計(jì)、網(wǎng)站內(nèi)鏈、軟件開發(fā)全網(wǎng)營銷推廣、網(wǎng)站營銷

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)

手機(jī)網(wǎng)站建設(shè)