工作總結
發表時間:2026-04-192026年周匯報工作總結。
這周主要干了三件事:處理一個故障、維護一臺老存儲、卡了一個驗收。每件事都不大,但都讓我重新認識了自己的一些“想當然”。
先說那個故障。 周二下午三點剛過,監控彈告警:核心業務A的響應超時率沖到15%。按習慣先看網絡和負載均衡,都正常。再看數據庫服務器,CPU 20%、內存充裕——這反而讓我嘀咕了,要是資源滿了還好辦,啥也不缺還慢,問題往往藏得深。
翻應用日志,沒有堆棧報錯,但注意到每隔幾秒跳一次“連接池獲取連接等待超時”。以前見過這玩意兒,通常是連接池太小或連接沒釋放。先重啟了應用服務,超時率下來一會兒又上去了。不是假死,是有什么東西在持續占著連接不撒手。
這時候我猶豫了一下:要不要直接切主備?切的話要等30秒,業務會抖一下。還是先看看數據庫在干什么吧。打開慢查詢日志,好家伙——一張訂單表的全表掃描,十分鐘里跑了二百多次。順著SQL追過去,是昨天剛上線的一個新功能,開發同事寫了一條不帶索引的統計查詢。上線評審時我提過要加索引,對方說“先上線再優化,數據量不大”,我沒堅持。
當時真想抽自己一下。明知道有問題,因為趕進度就放過去了。今天訂單量一上來,直接拖死連接池。
解決辦法倒簡單:給那張表加了個復合索引,SQL從4.8秒降到0.03秒。從告警到恢復一共47分鐘,其中排查花了35分鐘。事后我跟開發同事復盤,定了個死規矩:以后上線前必須提供執行計劃分析報告,沒有索引優化的SQL一律打回。這規矩不新鮮,但之前一直掛在嘴上沒落地。這周我直接在工單系統里加了個必填項——上傳執行計劃截圖,否則流程走不下去。
再說那臺老存儲。 一臺用了六年的設備,廠商早不維護了。這周要換兩塊快到壽命的硬盤,再做一次全量數據校驗。
這種活最怕熱插拔觸發RAID重建失敗。我的習慣是先把所有配置用show running-config導出來,逐項核對——光是vlan劃分和LUN映射就有400多行,我對著上個月的備份比對了整整兩遍。同事說這太慢,設備自己有自動備份。我沒吭聲,繼續干。去年有一回就是自動備份的配置文件編碼亂了,恢復時折騰了一宿,從凌晨兩點搞到天亮。那次之后我就記住了:凡是動底層硬件,必須自己手抄一份。
換硬盤過程順利,熱備盤頂上去重建正常。但數據校驗跑了兩輪都報錯,提示12個數據塊校驗和不匹配。查日志發現三天前有一次瞬時掉電,雖然業務沒中斷,但緩存里的數據寫錯了位置。
這簡直讓人火大——一次不到0.1秒的電壓波動,要花半天去擦屁股。解決方法是從二級備份里把那12個數據塊對應的文件全部拉出來覆蓋。文件分散在上百個目錄里,我寫了個腳本挨個比對修改時間和校驗值,從下午兩點干到六點。干完腰都直不起來。但沒辦法,生產環境就是這樣,你不能指望設備永遠不出幺蛾子,只能把退路想好。
最后說驗收的事。 周五下午參與一個新系統上線驗收。我負責檢查監控和日志。結果發現他們的日志全寫在一個文件里,最老的一條還是三個月前的。這意味著以后查問題得先下載幾十個GB的日志文件,效率極低。而且沒配置自動清理,照這個速度兩個月后磁盤就寫滿。
我把這兩條寫成“重大缺陷”,拒絕簽字。項目經理說可以后期優化。我說不行。為什么這么硬?因為前年有個項目,我放過了同樣的問題,結果三個月后磁盤寫滿,業務中斷了兩個小時,我被通報批評,連著加了三個夜班才把日志切出來。那次之后我就記住了:日志不切割、不清理,就是埋雷。
我翻開驗收清單,指著第4.2.3條說:“按規范,日志必須按天切割、按策略歸檔。整改完我再簽。”對方沒再爭。
這周下來,有三點挺深的體會。
第一,經驗有時候真是包袱。一開始查故障,我凈往復雜了想——是不是網絡攻擊?數據庫死鎖?結果問題出在最基礎的索引上。后來我給自己寫了個故障排查清單,貼在顯示器邊上,前五條全是簡單項:慢查詢、磁盤空間、連接池配置、死鎖、緩存命中率。出了告警先按順序跑一遍,別上來就懷疑架構。
第二,流程不是為了卡人,是為了不讓自己背鍋。那個SQL上線,如果當時堅持必須加索引再上,根本不會有后面的47分鐘。我準備把“SQL執行計劃審核”做成強制節點,沒有審核通過不允許合入主干。雖然每次多花十分鐘,但比故障后折騰四十分鐘劃算得多。
第三,動手之前,把怎么恢復想清楚。換硬盤前做雙備份,改配置前保存當前狀態,這些看起來慢,其實是給自己留后路。做運維越久越覺得,真正的本事不是你能多快解決問題,而是你在動手之前已經想好了如果失敗該怎么辦。
下周要盯三件事:
1. 日志切割整改周四前完成二次驗收,過不了就繼續打回。
2. 把連接池監控閾值從80%降到60%,提前預警。
3. 整理一份《常見SQL風險場景自查表》發給開發團隊,就寫一頁紙,別太長,讓人愿意看。
工作就是這樣,每天對著具體的設備、具體的報錯、具體的代碼。能把這個系統穩定跑下去,讓用戶不抱怨,讓半夜不被叫醒,就是最好的結果。
-
述職報告之家小編為您推薦工作總結專題,歡迎訪問:工作總結
