2008-04-10

SRSMT - SNMP RRDTool Server Monitor Tool 系統狀態監控 v0.1.0

參照:SRWSMT - Windows 平台的系統狀態監控

此次將原本的SRWSMT做了幾個修正,目前版本為v0.1.0
下載位置
1. http://www.badongo.com/file/8917409
or
2. http://www.swm.idv.tw-a.googlepages.com/SRSMT_v010.zip

MD5SUM 431aa2d33641ec02388161fa7a8d19df SRSMT_v010.zip

新版本 v0.11已發布,請參閱http://www.swm.idv.tw/

將之前僅適用於監測紀錄Windows平台的部份新增針對Linux (Net-SNMP)的判斷/取值/紀錄,
所以把原本SRWSMT中代表Windows的W給拿掉了,成為一個通用性的工具.
此次也修正了部分記錄資料格式,所以原本v0.0.6的記錄檔將無法沿用而需刪除重建(sorry!!),請直接下載此版本,舊版的連結移除.

製圖設定是當每天的00:00~00:05 之間執行時會一併產出所有的日/週/月/年的圖檔,而其他時間執行預設僅產出日圖檔, 新增了 -allgraph 參數,來手動強制產生日/週/月/年圖檔.
另外針對產出index歷史頁面的部份也已補上.

而SRSMT的考量以簡單/易用為最高原則
所以基本上暫時不會考慮增加太多功能.
若要更加全面性的監控紀錄則可自行研究 OpenNMS & Cacti.

相關頁面/圖檔判讀說明如下:

1.主索引頁,位於 GRAPHIC\index.html

2.Windows 頁面


3.Linux 頁面


4.歷史資料頁面


基本上設好了以後跑個幾天就可以有個正常狀態的各項數值曲線經驗值了,在來就是定時去看一下主索引頁的圖形即可,若有突然飆高的異常值就要注意了,很多時候木馬/後門/或程式錯誤都會導致CPU用量異常飆高,或是網路流量突然增加;若單純靠人力排時間手動一台一台登入去檢查每台的工作管理員就太蠢了,而且沒那麼多美國時間整天盯著機器等他異常,如果機器少也就算了,要是多到數十台幾百台,光巡完一遍也得大半天了.其他的事也就不用幹了.所以就個人經驗來說這種圖型化紀錄系統狀態的工具可以節省系統工程師不少時間.從另一個角度來說這玩意就有點像飛機上的黑盒子,屬於被動的紀錄與提供事後的追查參考.

沒有留言: