1:如果同一臺服務器上安裝有多個MongoDB實例,telegraf.conf 中關于 MongoDB 如何配置?配置數據在【INPUT PLUGINS的[[inputs.mongodb]]】部分。
單個實例配置
servers = ["mongodb://UID:PWD@XXX.XXX.XXX.124:27218"]
錯誤的多實例配置(例如兩個實例);
servers = ["mongodb://UID:PWD@XXX.XXX.XXX.124:27218"] servers = ["mongodb://UID:PWD@XXX0.XXX.XXX.124:27213"]
重啟服務,查看服務狀態(tài),提示錯誤信息如下;
Failed to start The plugin-driven server agent for reporting metrics into InfluxDB.
正確的配置應該為;
servers = ["mongodb://UID:PWD@XXX.XXX.XXX.124:27213","mongodb://UID:PWD@XXX.XXX.XXX.124:27218"]
2.配置Grafana 告警規(guī)則后,發(fā)現只是告警一次,后面恢復后再報警一次。即異常持續(xù)期間沒有一直告警。
解決辦法,這個設置其實在【Alterting】–》【Notification channels】–>【Send reminders】
例如以下的設置可以理解為,每5分鐘觸發(fā)一下告警信息。
3.告警檢查顯示沒有數據。
這個時候有兩種原因
(1)收集監(jiān)控項的代理程序有問題 ;
(2)或者是代理程序沒問題,是匯報數據不及時的問題。
針對第二問題,我們可以調整代理程序執(zhí)行頻率;如果實時性要求不是很高,還可以調整告警規(guī)則檢查數據的時間范圍。
例如,我們可以從檢查 過去5分鐘到過去1分鐘內的數據,調整為過去10分鐘到過去5分鐘內的數據。對應的設置如下:
調整前;
調整后
4.隨著需要監(jiān)控的子項的增多,收集時間必然增多,需要調整運行周期。
否則,報錯信息如下;
telegraf[2908]: 2019-03-01T02:40:46Z E! Error in plugin [inputs.mysql]: took longer to collect than collection interval (10s)
解決方案:調整 telegraf.conf 文件中 [agent] 部分的interval參數。